Tracking in high energy physics Alberto Pulvirenti
2 Obiettivi della ricerca moderna Investigare la struttura dell’universo microscopico Studiare collisioni ad energia sempre più alta …che producono sempre più particelle ad alta energia Strategia sperimentale: Tracking Detectors Il rivelatore non “stoppa” le particelle La particella viene “seguita” lungo il suo percorso
3 Tracking detectors Struttura a strati (“layer”) sensibili La particella attraversa gli strati… …e ogni strato “prende nota” del punto in cui è stato attraversato Output finale = insiemi di punti spaziali in ogni layer
4 Come visualizzare le traiettorie delle particelle? Metodi “visuali” Camere a bolle Camere a scintille Emulsioni fotografiche Metodi elettronici Rivelatori a gas Rivelatori a stato solido
5 Metodi “visuali” per la rivelazione di particelle Materiale trasparente che reagisce al passaggio di particelle Analisi visuale di una immagine ottenuta impressionando lastre fotografiche
6 Metodi “visuali” per la rivelazione di particelle … analisi laboriosa e faticosa, difficile da automatizzare al computer
7 Rivelazione di particelle con segnali elettronici Rivelatori a gas Contatori proporzionali Camere a deriva TPC Rivelatori a stato solido Pixel detectors Drift detectors Strip detectors
8 1. Survey Data (o “geometria”) Posizione spaziale di ogni volume (sensibile o non sensibile) del rivelatore 2. Calibration Constants Costanti per convertire i segnali elettrici del rivelatore in informazione utilizzabile per l’analisi fisica 3. Mappatura del campo magnetico Fondamentale per ricostruire l’impulso della particella in base alla curvatura della sua traiettoria 4. RAW DATA ( “clusters”) I veri e propri dati sperimentali, raccolti dal rivelatore in seguito alla collisione generata con i fasci di particelle Dal rivelatore all’algoritmo: dati di base
9 Come ricostruire la traiettoria di una particella? Fit dei punti generati da una particella, usando una opportuna equazione per la traiettoria …ma se le tracce sono tante e vicine? Prima di ricostruire i percorsi delle particelle, bisogna sapere QUALI punti appartengono a ciascuna particella: PATTERN RECOGNITION PROBLEM
10 Questo è 1/100 di quello che potrebbe succedere in ALICE. Contate le tracce (se ci riuscite)! Un caso realistico…
11 What’s “tracking”? INPUT: Punti spaziali OUTPUT: Particelle (impulso, PID) TRACKING Fase 1 (track recognition): selezione dei punti (probabilmente) prodotti da una stessa particella Fase 2 (track reconstruction): ricostruzione delle caratteristiche fisiche della particella (identificazione, impulso)
12 Cosa significa “pattern recognition”? Letteralmente: “riconoscimento di modelli” Punto di partenza: “immagine”: Insieme di segnali o informazioni che caratterizzano completamente un oggetto, nel contesto in cui esso viene analizzato. ◊ NON è ristretto alle immagini visive Due step essenziali: 1. Definizione di un set di Immagini-Modello 2. Classificazione di ogni altra Immagine dello stesso insieme statistico secondo il Modello cui somiglia di più (se esiste). > Definizione di “somiglianza” o “distanza” fra immagini
13 Qualche definizione più rigorosa… Problema di “classificazione”: Input: un vettore di misura (“pattern”) contenente tutte le informazioni necessarie per definire un oggetto ◊ {X k }, k = 1, …, N Output: classificazione del vettore (e quindi dell’oggetto associato) mediante una funzione di decisione: ◊ C = d({X k }) Pattern space ( P ): Spazio di tutti i possibili pattern {X k } Obiettivo: Suddividere P in regioni separate, corrispondenti alle varie classificazioni possibili… ◊ …+ una classe per “unidentified patterns”
14 Esempio 1: lettura Per farlo, dobbiamo prima conoscere le lettere Pattern: segni sulla carta “a”, “b”, “c”, etc… Classificazione: suono associato al segno Dalle forme delle lettere in stampatello, possiamo “intuire” come leggere uno scritto a mano, per analogia o somiglianza “ Nel mezzo del cammin di nostra vita Mi ritrovai per una selva oscura …” …ma non sempre tutto è così scontato: الاتحاد الأوروبي يدعو شارون لوقف العمليات العسكرية في المناطق الفلسطينية ومنح محمود عباس مزيدا من الوقت للسيطرة على المسلحين
15 Esempio 2: riconoscimento visivo Cosa è questo? …un gatto? COMPLIMENTI! Avete appena eseguito un Pattern Recognition!
16 Pattern space e Feature space Definizione concettuale: Funzione degli elementi del pattern che consente di ridurre il numero di parametri di cui tenere conto ◊ Riduzione dell’informazione agli elementi “essenziali” Definizione “rigorosa”: Base {e k } ortogonale nello spazio dei pattern che si possa scomporre in due blocchi {e 1,…, m < N }, {e m+1, …, N } tali che due pattern con le stesse componenti nei primi m (< N ) elementi sono abbastanza simili da poter essere considerati “identici” ai fini della classificazione da fare Esempio: N punti allineati retta di best-fit + 2 (3 o 5 parametri) ◊ Meno informazione ◊ Si mantengono solo le informazioni “importanti”.
17 Vantaggi delle features Meno elementi nel vettore da classificare Gerarchia di importanza dei parametri. “Residui” (gli N – m elementi “secondari”) Criterio di valutazione di classificabilità Esempio dei punti allineati: ◊ stabilire se possono essere accettati come “retta” o meno
18 Tracking e pattern recognition Pattern: sequenze di punti restituiti dal rivelatore Uno per ogni strato sensibile Problema n! – combinatorio (n = numero di strati del rivelatore) Feature: parametri della traiettoria della particella Classificazione: traccia finale Punto di produzione della particella (vertice) Modulo e orientamento spaziale dell’impulso iniziale
19Complicazioni L’impulso è un numero reale Il numero di classi è infinito I punti sperimentali sono tanti Impossibile lavorare su tutte le combinazioni possibili Selezione di “track candidates” check di validità
20 Parametrizzazione della traccia Fondamentale per la ricostruzione 5 parametri essenziali Posizione (3 coordinate) + Impulso (3 componenti) - 1 (perché può essere scelto qualsiasi punto) Qualsiasi set di 5 parametri è matematicamente equivalente ◊ Sconsigliabili i parametri che diventano troppo grandi Meglio usare 1/p piuttosto che p ◊ Attenzione ai parametri che, durante il fit, presentano discontinuità o correlazione con altri. La scelta corretta è sempre dipendente dalla situazione (apparato sperimentale, range di impulso da ricostruire, …)
21 “Disturbi” nella ricostruzione Scattering multiplo nel mezzo: formula di Moliére la traccia si scosta dalla forma “regolare” (potrebbe anche non essere trovabile) Energy loss: formula di Bethe-Bloch (in presenza di campo magnetico) la traccia spiraleggia nel piano trasverso
22 Metodi di track finding Metodi locali Viene aggiunto alla traccia un punto alla volta, in base a criteri di scelta che dipendono dalla forma prevista per la traccia e dai punti precedentemente acquisiti Metodi globali Viene selezionato direttamente un insieme di punti sui quali viene operato un check unico, cosicché la traccia viene restituita direttamente NB: è necessario in ogni caso un adattamento specifico all’apparato sperimentale da usare.
23 Local vs. Global Metodi locali: Scelta dei punti “step-by-step” con una informazione che rimane parziale fino al termine della procedura Il risultato può dipendere dall’ordine con cui i dati vengono analizzati Necessita di un innesco ben congegnato Non necessita di un modello globale di traccia (traiettoria) Consente una trattazione ottimale dei “disturbi” Metodi globali La decisione viene presa sfruttando l’intera informazione Può operare direttamente sui dati grezzi Ha bisogno di una precisa espressione della traiettoria Può tenere conto dei “disturbi” solo in media
24 Metodi locali Tre possibili criteri logici: “segui il tuo naso” track following method ◊ Si innesca la traccia partendo da un estremo, e si esegue una “proiezione” nel layer successivo, selezionando il punto meglio compatibile con essa
25 Metodi locali Tre possibili criteri logici: “segui il tuo naso” track following method ◊ Si innesca la traccia partendo da un estremo, e si esegue una “proiezione” nel layer successivo, selezionando il punto meglio compatibile con essa “congiungi gli estremi” track road method ◊ Si determinano due punti sui layer estremi e si congiungono cercando un percorso adeguato fra i punti del rivelatore
26 Metodi locali Tre possibili criteri logici: “segui il tuo naso” track following method ◊ Si innesca la traccia partendo da un estremo, e si esegue una “proiezione” nel layer successivo, selezionando il punto meglio compatibile con essa “congiungi gli estremi” track road method ◊ Si determinano due punti sui layer estremi e si congiungono cercando un percorso adeguato fra i punti del rivelatore “definisci una immagine” track element method ◊ Si individuano segmenti lungo il percorso della traccia, e poi vengono collegati fra loro in base alla compatibilità
27 Il “principe” dei metodi locali: Kalman Filter Base: track following Introdotto da P. Billoir (1983) In seguito si è compreso che tale metodo si riconduce ad un metodo generale sviluppato da Kalman per il fit di sistemi complessi Ingredienti: A n (5) ◊ vettore di stato contenente i 5 parametri essenziali di traccia V n (5x5) ◊ matrice di covarianza dei 5 parametri (5x5) M n = H A n (2) ◊ vettore di “misura” (che passa dai parametri alla misura osservabile punto) C n = H V n H T (2x2) ◊ matrice di covarianza delle misure
28 Algoritmo del Kalman Filter Start: “seeding” Stime ragionevoli per A n e V n a partire da alcuni punti. Propagazione stima del vettore di stato nel punto n – 1 : A * n-1 = P n A n viene propagata anche la matrice di covarianza, che viene artificiosamente aumentata di un termine di disturbo che tiene conto dello scattering multiplo: V * n-1 = P n ( V n + N n ) P n T
29 Algoritmo del Kalman Filter Selezione di un punto candidato all’inclusione, in un layer di rivelazione: M n-1 coordinate; C n-1 covarianza Calcolo dei residui R A n-1 = M n-1 – M(A * n-1 ) R C n-1 = C n-1 – C(A * n-1 ) Filtro: modifica del vettore di stato includendo nuova informazione Definizione: “gain matrix” K = V * n-1 H T (C n-1 + H V * n-1 H T ) -1 A n-1 = A * n-1 + K R A n-1 V n-1 = (1 – K H) V * n-1 2 (R A n-1 ) T (R C n-1 ) -1 R A n-1
30 Kalman Filter Track finding: Single step: ◊ Propagazione su più punti sul layer in studio ◊ Inclusione del punto che determina il minimo 2 Hypothesis tree: ◊ Generazione di “alberi” di punti, tenendo conto di tutte le possibilità ◊ Selezione del percorso cui corrisponde il minimo 2 totale (dalla somma di tutti I contributi) Track fitting: Avviene “in itinere” durante il finding 3D fit contemporaneo “locale”
31 Vantaggi e svantaggi del Kalman Filter OK Esegue contemporaneamente track finding e fitting Opera sui parametri di traccia (retta: 4, elica: 5) ◊ Niente matrici della dimensione del numero di punti del campione Molto utile per collegare punti su rivelatori diversi E’ molto semplice introdurre gli effetti dei “disturbi”: ◊ Multiple scattering: incremento sulla matrice di covarianza ◊ Energy loss: variazione “locale” della curvatura, step per step KO Richiede una procedura ottimale di ricerca dei punti E’ fortemente dipendente dalle condizioni iniziali
32 Metodi globali Combinatorio totale Analisi di tutte le possibilità Template matching Confronto con modelli Histogramming Ricerca di configurazioni ripetitive Metodi neurali o neural-like Associazioni locali
33 Template matching Applicazione “nativa” del pattern recognition Definizione di “template”: ◊ Definire parametri iniziali di traccia ◊ Stabilire che punti produrranno Confronto con lo schema di punti ottenuto sperimentalmente: ◊ Individuazione dei template presenti nel campione ◊ Nessun processing aggiuntivo: i parametri finali della traccia sono quelli del matched template Applicabilità molto limitata ◊ Solo in caso di poche combinazioni possibili
34 Template matching recursive tree search Procedura iterativa con diverse gerarchie di template, via via più precise, in modo da operare l’incremento del dettaglio solo nei sottoinsiemi di pattern che si adattano, via via, al template precedente che è stato riscontrato nei dati
35 Complete combinatorial method L’algoritmo concettualmente più semplice: Costruire tutte le possibili sequenze di punti (1 per layer) Valutare la compatibilità con il modello di traccia previsto ◊ Fit e calcolo del 2 parametro di qualità Ordinare le combinazioni secondo il parametro di qualità Stabilire un criterio di accettazione: ◊ Quantitativo: i primi N elementi (se si ha una idea della molteplicità da attendere in un evento) ◊ Qualitativo: tutti gli elementi per cui 2 < 2 max Applicabilità fortemente dipendente dal numero di punti per layer e dal numero di layer stessi Crescita fattoriale della complessità Inapplicabile nella quasi totalità dei casi
36 Histogramming: Radon Transform Distribuzione dei punti nel rivelatore: Risposta media del rivelatore per una particella con una data configurazione di parametri {p} Popolazione tipica dello spazio delle features (param. di traccia), per la feature corrispondente a una particella [delta function] Problema di inversione: Conoscenza dettagliata della risposta dei rivelatori Presenza di una precisa forma teorica della traccia
37 Hough Transform histogramming Estensione del caso della trasformata di Radon. Dipendenza dalla sola forma teorica della traccia Base: espressione teorica della traiettoria Caso 1: (B = 0) retta 4 parametri Caso 2: (B = costante) elica 5 parametri Ipotesi dell’algoritmo: Se N punti appartengono alla stessa traccia, estraendo i parametri di traccia da qualsiasi loro sottoinsieme otterrò valori simili a quelli che otterrei dall’intero insieme. Se i punti non appartengono ad una specifica traccia, estrarrò parametri casuali, che si distribuiranno a caso nello spazio delle features
38 Hough Transform: procedimento Esempio: rette nel piano da un punto fisso Equazione: y = mx [m = tan( )] 1. Estrazione di da tutte le coppie di punti istogramma 2. Ricerca di picchi nell’istogramma > corrispondenti a tante coppie “concordi” stessa traccia
39 Pro e contro della Hough Transform PRO Semplice e veloce Non richiede un cluster finding Può lavorare direttamente con i dati grezzi CONTRO Dimensionalità dello spazio delle features Nel caso più semplice (retta) serve un istogramma a 4D Necessità di una equazione “teorica” della traccia Necessità di una quantità di layer del rivelatore abbastanza grande da evidenziare gli addensamenti
40 Digressione: cos’è una rete neurale NEURONI SINAPSI Sistema distribuito di “processing units” collegate fra loro in modo da scambiarsi informazioni. Due costituenti di base: Il nodo di calcolo: neurone ◊ ◊ raccoglie segnali in input da altri elementi della rete ◊ ◊ restituisce un output (“attivazione”) in risposta al segnale ricevuto Veicolo di scambio di informazioni: sinapsi pesata ◊ ◊ implementa le correlazioni (o competizioni) fra neuroni ◊ ◊ agisce come un fattore moltiplicativo sul segnale ricevuto da ogni unità (“peso sinaptico”)
41 La variazione nell’attivazione diminuisce di ciclo in ciclo Stabilizzazione finale correlazione incremento attivazione competizione decremento attivazione RN a connessione completa Come opera la rete neurale
42 Mappa di attivazioni reali comprese fra 0 e 1 Confronto con una soglia fissa di attivazione S Mappa binaria di attivazioni (“on” / “off”) Come opera la rete neurale
43 Punti nel rivelatore Neuroni = segmenti fra coppie di punti Competizione peso inibitorio costante Concatenamento peso eccitatorio dipendente dall’allineamento CATTIVO allineamento: w E 0 BUON allineamento: w E A Implementazione del Tracking Neurale Nessuna relazione fra segmenti non contigui
44 Tracking neurale: work flow Lettura punti sui layer Creazione segmenti “accettabili” (cut) La rete neurale “spegne” i segmenti sbagliati, lasciando “accesi” quelli giusti, che producono le catene di segmenti che poi verranno passate al fit della traccia.
45 Elastic Arms Combinazione di metodo neurale e “template matching” Definizione di N templates (Hough Transform) Calcolo di una funzione “energia”: ◊ E = S ia M ia S = condizione di appartenenza del punto “i” alla traccia “a” M = distanza del punto “i” dalla traccia “a” Tale funzione deve essere minimizzata in due step: 1. Correzione dei parametri dei template a partire dai punti ◊ Refit 2. “Riassegnazione” dei punti secondo il template più vicino ◊ (rete neurale dei fattori S ia pesati in base ai valori M ia ) ◊ Convergenza ciascun punto viene assegnato al template migliore.
46 Come si valuta la bontà di un algoritmo? Simulazione Insieme di punti “assegnati” a ogni traccia Confronto fra le associazioni vere e quelle dedotte dal tracking Classificazione delle tracce trovate: Perfect Track ◊ Solo cluster con lo stesso ID traccia Tutti quelli presenti nell’evento Complete Perfect Track Alcuni punti mancanti Incomplete Perfect Track Imperfect Track ◊ Cluster con ID di tracce diversi (si assegna quello di maggioranza) “Sufficiente” maggioranza di un ID Majority Good Track (accettabile) “Insufficiente” maggioranza di un ID Majority Fake Track (non accettabile)
47 Come si valuta la bontà di un algoritmo? Track ID Perfect Track Class 1: PerfectComplete Class 2: PerfectIncomplete Class 5: Not Found Imperfect Track Class 3: Majority Good Class 4: Majority Fake Classificazione degli indici di traccia simulata
48Efficienza Tracce Trovate vs. Tracce Simulate “Event by event” # tracce trovate correttamente / # tracce generate Criterio di massima resa su un campione # eventi ricostruiti al 100% / # eventi generati Criterio di resa sufficiente su un campione # eventi ricostruiti al 90% (o meno) / # eventi generati
49Efficienza Non tutte le tracce generate sono “trovabili”: Limiti dell’algoritmo Eccessivo effetto distorcente di EL e MS Quantità insufficiente di segnale nei rivelatori Efficienza “del metodo” Calcolata sul campione delle sole tracce “trovabili” Efficienza “globale” Calcolata sul campione delle tracce generate E’ importante che l’algoritmo non sia “troppo” limitato!
50 good fake Esempio: efficienza di un algoritmo di tracking
51 Track fitting Una volta assegnati i punti ad una particella… …bisogna ricostruire I parametri fisici Best-Fit dei punti con l’equazione della traiettoria M. Locali (Kalman) fit progressivo M. Globali fit “globale” Caso facile: retta Caso difficile: elica Necessario un fit del cerchio nel piano trasverso
52 Track fitting: Kalman Filter Utilizzabile anche come semplice fitter I punti non devono essere “cercati” Il filtro è “forzato” a eseguire correzioni adeguate a includere, uno alla volta, i punti della traccia Vantaggio: il fit viene eseguito “all in one” in 3D Svantaggio: è necessario un innesco (“seed”) Fit preliminare con altri metodi Ipotesi preliminare su 2 punti (retta) o 3 punti (elica)
53 Metodi per il fit del cerchio nel piano Metodo dei minimi quadrati non risolubile esattamente (equazioni di minizzazione complesse) Operazioni di linearizzazione Mapping conforme Sfera di Riemann
54 Mapping conforme Ipotesi: il punto (x V, y V ) appartiene alla circonferenza Utile per il fit di tracce primarie Inversione dell’ordine dei layer!
55 Mapping conforme L’equazione cartesiana del cerchio… …si trasforma in una retta (non passante per l’origine) fit banale Occhio alla propagazione degli errori!!!
56 Sfera di Riemann Una sfera di raggio unitario “poggiata” sul piano XY Dato un punto sul piano XY, si congiunge con il polo della sfera opposto al “punto di appoggio”, e si individua il punto in cui la congiungente interseca la sfera. Intersezione sulla sfera di Riemann Coord. nel piano Proprietà di base: le proiezioni dei punti di un cerchio nel piano XY stanno su un piano
57 Sfera di Riemann Fit di un piano nello spazio Da minimizzare = autovettore di A con l’autovalore più piccolo Raggio Centro
58 Fit della traccia nello spazio Quando si esegue un fit nel piano, bisogna linearizzare l’equazione dell’elica nello spazio, per completare la procedura di fit. Curvatura Parametro di impatto trasverso
59Risoluzione Importante: conoscere l’indeterminazione sulle proprietà della particella ricostruita (p, PID, vertice) Ancora una volta, confronto con la simulazione Confronto fra i parametri “veri” della traccia trovata e quelli ricostruiti con il fit Differenza assoluta ( P vero – P ricostruito ) Differenza percentuale ( P vero – P ricostruito ) / P vero Criterio di “accettabilità” di punti sbagliati: Entro che limiti un punto sbagliato “rovina” la risoluzione dei parametri? E’ accettabile una quantità di punti sbagliati che non modifica sensibilmente la risoluzione ◊ …quando ciò non significa che la procedura di ricostruzione vada rivista perchè troppo indeterminata
60 Esempio: risoluzione parametri Dip angle ( ) resolution (in mrad) sigma = 3.69 0.01 Azimuthal angle ( ) resolution (in mrad) sigma = 4.71 0.01 p t resolution (in % of true value) sigma = 13.4 0.3 %
61 Stand-alone tracking: results (III) Transverse impact parameter resolution (in microns) sigma = 79.7 0.1 Longitudinal impact parameter resolution (in microns) sigma = 0.4
62Summary Strategia di analisi di eventi di collisione ad alta energia: Tracking detectors Algoritmi di Tracking Track finding: Problema di Pattern Recognition ◊ Metodologie locali e globali di riconoscimento di tracce Valutazione: efficienza di tracking Track reconstruction: Fit non lineare in presenza di campi magnetici ◊ Splitting della procedura in più step Valutazione: risoluzione dei parametri di traccia