La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Tracking in high energy physics Alberto Pulvirenti

Presentazioni simili


Presentazione sul tema: "Tracking in high energy physics Alberto Pulvirenti"— Transcript della presentazione:

1

2 Tracking in high energy physics Alberto Pulvirenti

3 2 Obiettivi della ricerca moderna  Investigare la struttura dell’universo microscopico  Studiare collisioni ad energia sempre più alta  …che producono sempre più particelle ad alta energia  Strategia sperimentale: Tracking Detectors  Il rivelatore non “stoppa” le particelle  La particella viene “seguita” lungo il suo percorso

4 3 Tracking detectors Struttura a strati (“layer”) sensibili La particella attraversa gli strati… …e ogni strato “prende nota” del punto in cui è stato attraversato Output finale = insiemi di punti spaziali in ogni layer

5 4 Come visualizzare le traiettorie delle particelle?  Metodi “visuali”  Camere a bolle  Camere a scintille  Emulsioni fotografiche  Metodi elettronici  Rivelatori a gas  Rivelatori a stato solido

6 5 Metodi “visuali” per la rivelazione di particelle  Materiale trasparente che reagisce al passaggio di particelle  Analisi visuale di una immagine ottenuta impressionando lastre fotografiche

7 6 Metodi “visuali” per la rivelazione di particelle  … analisi laboriosa e faticosa, difficile da automatizzare al computer

8 7 Rivelazione di particelle con segnali elettronici  Rivelatori a gas  Contatori proporzionali  Camere a deriva  TPC  Rivelatori a stato solido  Pixel detectors  Drift detectors  Strip detectors

9 8 1. Survey Data (o “geometria”)  Posizione spaziale di ogni volume (sensibile o non sensibile) del rivelatore 2. Calibration Constants  Costanti per convertire i segnali elettrici del rivelatore in informazione utilizzabile per l’analisi fisica 3. Mappatura del campo magnetico  Fondamentale per ricostruire l’impulso della particella in base alla curvatura della sua traiettoria 4. RAW DATA (  “clusters”)  I veri e propri dati sperimentali, raccolti dal rivelatore in seguito alla collisione generata con i fasci di particelle Dal rivelatore all’algoritmo: dati di base

10 9 Come ricostruire la traiettoria di una particella? Fit dei punti generati da una particella, usando una opportuna equazione per la traiettoria …ma se le tracce sono tante e vicine? Prima di ricostruire i percorsi delle particelle, bisogna sapere QUALI punti appartengono a ciascuna particella: PATTERN RECOGNITION PROBLEM

11 10 Questo è 1/100 di quello che potrebbe succedere in ALICE. Contate le tracce (se ci riuscite)! Un caso realistico…

12 11 What’s “tracking”? INPUT: Punti spaziali OUTPUT: Particelle (impulso, PID) TRACKING Fase 1 (track recognition): selezione dei punti (probabilmente) prodotti da una stessa particella Fase 2 (track reconstruction): ricostruzione delle caratteristiche fisiche della particella (identificazione, impulso)

13 12 Cosa significa “pattern recognition”?  Letteralmente: “riconoscimento di modelli”  Punto di partenza: “immagine”:  Insieme di segnali o informazioni che caratterizzano completamente un oggetto, nel contesto in cui esso viene analizzato. ◊ NON è ristretto alle immagini visive  Due step essenziali: 1. Definizione di un set di Immagini-Modello 2. Classificazione di ogni altra Immagine dello stesso insieme statistico secondo il Modello cui somiglia di più (se esiste). > Definizione di “somiglianza” o “distanza” fra immagini

14 13 Qualche definizione più rigorosa…  Problema di “classificazione”:  Input: un vettore di misura (“pattern”) contenente tutte le informazioni necessarie per definire un oggetto ◊ {X k }, k = 1, …, N  Output: classificazione del vettore (e quindi dell’oggetto associato) mediante una funzione di decisione: ◊ C = d({X k })  Pattern space ( P ):  Spazio di tutti i possibili pattern {X k }  Obiettivo:  Suddividere P in regioni separate, corrispondenti alle varie classificazioni possibili… ◊ …+ una classe per “unidentified patterns”

15 14 Esempio 1: lettura  Per farlo, dobbiamo prima conoscere le lettere  Pattern: segni sulla carta  “a”, “b”, “c”, etc…  Classificazione: suono associato al segno  Dalle forme delle lettere in stampatello, possiamo “intuire” come leggere uno scritto a mano, per analogia o somiglianza “ Nel mezzo del cammin di nostra vita Mi ritrovai per una selva oscura …” …ma non sempre tutto è così scontato: الاتحاد الأوروبي يدعو شارون لوقف العمليات العسكرية في المناطق الفلسطينية ومنح محمود عباس مزيدا من الوقت للسيطرة على المسلحين

16 15 Esempio 2: riconoscimento visivo Cosa è questo? …un gatto? COMPLIMENTI! Avete appena eseguito un Pattern Recognition!

17 16 Pattern space e Feature space  Definizione concettuale:  Funzione degli elementi del pattern che consente di ridurre il numero di parametri di cui tenere conto ◊ Riduzione dell’informazione agli elementi “essenziali”  Definizione “rigorosa”:  Base {e k } ortogonale nello spazio dei pattern che si possa scomporre in due blocchi {e 1,…, m < N }, {e m+1, …, N } tali che due pattern con le stesse componenti nei primi m (< N ) elementi sono abbastanza simili da poter essere considerati “identici” ai fini della classificazione da fare  Esempio:  N punti allineati  retta di best-fit +  2 (3 o 5 parametri) ◊ Meno informazione ◊ Si mantengono solo le informazioni “importanti”.

18 17 Vantaggi delle features  Meno elementi nel vettore da classificare  Gerarchia di importanza dei parametri.  “Residui” (gli N – m elementi “secondari”)  Criterio di valutazione di classificabilità  Esempio dei punti allineati: ◊ stabilire se possono essere accettati come “retta” o meno

19 18 Tracking e pattern recognition  Pattern: sequenze di punti restituiti dal rivelatore  Uno per ogni strato sensibile  Problema n! – combinatorio (n = numero di strati del rivelatore)  Feature: parametri della traiettoria della particella  Classificazione: traccia finale  Punto di produzione della particella (vertice)  Modulo e orientamento spaziale dell’impulso iniziale

20 19Complicazioni  L’impulso è un numero reale  Il numero di classi è infinito  I punti sperimentali sono tanti  Impossibile lavorare su tutte le combinazioni possibili  Selezione di “track candidates”  check di validità

21 20 Parametrizzazione della traccia  Fondamentale per la ricostruzione  5 parametri essenziali  Posizione (3 coordinate) + Impulso (3 componenti) - 1 (perché può essere scelto qualsiasi punto)  Qualsiasi set di 5 parametri è matematicamente equivalente ◊ Sconsigliabili i parametri che diventano troppo grandi Meglio usare 1/p piuttosto che p ◊ Attenzione ai parametri che, durante il fit, presentano discontinuità o correlazione con altri.  La scelta corretta è sempre dipendente dalla situazione (apparato sperimentale, range di impulso da ricostruire, …)

22 21 “Disturbi” nella ricostruzione Scattering multiplo nel mezzo: formula di Moliére  la traccia si scosta dalla forma “regolare” (potrebbe anche non essere trovabile) Energy loss: formula di Bethe-Bloch  (in presenza di campo magnetico) la traccia spiraleggia nel piano trasverso

23 22 Metodi di track finding  Metodi locali  Viene aggiunto alla traccia un punto alla volta, in base a criteri di scelta che dipendono dalla forma prevista per la traccia e dai punti precedentemente acquisiti  Metodi globali  Viene selezionato direttamente un insieme di punti sui quali viene operato un check unico, cosicché la traccia viene restituita direttamente  NB:  è necessario in ogni caso un adattamento specifico all’apparato sperimentale da usare.

24 23 Local vs. Global  Metodi locali:  Scelta dei punti “step-by-step” con una informazione che rimane parziale fino al termine della procedura  Il risultato può dipendere dall’ordine con cui i dati vengono analizzati  Necessita di un innesco ben congegnato  Non necessita di un modello globale di traccia (traiettoria)  Consente una trattazione ottimale dei “disturbi”  Metodi globali  La decisione viene presa sfruttando l’intera informazione  Può operare direttamente sui dati grezzi  Ha bisogno di una precisa espressione della traiettoria  Può tenere conto dei “disturbi” solo in media

25 24 Metodi locali  Tre possibili criteri logici:  “segui il tuo naso”  track following method ◊ Si innesca la traccia partendo da un estremo, e si esegue una “proiezione” nel layer successivo, selezionando il punto meglio compatibile con essa

26 25 Metodi locali  Tre possibili criteri logici:  “segui il tuo naso”  track following method ◊ Si innesca la traccia partendo da un estremo, e si esegue una “proiezione” nel layer successivo, selezionando il punto meglio compatibile con essa  “congiungi gli estremi”  track road method ◊ Si determinano due punti sui layer estremi e si congiungono cercando un percorso adeguato fra i punti del rivelatore

27 26 Metodi locali  Tre possibili criteri logici:  “segui il tuo naso”  track following method ◊ Si innesca la traccia partendo da un estremo, e si esegue una “proiezione” nel layer successivo, selezionando il punto meglio compatibile con essa  “congiungi gli estremi”  track road method ◊ Si determinano due punti sui layer estremi e si congiungono cercando un percorso adeguato fra i punti del rivelatore  “definisci una immagine”  track element method ◊ Si individuano segmenti lungo il percorso della traccia, e poi vengono collegati fra loro in base alla compatibilità

28 27 Il “principe” dei metodi locali: Kalman Filter  Base: track following  Introdotto da P. Billoir (1983)  In seguito si è compreso che tale metodo si riconduce ad un metodo generale sviluppato da Kalman per il fit di sistemi complessi  Ingredienti:  A n (5) ◊ vettore di stato contenente i 5 parametri essenziali di traccia  V n (5x5) ◊ matrice di covarianza dei 5 parametri (5x5)  M n = H A n (2) ◊ vettore di “misura” (che passa dai parametri alla misura osservabile  punto)  C n = H V n H T (2x2) ◊ matrice di covarianza delle misure

29 28 Algoritmo del Kalman Filter  Start: “seeding”  Stime ragionevoli per A n e V n a partire da alcuni punti.  Propagazione  stima del vettore di stato nel punto n – 1 : A * n-1 = P n A n  viene propagata anche la matrice di covarianza, che viene artificiosamente aumentata di un termine di disturbo che tiene conto dello scattering multiplo: V * n-1 = P n ( V n + N n ) P n T

30 29 Algoritmo del Kalman Filter  Selezione di un punto candidato all’inclusione, in un layer di rivelazione:  M n-1  coordinate; C n-1  covarianza  Calcolo dei residui R A n-1 = M n-1 – M(A * n-1 ) R C n-1 = C n-1 – C(A * n-1 )  Filtro: modifica del vettore di stato includendo nuova informazione  Definizione: “gain matrix” K = V * n-1 H T (C n-1 + H V * n-1 H T ) -1 A n-1 = A * n-1 + K R A n-1 V n-1 = (1 – K H) V * n-1  2  (R A n-1 ) T (R C n-1 ) -1 R A n-1

31 30 Kalman Filter  Track finding:  Single step: ◊ Propagazione su più punti sul layer in studio ◊ Inclusione del punto che determina il minimo  2  Hypothesis tree: ◊ Generazione di “alberi” di punti, tenendo conto di tutte le possibilità ◊ Selezione del percorso cui corrisponde il minimo  2 totale (dalla somma di tutti I contributi)  Track fitting:  Avviene “in itinere” durante il finding  3D fit contemporaneo “locale”

32 31 Vantaggi e svantaggi del Kalman Filter  OK  Esegue contemporaneamente track finding e fitting  Opera sui parametri di traccia (retta: 4, elica: 5) ◊ Niente matrici della dimensione del numero di punti del campione  Molto utile per collegare punti su rivelatori diversi  E’ molto semplice introdurre gli effetti dei “disturbi”: ◊ Multiple scattering: incremento sulla matrice di covarianza ◊ Energy loss: variazione “locale” della curvatura, step per step  KO  Richiede una procedura ottimale di ricerca dei punti  E’ fortemente dipendente dalle condizioni iniziali

33 32 Metodi globali  Combinatorio totale  Analisi di tutte le possibilità  Template matching  Confronto con modelli  Histogramming  Ricerca di configurazioni ripetitive  Metodi neurali o neural-like  Associazioni locali

34 33 Template matching  Applicazione “nativa” del pattern recognition  Definizione di “template”: ◊ Definire parametri iniziali di traccia ◊ Stabilire che punti produrranno  Confronto con lo schema di punti ottenuto sperimentalmente: ◊ Individuazione dei template presenti nel campione ◊ Nessun processing aggiuntivo: i parametri finali della traccia sono quelli del matched template  Applicabilità molto limitata ◊ Solo in caso di poche combinazioni possibili

35 34 Template matching  recursive tree search  Procedura iterativa con diverse gerarchie di template, via via più precise, in modo da operare l’incremento del dettaglio solo nei sottoinsiemi di pattern che si adattano, via via, al template precedente che è stato riscontrato nei dati

36 35 Complete combinatorial method  L’algoritmo concettualmente più semplice:  Costruire tutte le possibili sequenze di punti (1 per layer)  Valutare la compatibilità con il modello di traccia previsto ◊ Fit e calcolo del  2  parametro di qualità  Ordinare le combinazioni secondo il parametro di qualità  Stabilire un criterio di accettazione: ◊ Quantitativo: i primi N elementi (se si ha una idea della molteplicità da attendere in un evento) ◊ Qualitativo: tutti gli elementi per cui  2 <  2 max  Applicabilità fortemente dipendente dal numero di punti per layer e dal numero di layer stessi  Crescita fattoriale della complessità  Inapplicabile nella quasi totalità dei casi

37 36 Histogramming: Radon Transform Distribuzione dei punti nel rivelatore: Risposta media del rivelatore per una particella con una data configurazione di parametri {p} Popolazione tipica dello spazio delle features (param. di traccia), per la feature corrispondente a una particella [delta function] Problema di inversione:  Conoscenza dettagliata della risposta dei rivelatori  Presenza di una precisa forma teorica della traccia

38 37 Hough Transform  histogramming  Estensione del caso della trasformata di Radon.  Dipendenza dalla sola forma teorica della traccia  Base: espressione teorica della traiettoria  Caso 1: (B = 0)  retta  4 parametri  Caso 2: (B = costante)  elica  5 parametri  Ipotesi dell’algoritmo:  Se N punti appartengono alla stessa traccia, estraendo i parametri di traccia da qualsiasi loro sottoinsieme otterrò valori simili a quelli che otterrei dall’intero insieme.  Se i punti non appartengono ad una specifica traccia, estrarrò parametri casuali, che si distribuiranno a caso nello spazio delle features

39 38 Hough Transform: procedimento  Esempio: rette nel piano da un punto fisso  Equazione: y = mx [m = tan(  )] 1. Estrazione di  da tutte le coppie di punti  istogramma 2. Ricerca di picchi nell’istogramma > corrispondenti a tante coppie “concordi”  stessa traccia

40 39 Pro e contro della Hough Transform PRO  Semplice e veloce  Non richiede un cluster finding  Può lavorare direttamente con i dati grezzi CONTRO  Dimensionalità dello spazio delle features  Nel caso più semplice (retta) serve un istogramma a 4D  Necessità di una equazione “teorica” della traccia  Necessità di una quantità di layer del rivelatore abbastanza grande da evidenziare gli addensamenti

41 40 Digressione: cos’è una rete neurale NEURONI SINAPSI   Sistema distribuito di “processing units” collegate fra loro in modo da scambiarsi informazioni.   Due costituenti di base:   Il nodo di calcolo: neurone ◊ ◊ raccoglie segnali in input da altri elementi della rete ◊ ◊ restituisce un output (“attivazione”) in risposta al segnale ricevuto   Veicolo di scambio di informazioni: sinapsi pesata ◊ ◊ implementa le correlazioni (o competizioni) fra neuroni ◊ ◊ agisce come un fattore moltiplicativo sul segnale ricevuto da ogni unità (“peso sinaptico”)

42 41 La variazione nell’attivazione diminuisce di ciclo in ciclo Stabilizzazione finale  correlazione  incremento attivazione competizione  decremento attivazione RN a connessione completa Come opera la rete neurale

43 42 Mappa di attivazioni reali comprese fra 0 e 1 Confronto con una soglia fissa di attivazione S Mappa binaria di attivazioni (“on” / “off”) Come opera la rete neurale

44 43 Punti nel rivelatore  Neuroni = segmenti fra coppie di punti Competizione  peso inibitorio costante Concatenamento  peso eccitatorio dipendente dall’allineamento CATTIVO allineamento: w E  0 BUON allineamento: w E  A Implementazione del Tracking Neurale Nessuna relazione fra segmenti non contigui

45 44 Tracking neurale: work flow  Lettura punti sui layer  Creazione segmenti “accettabili” (cut)  La rete neurale “spegne” i segmenti sbagliati, lasciando “accesi” quelli giusti, che producono le catene di segmenti che poi verranno passate al fit della traccia.

46 45 Elastic Arms  Combinazione di metodo neurale e “template matching”  Definizione di N templates (Hough Transform)  Calcolo di una funzione “energia”: ◊ E =  S ia M ia S = condizione di appartenenza del punto “i” alla traccia “a” M = distanza del punto “i” dalla traccia “a”  Tale funzione deve essere minimizzata in due step: 1. Correzione dei parametri dei template a partire dai punti ◊ Refit 2. “Riassegnazione” dei punti secondo il template più vicino ◊ (rete neurale dei fattori S ia pesati in base ai valori M ia ) ◊ Convergenza  ciascun punto viene assegnato al template migliore.

47 46 Come si valuta la bontà di un algoritmo?  Simulazione  Insieme di punti “assegnati” a ogni traccia  Confronto fra le associazioni vere e quelle dedotte dal tracking  Classificazione delle tracce trovate:  Perfect Track ◊ Solo cluster con lo stesso ID traccia Tutti quelli presenti nell’evento  Complete Perfect Track Alcuni punti mancanti  Incomplete Perfect Track  Imperfect Track ◊ Cluster con ID di tracce diversi (si assegna quello di maggioranza) “Sufficiente” maggioranza di un ID  Majority Good Track (accettabile) “Insufficiente” maggioranza di un ID  Majority Fake Track (non accettabile)

48 47 Come si valuta la bontà di un algoritmo? Track ID Perfect Track Class 1: PerfectComplete Class 2: PerfectIncomplete Class 5: Not Found Imperfect Track Class 3: Majority Good Class 4: Majority Fake Classificazione degli indici di traccia simulata

49 48Efficienza Tracce Trovate vs. Tracce Simulate  “Event by event”  # tracce trovate correttamente / # tracce generate  Criterio di massima resa su un campione  # eventi ricostruiti al 100% / # eventi generati  Criterio di resa sufficiente su un campione  # eventi ricostruiti al 90% (o meno) / # eventi generati

50 49Efficienza  Non tutte le tracce generate sono “trovabili”:  Limiti dell’algoritmo  Eccessivo effetto distorcente di EL e MS  Quantità insufficiente di segnale nei rivelatori  Efficienza “del metodo”  Calcolata sul campione delle sole tracce “trovabili”  Efficienza “globale”  Calcolata sul campione delle tracce generate E’ importante che l’algoritmo non sia “troppo” limitato!

51 50 good fake Esempio: efficienza di un algoritmo di tracking

52 51 Track fitting  Una volta assegnati i punti ad una particella…  …bisogna ricostruire I parametri fisici  Best-Fit dei punti con l’equazione della traiettoria  M. Locali (Kalman)  fit progressivo  M. Globali  fit “globale”  Caso facile: retta  Caso difficile: elica  Necessario un fit del cerchio nel piano trasverso

53 52 Track fitting: Kalman Filter  Utilizzabile anche come semplice fitter  I punti non devono essere “cercati”  Il filtro è “forzato” a eseguire correzioni adeguate a includere, uno alla volta, i punti della traccia  Vantaggio: il fit viene eseguito “all in one” in 3D  Svantaggio: è necessario un innesco (“seed”)  Fit preliminare con altri metodi  Ipotesi preliminare su 2 punti (retta) o 3 punti (elica)

54 53 Metodi per il fit del cerchio nel piano  Metodo dei minimi quadrati non risolubile esattamente (equazioni di minizzazione complesse)  Operazioni di linearizzazione  Mapping conforme  Sfera di Riemann

55 54 Mapping conforme Ipotesi: il punto (x V, y V ) appartiene alla circonferenza Utile per il fit di tracce primarie Inversione dell’ordine dei layer!

56 55 Mapping conforme L’equazione cartesiana del cerchio… …si trasforma in una retta (non passante per l’origine)  fit banale Occhio alla propagazione degli errori!!!

57 56 Sfera di Riemann Una sfera di raggio unitario “poggiata” sul piano XY Dato un punto sul piano XY, si congiunge con il polo della sfera opposto al “punto di appoggio”, e si individua il punto in cui la congiungente interseca la sfera. Intersezione sulla sfera di Riemann Coord. nel piano Proprietà di base: le proiezioni dei punti di un cerchio nel piano XY stanno su un piano

58 57 Sfera di Riemann Fit di un piano nello spazio Da minimizzare = autovettore di A con l’autovalore più piccolo Raggio Centro

59 58 Fit della traccia nello spazio  Quando si esegue un fit nel piano, bisogna linearizzare l’equazione dell’elica nello spazio, per completare la procedura di fit. Curvatura Parametro di impatto trasverso

60 59Risoluzione  Importante: conoscere l’indeterminazione sulle proprietà della particella ricostruita (p, PID, vertice)  Ancora una volta, confronto con la simulazione  Confronto fra i parametri “veri” della traccia trovata e quelli ricostruiti con il fit  Differenza assoluta ( P vero – P ricostruito )  Differenza percentuale ( P vero – P ricostruito ) / P vero  Criterio di “accettabilità” di punti sbagliati:  Entro che limiti un punto sbagliato “rovina” la risoluzione dei parametri?  E’ accettabile una quantità di punti sbagliati che non modifica sensibilmente la risoluzione ◊ …quando ciò non significa che la procedura di ricostruzione vada rivista perchè troppo indeterminata

61 60 Esempio: risoluzione parametri Dip angle ( ) resolution (in mrad) sigma = 3.69  0.01 Azimuthal angle (  ) resolution (in mrad) sigma = 4.71  0.01 p t resolution (in % of true value) sigma = 13.4  0.3 %

62 61 Stand-alone tracking: results (III) Transverse impact parameter resolution (in microns) sigma = 79.7  0.1 Longitudinal impact parameter resolution (in microns) sigma =  0.4

63 62Summary  Strategia di analisi di eventi di collisione ad alta energia:  Tracking detectors  Algoritmi di Tracking  Track finding:  Problema di Pattern Recognition ◊ Metodologie locali e globali di riconoscimento di tracce  Valutazione: efficienza di tracking  Track reconstruction:  Fit non lineare in presenza di campi magnetici ◊ Splitting della procedura in più step  Valutazione: risoluzione dei parametri di traccia


Scaricare ppt "Tracking in high energy physics Alberto Pulvirenti"

Presentazioni simili


Annunci Google