La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010.

Presentazioni simili


Presentazione sul tema: "Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010."— Transcript della presentazione:

1 Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010 III Lezione, 11/11/09

2 2Silvia Arcelli Sommario della scorsa lezione: Metodi di riconoscimento di traccia (pattern recognition):Metodi di riconoscimento di traccia (pattern recognition): Metodi Globali Template Matching, MST, Fuzzy Radon (Hough) Transform, Neural NetworksMetodi Globali Template Matching, MST, Fuzzy Radon (Hough) Transform, Neural Networks Metodi Locali: il track followingMetodi Locali: il track following

3 3Silvia Arcelli In questa lezione: Track Fitting:Track Fitting: Track Fit - generalitàTrack Fit - generalità Track Model:Track Model: Parametrizzazione della tracciaParametrizzazione della traccia Effetti del materialeEffetti del materiale Kalman Filter: un metodo recursivo di track finding e fitting simultaneoKalman Filter: un metodo recursivo di track finding e fitting simultaneo

4 4Silvia Arcelli Track Fitting Track Fitting Dopo il track finding, si vuole estrarre dal set di misure associate alla traccia suoi parametri (origine, direzioni e impulso/carica al piano di riferimento). Il LSM (Minimizzazione del 2 ) è il metodo generalmente adottato : Vettore dei parametri di traccia Misura i-esima di posizione Incertezza sulla misura i-esima Valore previsto della misura i-esima sulla base del track Model, in funzione dei parametri della traccia

5 5Silvia Arcelli Track Fitting Track Fitting Notazione Matriciale: Condizione di minimo : F è la matrice delle derivate: con diagonale: incertezze non correlate misure gaussiane Si assume inoltre

6 6Silvia Arcelli Track Fitting Track Fitting Se il track model è lineare (N.B: nei parametri!) allora e: Per dim. vedere ad esempio: Data Analysis Techniques for High Energy Physiscs, R. Fruhwirth et al, p.232, (Cambridge Univ. Press)

7 7Silvia Arcelli Track Fitting Track Fitting Soluzione esplicita Se gli errori di misura sono gaussiani, gli errori sui parametri sono gaussiani (i parametri di traccia sono una funzione lineare delle misure) Il LSM fornisce un estimatore non biassato ed efficiente, cioè di minima varianza Test Statistics: 2, pulls (validazione dei candidati di traccia) Vantaggi di avere un Track Model Lineare:

8 8Silvia Arcelli Track Fitting Track Fitting Un esempio banale di fit globale con track model lineare: traccia in un piano in assenza di campo magnetico: Track model: (z r =0) Applicando: Si arriva alle note formule di regressione lineare

9 9Silvia Arcelli Track Model-Equazioni del Moto Moto di una particella carica in un campo magnetico statico B(x) : Poichè Si può eliminare la dipendenza esplicita dal tempo esprimendo lequazione in funzione della distanza lungo la traiettoria, s= ct. Se B é uniforme, la soluzione (analitica) é unelica cilindrica. Se il campo è significativamente non uniforme, occorre risolvere lequazione utilizzando metodi numerici.

10 10Silvia Arcelli Track Model-Equazioni del Moto Principali configurazioni di campo magnetico negli esperimenti: Campo uniforme lungo z (asse dei fasci), simmetria cilindrica, piani di misura a R=cost (Geometria a Collider) Campo uniforme lungo x, rivelatore planare con layer (xy) lungo z (Geometria a Bersaglio Fisso) Deflessione in xy ( ρ ) Deflessione in yz

11 11Silvia Arcelli Track Model-Elica Cilindrica Equazione parametrica dellelica cilindrica (B lungo z) : Sei parametri (tre equazioni differenziali del secondo ordine...). B

12 12Silvia Arcelli Track Model-Elica Cilindrica R H é il raggio dellelicaR H é il raggio dellelica è legato alla pendenza della è legato alla pendenza della tangente alla circonferenza a s=0, tangente alla circonferenza a s=0, é il dip angle:λ é il dip angle: La proiezione in xy è un cerchio: H H x0,y0,z0 sono le coordinate a s=0x0,y0,z0 sono le coordinate a s=0

13 13Silvia Arcelli Track Model-Parametri della traccia Tuttavia, una volta fissata una superficie di riferimento (ad esempio, in R o in z), la traiettoria è descritta da solo cinque parametri indipendenti (scelta del pivot). Simmetria cilindrica (collider), riferimento: cilindro raggio R quanto più prossimo al vertice di interazione : Punto impatto direzioni impulso

14 14Silvia Arcelli Track Model-Parametri della traccia Simmetria planare (Bersaglio fisso): il riferimento è in genere un piano a z=cost (vicino al vertice) Punto impatto direzioni momento In assenza di campo magnetico, la traiettoria è una retta e sono ovviamente necessari solo quattro parametri (limpulso è indefinito)

15 15Silvia Arcelli Track Fitting Track Fitting Lelica cilindrica non è lineare nei parametri di traccia, ma se si sceglie la parametrizzazione in modo opportuno, di fatto localmente è lineare con una buona approssimazione. Per localmente si intende che le distanze entro cui assumo che il track model sia lineare sono piccole rispetto al raggio dellelica. In questo caso le proprietà del track model lineare sono in gran parte preservate.

16 16Silvia Arcelli Track Fitting Track Fitting Quindi, in presenza di track model ~lineare, ci si riconduce ad un problema piuttosto semplice, con una soluzione esplicita: Inversione di matrici di dimensione uguale al numero massimo di parametri di traccia (n=5). Come cambia quando includo leffetto dei materiali (Scattering Multiplo, perdita di Energia,...)? ( N x N), diagonale (N x 5) (5 x N) (N x 1) (5 x 1)

17 17Silvia Arcelli Track Model-Effetti del Materiale Multiple Scattering: non cambia il valore assoluto dellimpulso, ma influenza la direzione della particella. In media, su molti scattering elementari ci si aspetta una deviazione nulla. Non si applica una correzione esplicita alla descrizione parametrica della traiettoria (f) Nel fit di traccia, si introducono ulteriori incertezze sulla posizione della traccia sulli-esimo layer di misura, correlate tra le misure nei differenti layer. Questo implica la comparsa di termini non diagonali nella matrice di covarianza V delle misure (altrimenti assunte indipendenti)

18 18Silvia Arcelli Multiple Scattering Elementi diagonali della Matrice di Covarianza: Direzione di volo della particella

19 19Silvia Arcelli Multiple Scattering Elementi off-diagonal della Matrice di Covarianza: Direzione di volo della particella

20 20Silvia Arcelli Multiple Scattering X0X0X0X0 MS MS Si (300 μm) 9.4 cm Argon (1m) 110 m Pioni con impulso 1 GeV/c: 300 μ m Se consideriamo un rivelatore a silicio con layer di spessore 300 μ m, e una distanza da layer a layer di 10 cm, lincertezza indotta dal MS per pioni da 1 GeV/c a incidenza normale è ~80 m, confrontabile con la precisione del rivelatore. Questi termini sono significativi?

21 21Silvia Arcelli Multiple Scattering Scala come 1/ p, contributo dominante per particelle di basso impulso! Lo spessore effettivo d aumenta con langolazione della traccia rispetto al piano del materiale Atlas Pixel Detector Material Budget

22 22Silvia Arcelli Multiple Scattering Un altro metodo a volte usato per tener conto nel fit del MS è quello dei Break-Points: in pratica, si introducono nel fit di traccia altri parametri liberi (angoli) in corrispondenza delle superfici di scattering: Numero di parametri extra = numero di superfici di scattering, per N elevato è impraticabile. La sua applicazione sono i casi in cui si ha un numero limitato di superfici (attive o passive) in cui ci aspetta un forte effetto di MS.

23 23Silvia Arcelli Perdita di Energia Perdita di energia per ionizzazione : non cambia la direzione, ma limpulso. In seguito ad una perdita di energia in uno strato d di materiale, la curvatura aumenta: IP Nel fit di traccia: Correzione a C su ogni layer di materiale In genere si trascurano le fluttuazioni sulla dE/dx (non si modifica la matrice di covarianza).

24 24Silvia Arcelli Perdita di Energia densità (g cm -3) dE (MeV) Si (300 μ m) Argon (1m) Per Pioni con impulso 1 GeV/c: E molto piccolo, relativamente allimpulso iniziale. Per MIP la correzione può essere rilevante se nel volume di tracking la traccia attraversa uno strato significativo di materiale passivo denso. In particolare, nel tracking di muoni. Quanto è grande questo effetto, per MIP?

25 25Silvia Arcelli Perdita di Energia Protoni con impulso 0.2 GeV/c ( =0.2) La perdita di energia è significativamente maggiore per particelle di impulso più basso, e pesanti. Ad esempio: In Si (300 μm): 1 MeV. Correzione dello ~0.5% su ogni layer. N.B. Per applicarla correttamente dovrei conoscere la massa!

26 26Silvia Arcelli Track Model-Effetti del Materiale In entrambi i casi, MS e dE/dx, la trattazione degli effetti del materiale nel fit dipende 1) dai parametri della traccia (angoli di incidenza, impulso) e 2) dalla massa (che è in genere ignota, a questo livello). Si può adottare una procedura iterativa (prima stima dei parametri senza correzione, si calcola la correzione, si ripete il fit, e così via fino alla convergenza). Si può adottare una procedura iterativa (prima stima dei parametri senza correzione, si calcola la correzione, si ripete il fit, e così via fino alla convergenza). Si esegue il fit con diverse ipotesi di massa ( π,k,p,...) che possono essere ulteriormente discriminate utilizzando l informazione di PID del tracking (se presente) Si esegue il fit con diverse ipotesi di massa ( π,k,p,...) che possono essere ulteriormente discriminate utilizzando l informazione di PID del tracking (se presente)

27 27Silvia Arcelli Track Model-Effetti del Materiale In generale, la trattazione degli effetti di materiale in un fit di traccia globale è complessa e pesante dal punto di vista computazionale. In generale, la trattazione degli effetti di materiale in un fit di traccia globale è complessa e pesante dal punto di vista computazionale. In particolare, la matrice V non è più diagonale, e questo comporta linversione di matrici N x N, (N il numero di misure), operazione che scala come N 3 In particolare, la matrice V non è più diagonale, e questo comporta linversione di matrici N x N, (N il numero di misure), operazione che scala come N 3 Inoltre, il risultato del fit corrisponde alla miglior stima Inoltre, il risultato del fit corrisponde alla miglior stima dei parametri della traccia alla superficie di riferimento, e dei parametri della traccia alla superficie di riferimento, e la traiettoria estrapolata non segue in dettaglio la traiettoria reale della traccia (MS). la traiettoria estrapolata non segue in dettaglio la traiettoria reale della traccia (MS).

28 28Silvia Arcelli Kalman Filter R.E.Kalman (A new approach to linear filtering and prediction problems Trans. ASME J. Basic Eng. 82 (1960), 35): metodo recursivo per stimare gli stati di un sistema dinamico sulla base ad una serie di misure. R.E.Kalman (A new approach to linear filtering and prediction problems Trans. ASME J. Basic Eng. 82 (1960), 35): metodo recursivo per stimare gli stati di un sistema dinamico sulla base ad una serie di misure. Introdotto in fisica subnucleare (1984) da P. Billoir sotto il nome di Progressive Fit, sviluppato ulteriormente da Introdotto in fisica subnucleare (1984) da P. Billoir sotto il nome di Progressive Fit, sviluppato ulteriormente da R.Frühwirth e M. Regler. R.Frühwirth e M. Regler. Nel contesto del track finding, il Kalman Filter è la stima dello stato della traccia in corrispondenza di un numero Nel contesto del track finding, il Kalman Filter è la stima dello stato della traccia in corrispondenza di un numero finito di superfici, su cui sono eventualmente disponibili delle misure. finito di superfici, su cui sono eventualmente disponibili delle misure.

29 29Silvia Arcelli Kalman Filter Metodo recursivo di track finding e fitting simultaneo Metodo recursivo di track finding e fitting simultaneo Si dimostra che è equivalente ad una procedura globale di minimizzazione di 2, con le stesse proprietè del LSM Si dimostra che è equivalente ad una procedura globale di minimizzazione di 2, con le stesse proprietè del LSM Costo computazionale limitato, massima dimensione delle matrici pari a quelle del vettore dei parametri della traccia Costo computazionale limitato, massima dimensione delle matrici pari a quelle del vettore dei parametri della traccia E in grado di fornisce la stima ottimale dei parametri della traccia in ogni punto della traiettoria E in grado di fornisce la stima ottimale dei parametri della traccia in ogni punto della traiettoria

30 30Silvia Arcelli Kalman Filter Una traccia è rappresentata da un set di parametri, che nel formalismo del Kalman Filter vengono raggruppati in quello che si definisce lo StateVector: Lo stato evolve su un insieme di valori, secondo una componente deterministica ed una componente stocastica. Il Kalman Filter è la procedura utilizzata per determinare lo stato della traccia in corrispondenza di un numero finito N di posizioni (i layer di misura del rivelatore), sulla base di N misure, tenendo anche conto di processi stocastici.

31 31Silvia Arcelli Kalman Filter Il Kalman Filter è un estimatore recursivo, cioè per fornire la stima dello State Vector allo step k+1 sono necessari unicamente la stima dello State Vector allo step k, e il vettore di misura allo step k+1. Il Kalman Filter è un estimatore recursivo, cioè per fornire la stima dello State Vector allo step k+1 sono necessari unicamente la stima dello State Vector allo step k, e il vettore di misura allo step k+1. Questo nellambito di una serie di assunzioni generali (che corrispondono sostanzialmente ad avere un modello di traccia lineare, e processi stocastici che non diano un bias sulla stima dei parametri dello State Vector) Questo nellambito di una serie di assunzioni generali (che corrispondono sostanzialmente ad avere un modello di traccia lineare, e processi stocastici che non diano un bias sulla stima dei parametri dello State Vector)

32 32Silvia Arcelli Kalman Filter-Assunzioni Generali Dove F è una funzione lineare: Dove F è una funzione lineare: Il termine descrive il process noise. Si assume Il termine descrive il process noise. Si assume che non sia biassato, sia gaussiano e sia caratterizzato da una definita matrice di covarianza che non sia biassato, sia gaussiano e sia caratterizzato da una definita matrice di covarianza La matrice di covarianza di è indicata con La matrice di covarianza di è indicata con Si assume che levoluzione del vettore di stato dal layer k al layer successivo k+1 sia descritto da una System Equation con definite proprietà :

33 33Silvia Arcelli F descrive la parte deterministica dellevoluzione dello stato F descrive la parte deterministica dellevoluzione dello stato dal layer k al layer k+1 (è legata alle soluzione delle equazioni del moto). Se la funzione non è strettamente lineare ma è localmente lineare, il principio resta inalterato e il Filtro di Kalman si dice esteso. dal layer k al layer k+1 (è legata alle soluzione delle equazioni del moto). Se la funzione non è strettamente lineare ma è localmente lineare, il principio resta inalterato e il Filtro di Kalman si dice esteso. Il termine tiene conto della variazione stocastica dello Il termine tiene conto della variazione stocastica dello State Vector durante la propagazione dal layer k al layer k+1 State Vector durante la propagazione dal layer k al layer k+1 (dovuta, ad esempio, al MS). (dovuta, ad esempio, al MS). Kalman Filter-Assunzioni Generali

34 34Silvia Arcelli Kalman Filter-Assunzioni Generali Anche H è una funzione lineare Anche H è una funzione lineare Il termine descrive la componente stocastica associata allincertezza sulle misure (measurement noise), e si Il termine descrive la componente stocastica associata allincertezza sulle misure (measurement noise), e si suppone che non sia biassato, sia gaussiano e che sia caratterizzato da una matrice di covarianza suppone che non sia biassato, sia gaussiano e che sia caratterizzato da una matrice di covarianza Si assume inoltre che il process noise e il measurement Si assume inoltre che il process noise e il measurement noise siano indipendenti noise siano indipendenti Inoltre, si assume che sia possibile, dato il vettore di stato ad un certo layer k, connetterlo al vettore delle misure (coordinate) allo stesso layer attraverso la Measurement Equation:

35 35Silvia Arcelli Kalman Filter Kalman Filter Lo stesso esempio usato per il formalismo del fit di traccia globale ora nel formalismo del Kalman Filter: N.B. Qui ho ignorato il process ed il measurement noise

36 36Silvia Arcelli Kalman Filter Kalman Filter Rispetto al formalismo del fit di traccia globale : Il modello di traccia mette in relazione due stati consecutivi (continuo cambio del piano di riferimento) Il modello di traccia deve essere lineare solo tra due layer consecutivi Il MS è trattato nella matrice Q k, che ha la dimensionalità dello State Vector Correzioni (come quella per dE/dx o piccole disuniformità di campo magnetico) si incorporano in maniera molto semplice

37 37Silvia Arcelli Kalman Filter-Come funziona Prediction: Stima di uno stato futuro Prediction: Stima di uno stato futuro Filter : Stima dello stato presente, includendo Filter : Stima dello stato presente, includendo linformazione della misura linformazione della misura Smoother: Stima di uno stato passato, in base a tutta Smoother: Stima di uno stato passato, in base a tutta linformazione della traccia. linformazione della traccia. Operativamente, il Kalman Filter si articola secondo 2 processi di base ( più un terzo opzionale, smoother) iterati N volte:

38 38Silvia Arcelli Kalman Filter-Come funziona Per partire, il filtro ha bisogno di un seed (vedi track following), che dia una stima iniziale dello State Vector: Quindi, se si indica con la stima dello State Vector al layer k sulla base delle j misure nei j layer {m1,...mj}: 1) k>j : Prediction 2) k=j : Filter 3) k

39 39Silvia Arcelli Kalman Filter, Prediction Step Supponiamo di avere una stima dello State Vector al layer {m1,..mk}, con matrice di covarianza. Equazioni del Prediction Step: k sulla base delle misure {m1,..mk}, con matrice di covarianza. Equazioni del Prediction Step: State Vector Covariance Matrix dim(Q,F,C)= dim(x) · dim(x) ho già una stima locale dei parametri (errori MS) posso applicare correzioni (dE/dx)

40 40Silvia Arcelli Kalman Filter, Filter Step In questa fase, si utilizza la stima dello State Vector e della sua matrice di covarianza dal Prediction Step, combinandola con una eventuale misura al layer k+1, per produrre la miglior stima dello State Vector al layer k+1, sulla base delle misure {m 1,...,m k+1 }. La prescrizione si deriva richiedendo che sia minima la funzione: 2 della parte di misura 2 della parte di predizione

41 41Silvia Arcelli Kalman Filter, Filter Step Imponendo si ottengono le Equazioni di Filter, che danno la miglior stima dello stato al layer k+1, e della sua matrice di covarianza: State Vector Covariance Matrix

42 42Silvia Arcelli Kalman Filter, Filter Step non è altro che la media pesata della previsione e della misura. La miglior stima dello State Vector al layer k+1, basato sulle misure {m 1,...m k+1 } non è altro che la media pesata della previsione e della misura. Anche in questa fase, si fa track finding! Ho una serie di informazioni per decidere lassociazione dellhit Posso tener conto della eventuale dipendenza degli errori di misura dai parametri della traccia

43 43Silvia Arcelli Kalman Filter, Filter Step Usando e sostituendo, le equazioni di filter si possono anche scrivere: Dove: é la Gain Matrix Correction Prediction

44 44Silvia Arcelli Kalman Filter, Filter Step La Gain Matrix K determina il peso della correzione. Allinizio del filtro: massimo guadagno nellincorporare la misura Alla fine del filtro: incorporare nuove misure ha sempre meno impatto

45 45Silvia Arcelli Kalman Filter, Filter Step La Stima filtrata ha tutte le proprietà ottimali di un estimatore lineare di minimi quadrati. Ad essa è associata un 2 : distribuito come una variabile di 2 a dim(m k ) gradi di libertà. Il 2 globale della traccia è la somma di tutti i 2 ad ogni passo del filtro.

46 46Silvia Arcelli Kalman Filter Il filtro procede iterando queste due operazioni fino all N-esimo layer, rifinendo continuamente la stima dello State Vector al layer corrente: La stima filtrata segue più da vicino la traiettoria fisica della traccia (soprattutto nello stadio iniziale) La stima allultimo layer è la più precisa, perchè contiene linformazione delle misure di tutti i layer. Se si vuole la miglior stima al vertice, si inizia il filtro dal layer più esterno.

47 47Silvia Arcelli Kalman Filter-Smoother Step Abbiamo visto che lo State Vector è più preciso allultimo layer di misura. Ma il Kalman Filter permette di ottenere la stima migliore, basata su tutte le N misure, a qualunque layer k={1...N}. Equazioni di Smoothing (ancora un processo recursivo):

48 48Silvia Arcelli Kalman Filter-Smoother Step Anche alla stima smoothed è associato un 2, ma la loro somma non dà il 2 globale (non sono indipendenti) Utile per lindividuazione di hit di rumore (outliers) Lo Smoother si dimostra equivalente alla media pesata di un Forward Filter e di un Backward Filter. La traiettoria dopo lo smoothing è, appunto, più smooth

49 49Silvia Arcelli Kalman Filter-Sommario Permette di fare track finding e fitting simultaneamente Perturbazioni alla traiettoria ideale (MS, perdita di Energia, disuniformità di campo magnetico) sono trattabili in maniera più semplice Il formalismo consente di utilizzare matrici di dimensione limitata (al massimo quella dello State Vector). Quindi il numero di operazioni scala come ~N, e non come N 3. Il modello lineare di traccia deve essere valido solo localmente (tra step e step)

50 50Silvia Arcelli Kalman Filter-Sommario I parametri di traccia sono stimati localmente, e seguono da vicino la traiettoria fisica della traccia, non solo lestrapolazione delle condizioni iniziali come in un fit globale Estrapolazione ottimale dello stato della traccia ad altri device (calorimetri, sistemi di Particle-ID, rivelatori di muoni) Quando conviene usarlo? Quando sono in condizione di continuità e prossimità delle misure.


Scaricare ppt "Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010."

Presentazioni simili


Annunci Google