Il caso delle misure di eventi rari

Slides:



Advertisements
Presentazioni simili
Training On Line - CONP. 2 Richiesta Da Menu: Conferimenti ad inizio anno termico > Agosto > Pluriennali > Nuova Richiesta Si accede alla pagina di Richiesta.
Advertisements

Le forze ed i loro effetti
I dati Qualsiasi contenuto dell’esperienza.
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Caduta non guidata di un corpo rettangolare in un serbatoio Velocità e rotazione.
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Le distribuzioni di probabilità continue
2. Introduzione alla probabilità
1 MeDeC - Centro Demoscopico Metropolitano Provincia di Bologna - per Valutazione su alcuni servizi erogati nel.
TAV.1 Foto n.1 Foto n.2 SCALINATA DI ACCESSO ALL’EREMO DI SANTA CATERINA DEL SASSO DALLA CORTE DELLE CASCINE DEL QUIQUIO Foto n.3 Foto n.4.
1 Pregnana Milanese Assessorato alle Risorse Economiche Bilancio Preventivo P R O P O S T A.
Intervalli di confidenza
Proprietà degli stimatori
Frontespizio Economia Monetaria Anno Accademico
La scelta del paniere preferito
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
DISEGNO TECNICO INDUSTRIALE
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita.
Lez. 3 - Gli Indici di VARIABILITA’
Elementi di statistica Elementi di statistica M. Dreucci Masterclasses LNF Elementi di statistica M. Dreucci.
3. Processi Stocastici Un processo stocastico è una funzione del tempo i cui valori x(t) ad ogni istante di tempo t sono v.a. Notazione: X : insieme di.
Inferenza statistica per un singolo campione
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Varianza campionaria Errore standard della varianza campionaria
La distribuzione normale e normale standardizzata
Campionamento casuale semplice
Obiettivi del corso di Statistica Medica.
Processi Aleatori : Introduzione – Parte I
8. Reti di Code Nella maggior parte dei processi produttivi risulta troppo restrittivo considerare una sola risorsa. Esempio: linea tandem arrivi 1 v.
Canale A. Prof.Ciapetti AA2003/04
Appunti di inferenza per farmacisti
Ufficio Studi UNIONCAMERE TOSCANA 1 Presentazione di Riccardo Perugi Ufficio Studi UNIONCAMERE TOSCANA Firenze, 19 dicembre 2000.
Realizzazione e caratterizzazione di una semplice rete neurale per la separazione di due campioni di eventi Vincenzo Izzo.
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
Il linguaggio Fortran 90: 4. Array: Vettori e Matrici
ISTOGRAMMI E DISTRIBUZIONI : i xixi
Esercizi x1=m-ts x2=m+ts
Valutazione della stima: gli intervalli di confidenza
per la Collaborazione BaBar
VERIFICA DEI RIFLESSI …Tutto ciò che avreste voluto sapere e non avete mai osato chiedere… M. & D.
Master universitario di II livello in Ingegneria delle Infrastrutture e dei Sistemi Ferroviari Anno Accademico 2012/2013 Cultura dimpresa, valutazione.
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Scritte scritte scritte scritte scritte scritte scritte Scritte scritte Titolo.
Cos’è un problema?.
CALCIO SKY 2007 – 2008 PROFILO DI ASCOLTO. 2 INDICE DEGLI ARGOMENTI Profilo di ascolto CALCIO SERIE A 2007 – 2008 Totale campionato (tutte le partite)……………………………………………….
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
Lezione 8 La valutazione dello scarto per “fuori tolleranza”
Ropol09anci INDAGINE SU PATTO DI STABILITA 2009 IN PIEMONTE ANCI PIEMONTE Torino, 29 giugno 2009.
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE.
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
ISTITUTO COMPRENSIVO “G. BATTAGLINI” MARTINA FRANCA (TA)
1)Completa la seguente successione: C4, B7, E10, D13, G16,. A. G19 B
Bando Arti Sceniche. Per poter procedere è indispensabile aprire il testo del Bando 2ROL - Richieste On Line.
Le distribuzioni campionarie
Un trucchetto di Moltiplicazione per il calcolo mentale
1 Ly-LAB Sistema di gestione dei dati analitici di laboratorio.
Il caos quantistico nelle reazioni chimiche triatomiche
Esempi risolti mediante immagini (e con excel)
1Piero Scotto - C14. Finalità del corso Programma Materiale Requisiti Spendibilità 2Piero Scotto - C14.
Sviluppare un programma in C che, dato un array da 100 elementi interi caricato con numeri casuali compresi tra [10,100], sia in grado di cercare il valore.
STATISTICA CHEMIOMETRICA
Laurea Ing EO/IN/BIO;TLC D.U. Ing EO 10 PROBABILITA’ E VARIABILI ALEATORIE.
Esercizi Due gruppi di studenti effettuano la misura della densità di un oggetto, trovando rispettivamente i valori 13.7 ± 0.9 g/cm3 e ± 1300 kg/m3.
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
Misure esclusive ed inclusive di |V cb | nei decadimenti semileptonici dei mesoni B Diego Monorchio Università “Federico II” di Napoli e INFN Incontri.
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
1 Calcolo delle sezioni d’urto π + π - γ e μ + μ - γ in Kloe attraverso l’indagine statistica LABORATORI NAZIONALI DI FRASCATI STAGES ESTIVI RESIDENZIALI.
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Transcript della presentazione:

Il caso delle misure di eventi rari Caterina Bloise Incontri di Fisica LNF-INFN, 2 ottobre 2007

Scelta degli argomenti I risultati delle misure Determinazione del livello di confidenza di un risultato Il caso (molto comune) della ricerca di eventi rari Estrazione del segnale in presenza di fondo Trattamento delle fluttuazioni statistiche Trattamento delle sistematiche Tutti esemplificati Motivazioni Sono tutte questioni ampiamente dibattute Facilmente esemplificabili Di interesse generale LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

I risultati delle misure Il risultato si vuole che contenga l’informazione del processo di misura che lo determina, un processo complesso in cui sono coinvolti la strumentazione e la capacità sperimentale di controllo, i criteri per la selezione degli eventi di interesse, le fluttuazioni statistiche del campione. Possiamo esemplificare bene la procedura che porta alla determinazione del risultato focalizzando le argomentazioni al caso della ricerca di eventi rari. Questa presuppone, schematicamente, una procedura di selezione la valutazione della composizione del campione selezionato la determinazione del numero di eventi di cercati (segnale), estratta dal conteggio del campione selezionato (s+b) la valutazione degli intervalli di confidenza del risultato in connessione alle fluttuazioni statistiche e alle sistematiche LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Selezione degli eventi Bisogna definire un set di variabili discriminanti in grado di separare il segnale dal fondo e un set di loro valori (tagli) in base ai quali effettuare la selezione Il campione selezionato sarà composto di un numero di eventi n n = s + b = es S + eb B s = P ( accept | s ), b = P ( accept | b ) LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Un esempio di procedura selettiva “Ke2” a KLOE Le predizioni del Modello Standard sono confermate oggi con incredibile precisione dagli esperimenti L’aspetto insoddisfacente è l’incapacità di motivare il numero e la massa di quark e leptoni La ricerca di fenomeni di nuova fisica comprende una serie di processi soppressi e calcolabili con precisione nell’ambito del Modello Standard. Un risultato diverso indicherebbe effetti nuovi nel settore indagato La ricerca di decadimenti K  en (Ke2) ricade in questa classe, in questo caso la frequenza aspettata è 1.4/105 LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

M2lep= (EK-Plep)2 – (Plep)2 Ricerca di nuova fisica: “Ke2” a KLOE Sperimentalmente bisogna identificare questi eventi, isolandoli dal canale 40,000 volte più frequente K  mn (Km2) Gli eventi sono caratterizzati a KLOE da impulsi diversi dei secondari carichi. L’ottima ma comunque finita precisione della misura dell’impulso impone l’introduzione di ulteriori variabili discriminanti m e E1 E2 E5 Cluster depth Calorimeter T.Spadaro, Pechino 07 MC Km2 MC Ke2 per Km2 ~1.1 104 M2lep= (EK-Plep)2 – (Plep)2 per Ke2 ~0.2 M2lep (MeV2)

Variabili discriminanti “Ke2” a KLOE MC Km2 MC Ke2 Emax(MeV) ERMS(MeV) Af -0.4 -0.8 0.4 0.8 100 40 120 200 300 80 1 2 3 4 MC Ke2 MC Km2 T.Spadaro, Pechino 07

Risultati della selezione “Ke2” a KLOE La procedura è in grado di selezionare il segnale con = 0.6, riducendo il fondo allo 0.2% del valore iniziale L’analisi di un ulteriore campione, K  p e n, permette di controllare le incertezze dovute alla simulazione. M2lep (MeV2) MC Km2 w/o PID MC Km2 w PID MC Ke2 w/o PID MC Ke2 w PID Data w/o PID Data w PID T.Spadaro, Pechino 07

Conteggio del segnale “Ke2” a KLOE · Data Data ERMS (MeV) ° MC Fit Una procedura di fit del likelihood nel piano ERMS vs M2lep permette, conosciute le p.d.f. di segnale e background, di ottenere il conteggio di b e s (s = 8090±160) M2lep (MeV2) Data Fit region ERMS (MeV) · Data ° MC Fit  MC bkg -4000 400 800 -2000 2000 4000 40 1200 80 120 T.Spadaro, Pechino 07 LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Determinazione del livello di confidenza Data la distribuzione P(x|m) si individuano i valori di x più improbabili fino ad ottenere una somma di probabilità leggermente minore o uguale a g: tali valori sono intesi come utili a rigettare l’ipotesi che il risultato della misura sia m L’operazione si ripete per ogni m LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Intervalli di confidenza m n m - m + 68% 16% P(n|m) = e-m mn /n! Per ogni m la probabilità che n sia compreso nell’intervallo centrale è del 68% o appena superiore per costruzione Per ogni n, m è compreso tra [m-,,m+] con livello di confidenza del 68% n = 3  [2.16, 3.38]  m = 3-0.84 +0.38 La tecnica è la stessa per ogni C.L., sia esso centrale, sia un limite superiore [0, m+], o inferiore [m-, ∞] Se la determinazione sperimentale di x è n, siamo in grado di selezionare tra tutti i valori di m quelli “compatibili” con n, per cui n non è compreso tra i valori individuati nell’operazione precedente L’intervallo di m ottenuto conterrà il valore del parametro misurato con probabilità ≥ 1 - g. LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Estrazione del segnale in presenza di fondo P(n|s) = e-(s+b) (s+b)n /n! Un’analoga regione, traslata di b, si ottiene quando si vuole misurare un segnale in presenza di fondo b La costruzione indica zone scoperte, con risultati nella regione di s non fisica,in caso di sottofluttuazione nel background La costruzione degli intervalli per i limiti superiori rimane indipendente e diversa da quella degli intervalli centrali Questi aspetti sono inerenti la costruzione degli intervalli di confidenza che è indipendente dalla prossimità della regione non fisica dei valori dei parametri G.Feldman e R.Cousins,Phys.Rev.D,57(1998),3873 intervalli centrali, di 90% C.L. con fondo b = 3 LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Sottofluttuazioni del fondo P(n|s) = e-(s+b) (s+b)n /n! n = 5, b = 0.9  s = 4.1-2.16 +3.38 n = 5, b = 4.9  s = 0.1-2.16 +3.38 ? n = 5, b = 6.9  s =-1.9-2.16 +3.38 ? n = 5, b = 10.9  s = -5.9-2.16 +3.38 ? Corretto se si ricorda l’intera procedura e che ci si aspetta per costruzione di rigettare l’ipotesi giusta sul parametro con probabilità del 32% Un risultato che tenga conto della regione fisica del parametro sarebbe comunque di più facile lettura LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Ordinamento della p.d.f. P(n|s) = e-(s+b) (s+b)n /n! Feldman e Cousins hanno proposto un diverso principio di ordinamento per la costruzione degli intervalli di confidenza Ad ogni n viene assegnato un rango in base al rapporto P(n|s) / P(n|sbest) sbest nel caso della poissoniana è max{0, n-b} Per costruire gli intervalli [n-(s), n+(s)] si utilizzano gli n in ordine decrescente di rango fino ad integrare una probabilità pari al C.L. G.Feldman e R.Cousins,Phys.Rev.D,57(1998),3873 intervalli centrali, di 90% C.L. con fondo b = 3 LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Limiti superiori sul segnale P(n|s) = e-(s+b) (s+b)n /n! n = 5, b = 0.9  s = 4.1-2.35 +2.71 n = 5, b = 4.9  s < 2.81 (5.0) n = 5, b = 6.9  s < 1.23 (3.2) n = 5, b = 10.9  s < 0.35 (1.7) G.Feldman e R.Cousins,Phys.Rev.D,57(1998),3873 Limiti sul segnale più stringenti per sottofluttuazioni del background più improbabili Situazione attesa. Quando la sottofluttuazione è estremamente improbabile la valutazione del background diventa sospetta LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Evidenza di segnale FC: Intervalli @90% C.L., b = 3 s Per n> 6 si passa da limiti superiori a intervalli di confidenza per s Per ottenere un livello di falsi segnali inferiore all’1% con b = 3 è richiesto n ≥ 9 n LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Dal Report su Chernobyl n = 19  [15,24] 68% C.L. ; [12.5,27.5] 90% C.L.; [11,29] 95% C.L. indicativo della precisione del numero atteso o sovrafluttuazione di 2s ? Intervalli di confidenza, C.L. a = 0.68, limiti superiori per a = 0.90 n = 22 b = 6.78 [10.6, 20.5] b= 11.7-2.5 +3.1 [5.7, 15.6] n = 7 b = 4.87 < 7.6 b= 8.4 < 4.2 n = 0 b = 2.59 < 0.1 b= 4.5 --- LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Trattamento Bayesiano L’approccio alternativo proposto dagli statisti è quello di considerare le grandezze da determinare variabili, alla stregua delle quantità misurate Assunzione insoddisfacente per molti Il processo di misura è quindi schematizzabile in termini di estrazione della p.d.f. delle grandezze da determinare a partire dalla p.d.f. delle variabili misurate L’operazione presuppone l’introduzione a priori della p.d.f. delle grandezze P(m) Anche la necessità di introdurre P(m) sembra insoddisfacente per l’arbitrarietà della scelta Da un altro punto di vista questo sembra praticamente inevitabile La dipendenza del risultato dalla p.d.f. introdotta a priori va comunque studiata e presentata LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Intervalli credibili Seguendo l’approccio bayesiano si arriva a definire gli intervalli di credibilità [m-,,m+] per le grandezze misurate, corrispondenti ad un livello di confidenza a, invertendo l’equazione rn costante di normalizzazione P(m) uniforme: tutti i valori di m hanno la stessa credibilità a priori P(ln(m)) uniforme  P(m)1/m : tutti i valori di m hanno la stessa credibilità a priori se sono della stessa scala, all’aumentare della scala diventano proporzionalmente più improbabili LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Intervalli credibili – prior uniforme Se n=0 = x m m m Posterior P( m ) P(0 events| m) (Likelihood) Prior: uniform 3 P(m ) dm = 0.95 Stesso limite superiore del caso frequentista LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Intervalli credibili, dipendenza da b Se n=0 il limite superiore non dipende da b 1.-s+ = a  s+ = -ln( 1.- a ) s+ = 2.3 @ 90% C.L. s+ = 3.0 @ 95% C.L. s+ = 4.6 @ 99% C.L. Riflette il fatto che in questo caso sappiamo precisamente che il valore ottenuto nb = 0 Prior: uniform LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Intervalli credibili – prior  1/m Se n=0 = x m m m Posterior P( m ) P(0 events| m) (Likelihood) Prior: uniform in ln m 3 P(m ) dm » 0.95 LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Intervalli di confidenza usando le likelihood Si utilizzano i valori della grandezza da misurare corrispondenti a log(L) = log(LMAX) – ½ : 68% C.L. log(L) = log(LMAX) – 1.35 : 95% C.L. Se n = 5  m = 5.0-1.9 +2.6 @ 68% C.L. m LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Il caso di più parametri Si fissa un parametro, b, e si trova l’intervallo per a usando ln L=-½ Si fissa a, e si trova l’intervallo per b usando ln L=-½ Il rettangolo individuato è relativo a un C.L. 0.682=46% L’ellisse tangente è relativa a un C.L. a = 39% In generale le curve di uguale likelihood L circoscrivono una regione nello spazio dei parametri relativa ad un C.L. a dato da P(2 ,N) = a, con 2 = 2ln L e N numero di parametri L(a,b) b a LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Trattamento delle sistematiche Si ripete la costruzione degli intervalli utilizzando la poissoniana o la funzione di verosimiglianza, likelihood, convoluta con il prodotto delle gaussiane che tengono conto delle incertezze sul valore del fondo e delle sistematiche sull’efficienza nella selezione del segnale LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Effetto degli errori sistematici N_obs b Sys. Unc. % Intervalli per m 2 0.0 [0,3.90] 0.2 [0,3.95] 0.3 [0,4.10] 0.4 [0,4.65] 6 [1.1,9.45] [1.05,10.05] [1,05,11.50] [1.05,13.35] LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Ricerca di eventi Ksp0p0p0 Previsto nel Modello Standard con frequenza 2/109 in quanto può avvenire solo attraverso processi che violano CP Il fondo è costituito da Ksp0p0 che è 150 milioni di volte più frequente n = 4 b = 3.2±1.5 Db = 0 m < 5.3, 90% C.L. Db/b = 0.4 m < 5.8, 90% C.L. LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Ricerca di eventi t  mg a Belle Decadimento vietato nel Modello Standard ma possibile in Modelli Supersimmetrici, che prevedono la violazione del numero leptonico b = 13.9-4.8 +6.0 n=10 Db = 0 m < 3.3, 90% C.L. Db/b = 0.4 m < 3.6, 90% C.L. Usando la funzione di verosimiglianza Belle ha pubblicato un limite leggermente migliore, corrispondente a m < 2.2, 90% C.L. LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Il fenomeno delle oscillazioni di particella Fenomeno quanto-meccanico governato da massa e vita medie delle particelle coinvolte Analisi che utilizza la funzione di likelihood, L= 1 -(+) A cos(Dms t) LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Conclusioni I risultati si vorrebbe compendiassero molteplici aspetti della misura per garantire un confronto semplice e affidabile con altri esperimenti e con le previsioni teoriche La costruzione degli intervalli di confidenza è cruciale da questo punto di vista. Diverse procedure sono utilizzate per la definizione degli intervalli di confidenza. Per essere accettabili devono garantire la copertura dei valori compatibili con le variabili misurate al livello di confidenza dichiarato. Le procedure più comunemente utilizzate vincolano i risultati nella regione fisica La definizione degli intervalli attraverso le likelihood è ampiamente utilizzata perché permette di includere direttamente dettagli sperimentali e vincoli fisici LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

Profile likelihood function Χ2 approximation Profile likelihood function 2 log L(b_max …) ≈ Χ2 Chi2 = 2.71 Constant for n given sl su LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

LNF-INFN, Frascati C. Bloise- 2 ottobre 2007

kkkk G.Feldman e R.Cousins,Phys.Rev.D,57(1998),3873 LNF-INFN, Frascati C. Bloise- 2 ottobre 2007