La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Lecco, 15 dic 2005Francesco Ronzon 1 Statistica applicata allanalisi microbiologica.

Presentazioni simili


Presentazione sul tema: "Lecco, 15 dic 2005Francesco Ronzon 1 Statistica applicata allanalisi microbiologica."— Transcript della presentazione:

1 Lecco, 15 dic 2005Francesco Ronzon 1 Statistica applicata allanalisi microbiologica

2 Lecco, 15 dic 2005Francesco Ronzon 2 Licenza Tu sei libero: di riprodurre, distribuire, comunicare al pubblico, esporre in pubblico, rappresentare, eseguire o recitare questopera di creare opere derivate alle condizioni citate in: per informazioni contatta Francesco Ronzon e.mail: Questa presentazione è parte del progetto:

3 Lecco, 15 dic 2005Francesco Ronzon 3 Obiettivo presentare statistica applicata allanalisi microbiologica con approccio pragmatico chiarire aspetti relativi al corretto utilizzo di alcune tecniche statistiche e loro significato interpretativo

4 Lecco, 15 dic 2005Francesco Ronzon 4 Quadro generale Perché la statistica? difficoltà intrinseche allanalisi microbiologica (fattori della variabilità) alta variabilità = bassa qualità Con la Statistica voglio: – Tenere sotto controllo variabilità – Valutare metodi – Avere una misura dellerrore delle mie affermazioni (valutazione quantitativa dellincertezza) Quale parte della statistica si applica nel laboratorio di microbiologia? Oggi vedremo

5 Lecco, 15 dic 2005Francesco Ronzon 5 Argomenti affrontati Statistica descrittiva e inferenziale Concetti di base Distribuzioni statistiche Stime, Intervalli di confidenza, Test La variabilità nel campione microbiologico Test specifici del laboratorio microbiologico Esercizi pratici

6 Lecco, 15 dic 2005Francesco Ronzon 6 Iniziamo…

7 Lecco, 15 dic 2005Francesco Ronzon 7 Quando entra in gioco la probabilità? Conosco tuttoConosco parte (campione) ! Certezza Incertezza ?

8 Lecco, 15 dic 2005Francesco Ronzon 8 Quadro argomenti

9 Lecco, 15 dic 2005Francesco Ronzon 9 Statistica descrittiva - Grafici

10 Lecco, 15 dic 2005Francesco Ronzon 10 Istogramma

11 Lecco, 15 dic 2005Francesco Ronzon 11 Grafico a torta

12 Lecco, 15 dic 2005Francesco Ronzon 12 Grafici da evitare

13 Lecco, 15 dic 2005Francesco Ronzon 13 Grafici da evitare

14 Lecco, 15 dic 2005Francesco Ronzon 14 Grafici da evitare

15 Lecco, 15 dic 2005Francesco Ronzon 15 Statistica descrittiva - Indici

16 Lecco, 15 dic 2005Francesco Ronzon 16 Statistica descrittiva - Indici Indici di Posizione (ordine di grandezza) Media – Aritmetica – Quadratica Quartili, percentili Moda Mediana Indici di Dispersione (variabilità) Valore max, min Campo di variazione Varianza Deviazione Standard Coefficiente di variazione (CV)

17 Lecco, 15 dic 2005Francesco Ronzon 17 Indici di posizione (misure di tendenza centrale) Media: è il valore medio dei miei dati Mediana: è il valore centrale dei miei dati (dopo che li ho ordinati, dal più piccolo al più grande) Moda: è la caratteristica o valore che si presenta più frequentemente

18 Lecco, 15 dic 2005Francesco Ronzon 18 Indici di posizione Media aritmetica In Excel: MEDIA(dati)

19 Lecco, 15 dic 2005Francesco Ronzon 19 Indici di posizione Media quadratica Esempio: la ripetibilità di conteggio totale del laboratorio è la media quadratica delle ripetibilità dei singoli operatori.

20 Lecco, 15 dic 2005Francesco Ronzon 20 Indici di posizione Mediana È il valore x che mi permette di dire che il 50% dei valori sono maggiori di x ed il 50% sono più minori. 1, 3, 5, 7, 18 3, 5, 7, 9 Mediana = 5 Mediana = 6 In Excel: MEDIANA(dati)

21 Lecco, 15 dic 2005Francesco Ronzon 21 Quartili e percentili Una volta ordinati i dati: Con la mediana li divide in due gruppi: 50% e 50% Con i quartili li divido in 4 gruppi (da 25%) Con i percentili li divido in 100 gruppi (da 1%) – Il 25° percentile viene chiamato primo quartile, – il 50° coincide con il secondo quartile ovvero con la mediana – il 75° percentile viene detto terzo quartile.

22 Lecco, 15 dic 2005Francesco Ronzon 22 Indici di posizione Moda È il valore + frequente (il punto più alto nei grafici di frequenze) Utile per descrivere dati in categorie Es. (8,3,8,9,2,4,3,8,8,4,2,8,5,2,8,8,2,6,8) Moda=8 (Mediana=6, Media=5,58) In Excel: MODA(dati)

23 Lecco, 15 dic 2005Francesco Ronzon 23 Media, moda e mediana - esempio

24 Lecco, 15 dic 2005Francesco Ronzon 24 ma… la posizione non basta distribuzioni con stessa media e variabilità diverse

25 Lecco, 15 dic 2005Francesco Ronzon 25 Indici di dispersione (misure di variabilità) Valore max, min Campo di variazione = max–min (ingl. Range) Deviazione Standard Varianza Coefficiente di variazione (CV)

26 Lecco, 15 dic 2005Francesco Ronzon 26 Deviazione standard (popolazione) In Excel: DEV.ST.POP(dati)

27 Lecco, 15 dic 2005Francesco Ronzon 27 Deviazione standard (popolazione) È espressa nella stessa unità di misura dei dati Detta anche: – Scarto tipo (fr. Écart type) – Scarto quadratico medio – Standard Deviation Da non confondere con Devianza o Errore Standard:

28 Lecco, 15 dic 2005Francesco Ronzon 28 Deviazione Standard suoi effetti = 2 =3 =4

29 Lecco, 15 dic 2005Francesco Ronzon 29 Varianza (popolazione) In Excel: VAR.POP(dati) È il quadrato della deviazione standard È la media dei quadrati delle deviazioni dalla media

30 Lecco, 15 dic 2005Francesco Ronzon 30 Coefficiente di Variazione (popolazione) Misura la dispersione percentuale in rapporto alla media

31 Lecco, 15 dic 2005Francesco Ronzon 31 Coefficiente di Variazione (popolazione) E un numero senza unità di misura, quindi consente di confrontare la variabilità di fenomeni con unità di misura diverse. Uso tipico con numeri positivi e media non nulla detto anche Scarto tipo relativo (fr. Écart type relatif), o Incertezza tipo relativa (e coefficient of variation).

32 Lecco, 15 dic 2005Francesco Ronzon 32 Coefficiente di Variazione (popolazione) Spesso viene espresso in percentuale: si moltiplica per cento e si aggiunge il segno di % ma attenzione a non fare errori in Excel: si scrive solo DEV.ST.POP(dati)/MEDIA(dati)*100 oppure DEV.ST.POP(dati)/MEDIA(dati) e si fa clic su: mai entrambe le operazioni! 2/4 è il 50%, …e non 5000%

33 Lecco, 15 dic 2005Francesco Ronzon 33 Campo di variazione (ingl. Range) Campo di Variazione = MAX – MIN Non confondere con il CV=Coefficiente di variazione Non con con Range (ingl) con rango (e quindi con la funzione RANGE(.) in Excel). In Excel: MAX(dati)-MIN(dati)

34 Lecco, 15 dic 2005Francesco Ronzon 34 Grafici Box-Plot Utili per una visualizzazione grafica della posizione e dispersione, ma… non cè definizione univoca, quindi…attenzione alla legenda! Valore max. III percentile Mediana I percentile Valore min.

35 Lecco, 15 dic 2005Francesco Ronzon 35 Riassumendo la statistica descrittiva mi riassume i dati con pochi indici che mi descrivono la posizione (della curva) e dispersione (larghezza)

36 Lecco, 15 dic 2005Francesco Ronzon 36 Le distribuzioni statistiche Poisson, Normale, Chi quadrato… modelli matematici utili a descrivere popolazioni

37 Lecco, 15 dic 2005Francesco Ronzon 37 Distribuzioni statistiche Alle volte l'uso di modelli matematici mi permette di riassumere tutti i miei dati in pochi parametri (es. regressione, y=a+bx).

38 Lecco, 15 dic 2005Francesco Ronzon 38 Distribuzioni in microbiologia Poisson Binomiale Normale Chi quadrato t di Student

39 Lecco, 15 dic 2005Francesco Ronzon 39 Distribuzione Poisson Famiglia di distribuzioni al variare di >0

40 Lecco, 15 dic 2005Francesco Ronzon 40 Distribuzione Poisson Distribuzione discreta Media=Varianza= senza memoria In Microbiologia descrive bene conta UFC

41 Lecco, 15 dic 2005Francesco Ronzon 41 Distribuzione Binomiale Famiglia di distribuzioni al variare di n e p

42 Lecco, 15 dic 2005Francesco Ronzon 42 Distribuzione Binomiale Media=np Media>Varianza=np(1-p) In Microbiologia descrive bene conta con MPN tuttavia se n, p 0 Bi (.) Poisson(.)

43 Lecco, 15 dic 2005Francesco Ronzon 43 Distribuzione Normale Famiglia di distribuzioni al variare di e

44 Lecco, 15 dic 2005Francesco Ronzon 44 Distribuzione Normale 2,5%

45 Lecco, 15 dic 2005Francesco Ronzon 45 Distribuzione Normale Media = Deviazione Standard= indipendente da È frequente in natura In microbiologia…

46 Lecco, 15 dic 2005Francesco Ronzon 46 Distribuzione Normale …(anche) in microbiologia si usa per approssimare altre distribuzioni: Se >15 Poisson( ) N(, ) Se n>12 Binom(n,p) N(np,np(1-p)) Se n, p 0 Binom(n,p) Poisson( =np) N(np,np) e vale anche: Se k Chi Q. N(k,2k) Se k t di Student N(0,1)

47 Lecco, 15 dic 2005Francesco Ronzon 47 Distribuzione Normale standardizzata

48 Lecco, 15 dic 2005Francesco Ronzon 48 Distribuzione Chi Quadrato Famiglia di distribuzioni al variare di k=g.d.l.

49 Lecco, 15 dic 2005Francesco Ronzon 49 Distribuzione Chi Quadrato Media=k Varianza=2k ed inoltre:

50 Lecco, 15 dic 2005Francesco Ronzon 50 Distribuzione t di Student Famiglia di distribuzioni al variare di k=g.d.l.

51 Lecco, 15 dic 2005Francesco Ronzon 51 Distribuzione t di Student Media=0 Se k allora: t di Student N(0,1)

52 Lecco, 15 dic 2005Francesco Ronzon 52 Chi mi dà percentili delle distribuzioni? TavoleComputer Excel Internet Es. Programmi specifici Es. DistCal

53 Lecco, 15 dic 2005Francesco Ronzon 53 Percentili Chi Quadrato con Excel =INV.CHI(0,01;2)=9,21 9,21 =DISTRIB.CHI(9,21;2)=0,01 1%

54 Lecco, 15 dic 2005Francesco Ronzon 54 Percentili della t di Student in Excel DISTRIB.T(Z;gdl;1) Es. =DISTRIB.T(1,96;99999;1)=0,25 INV.T(p;gdl) Es. =INV.T(0,05;9999)=1,96 DISTRIB.T(Z;gdl;2) Es. =DISTRIB.T(1,96;99999;2)=0,5 - ZZ 2 Code

55 Lecco, 15 dic 2005Francesco Ronzon 55 Percentili della Normale in Excel DISTRIB.NORM(z; ; ;VERO) Es. =DISTRIB.NORM(1,96;0;1;VERO)=0,975 INV.NORM(p; ; ) Es. =INV.NORM(0,95;0;1)=1,96

56 Lecco, 15 dic 2005Francesco Ronzon 56 Probabilità della Poisson in Excel P(X=c)=POISSON(c; ;FALSO) P(X c)=POISSON(c; ;VERO) P(X>c)=1- P(X c) P(a < X b)=P(X b)- P(X a) Esercizio: P(6< X 21)=POISSON(21;12;VERO)-POISSON(6;12;VERO)=0,948 (verifica intervalli confid. al 95% per conteggio su capsula Petri con n=12) Attenzione al limite Excel (x max 150)

57 Lecco, 15 dic 2005Francesco Ronzon 57 dove siamo arrivati?

58 Lecco, 15 dic 2005Francesco Ronzon 58 Statistica inferenziale Ovvero, come descrivere la popolazione partendo da un campione

59 Lecco, 15 dic 2005Francesco Ronzon 59 Statistica inferenziale Quando: Non possiamo o non vogliamo misurare tutta la popolazione Vogliamo comunque descriverla Vogliamo avere una stima degli indici visti fino ad ora, ma entra in gioco lIncertezza e quindi la probabilità: Probabilità = = 0% …100%

60 Lecco, 15 dic 2005Francesco Ronzon 60 Metodo induttivo/deduttivo Inferenza Stima di Cè sovra- dispersione? Test K p Test G 2

61 Lecco, 15 dic 2005Francesco Ronzon 61 Campione Microbiologico inoculi da stessa popolazione non danno stesso UFC Componenti incertezza: Distribuzione casuale (di Poisson) delle cellule microbiche Lettura delle piastre (ripetibilità conteggio) * Volume totale inoculato (ripetibilità dosaggio) * Fattore di diluizione (ripetibilità dosaggio diluente) * * tenuta sotto controllo con valutazione sperimentale della ripetibilità (performance operatori e laboratorio)

62 Lecco, 15 dic 2005Francesco Ronzon 62 Stimatori degli indici descrittivi Popolazione media pop. 2 varianza pop. Campione media campionaria s 2 varianza campionaria Inferenza

63 Lecco, 15 dic 2005Francesco Ronzon 63 Indici campionari Media campionaria Varianza campionaria Deviazione Standard campionaria CV = Coefficiente di variazione campionario

64 Lecco, 15 dic 2005Francesco Ronzon 64 Simbologia (convenzioni) Lettere greche per parametri popolazione – con il cappelletto le relative stime Lettere latine MAIUSCOLE per variabili casuali Lettere latine minuscole per campione (x,u) Media campionaria con trattino sopra Es.

65 Lecco, 15 dic 2005Francesco Ronzon 65 Media campionaria In Excel: MEDIA(dati)

66 Lecco, 15 dic 2005Francesco Ronzon 66 Deviazione standard campionaria In Excel: DEV.ST(dati) DEV.ST.POP(dati)

67 Lecco, 15 dic 2005Francesco Ronzon 67 Varianza campionaria In Excel: VAR(dati)

68 Lecco, 15 dic 2005Francesco Ronzon 68 Coefficiente di Variazione In Excel: DEV.ST(dati)/MEDIA(dati)

69 Lecco, 15 dic 2005Francesco Ronzon 69 Lo statistico trova e dimostra che… Stimatore della vera media è Stimatore della vera varianza è

70 Lecco, 15 dic 2005Francesco Ronzon 70 Come valuto uno stimatore: ? Mediamente deve…indovinarci Deve avere variabilità media piccola Si dimostra che:

71 Lecco, 15 dic 2005Francesco Ronzon 71 Lo stimatore mi dà un solo valore! … è sufficiente? S e un marziano ci chiedesse quanto sono alti mediamente gli esseri umani, e noi gli rispondessimo: - «mediamente 155cm» egli potrebbe immaginare esseri umani alti 5cm ed altri alti 3 metri!. Ci vuole un intervallo di confidenza!

72 Lecco, 15 dic 2005Francesco Ronzon 72 Teorema del limite centrale La media campionaria di un campione si distribuisce come una normale con media pari alla media della popolazione varianza pari a varianza popolazione su n=V(X)/n

73 Lecco, 15 dic 2005Francesco Ronzon 73 Distribuzione uniforme decisamente diversa dalla normale! (grande )! La distribuzione delle medie campionarie (distribuzione campionaria) da una distribuzione non normale dopo anche pochi campioni diventa normale con piccola dispersione! TENDENZA VERO IL LIMITE CENTRALE Intervallo Teorema del limite centrale

74 Lecco, 15 dic 2005Francesco Ronzon 74 Tlc e Intervalli di confidenza Posso sempre costruire intervalli di confidenza sfruttando il TLC

75 Lecco, 15 dic 2005Francesco Ronzon 75 Tlc e Poisson (conteggi con c>15) Nella Poisson media=varianza, quindi sfruttando il TLC Es. Conta singola (n=1) con c=25 Risultato = 25 2*5 = Es. Conta doppia con c=18,32 Risultato = 25 1,4*5= 25 7

76 Lecco, 15 dic 2005Francesco Ronzon 76 Intervalli di confidenza nella Poisson si applica il TLC (e le tavole se a disposizione) si guardano le tavole (ISO 7218) con intervalli di confidenza già calcolati. Calcolo e verifica intervalli della Poisson in Excel

77 Lecco, 15 dic 2005Francesco Ronzon 77 Intervalli di confidenza al 95% Metodo statistico che mi permette di costruire, a partire dai dati sperimentali, un intervallo di valori plausibili. Se applicato a 100 analisi diverse, 95 intervalli (circa) conterranno il vero valore, ma 5 no! …insomma, ci azzecca il 95% delle volte.

78 Lecco, 15 dic 2005Francesco Ronzon 78 Intervalli di confidenza corretta interpretazione Lintervallo di confidenza del n° di batteri di un alimento risultano, nel nostro laboratorio, fuori legge. Prima di provvedere al sequestro un magistrato ci chiede: quale è la probabilità che le analisi siano giuste?. Sig. Magistrato: il mio laboratorio stima, diciamo, intervalli di confidenza allanno; 9500 sono giusti, ma 500 completamente errati. Ora, non so dirle se questo intervallo che le ho dato è esatto oppure no.

79 Lecco, 15 dic 2005Francesco Ronzon 79 Poisson? Ma…sicuri che possiamo applicare ai nostri dati il modello matematico/statistico di Poisson (o la sua approssimazione alla normale? Sì se: i microrganismi sono distribuiti in modo casuale (non uniforme, né a gruppi) Se non ho SOVRADISPERSIONE

80 Lecco, 15 dic 2005Francesco Ronzon 80 Poisson? La Poisson prevede che i micro-organismi siano distribuiti in modo casuale

81 Lecco, 15 dic 2005Francesco Ronzon 81 Sovradispersione nella Poisson Accade quando conteggi mostrano una varianza maggiore della media (quindi una varianza troppo grande). Se Varianza>Media Sovradispersione Se Varianza

82 Lecco, 15 dic 2005Francesco Ronzon 82 Come valuto la sovradispersione? Con un Test statistico: Test K p Test G 2 Si distribuiscono entrambi come una Chi-quadrato Non cè sovradispersione se il test da valori piccoli (rifiuto per valori grandi).

83 Lecco, 15 dic 2005Francesco Ronzon 83 Test di verifica dIpotesi Un test mi aiuta a prendere una decisione. …un po' come un giudice in un processo. L'incertezza implica la possibilità di fare due tipi di errore: Ogni decisione su una certa ipotesi (es. colpevole o innocente) implica due tipi di errori (che spesso non riteniamo di pari gravità). Se qualcuno ci desse una procedura per decidere che tuttavia mi consenta di conoscere la probabilità di uno solo dei due errori: quale errore sceglierei di poter tenere sotto controllo? Definiamo allora Errore di I tipo quell'errore (generalmente è il + grave, ma non è detto). L'ipotesi relativa è detta: Ipotesi nulla: H 0

84 Lecco, 15 dic 2005Francesco Ronzon 84 Test di livello di significatività =5% Definiamo con la probabilità dellerrore di I tipo. Questo valore, detto livello di significatività di un test per H0=innocente =P(rifiutare Ipotesi nulla: H 0 quando essa è vera) non si possono diminuire entrambi gli errori… Prima di fare un test si decide il valore di =0,05 (5%), =0,01 (1%) varia a seconda dei contesti (vedi es. casa farmaceutica)

85 Lecco, 15 dic 2005Francesco Ronzon 85 Test di verifica dellIpotesi significato interpretativo Un Test accetta o rifiuta H 0, non dimostra mai che è H 0 vera o falsa. H 1 è corroborata (sostenuta) o meno dai dati, mai accettata o rifiutata e tanto vera o falsa Si dice test di significatività al 5%, ma …ho due tipi di errore… (ma abbiamo deciso di costruire il test per Ho, che vogliamo tenere sotto controllo). = 5% = P(rifiutare H 0 quando H 0 è vera)=P(err I° tipo) =P(accettare H 0 quando H0 non è vera)=P(err. II° tipo)

86 Lecco, 15 dic 2005Francesco Ronzon 86 Test di verifica dellIpotesi praticamente… Il test è una formula che mi danno gli statistici (+/- complessa e con +/- senza senso logico/intuitivo) premesso che ai dati si possa applicare certi modelli matematici, gli statistici mi dicono che: se lipotesi H 0 è vera, il test deve assumere certi valori (regione di accettazione) con una certa prob. se H 0 è falsa deve assumerne altri (regione di rifiuto). Ergo: calcolo il test con i miei dati e …decido!.

87 Lecco, 15 dic 2005Francesco Ronzon 87 Test G 2 (per valutare sovradispersione) Gli statistici mi dicono di calcolare lespressione: e mi dicono che sotto H 0 allora: se G 2 < 3,84 accetto H 0 se G 2 > 3,84 rifiuto H 0 Con H 0 = ipotesi di assenza di sovradispersione

88 Lecco, 15 dic 2005Francesco Ronzon 88 Test che misurano la bontà di adattamento: G 2 Chi 2 di Pearson = K p Sono test goodness of fit to a distribution che valutano quanto i dati concordano con modello facile ed intuitivo è il H 0 = il modello si adatta Se (f oss f att ) allora Chi 2 0 accetto H 0 Rifiuto per valori grandi

89 Lecco, 15 dic 2005Francesco Ronzon 89 Test che misurano la bontà di adattamento: G 2 Chi 2 di Pearson = K p Chi 2 è approssimazione di G 2 H 0 = il modello si adatta ed entrambe Se (f oss f att ) allora G 2 0 accetto H 0 Rifiuto per valori grandi

90 Lecco, 15 dic 2005Francesco Ronzon 90 Test K p ? Il test Kp è sempre un test di bontà di adattamento (la formula che si utilizza in laboratorio di micro- biologia è K p anziché K p ) 2 che va confrontato con la Chi quadrato con 1 grado di libertà. (si rifiuta per valori alti)

91 Lecco, 15 dic 2005Francesco Ronzon 91 Test di verifica dellIpotesi – Valore p Quando comunico lesito di un test ad altri: dico solo significativo/non significativo (accetto/rifiuto) o posso dire di più? meglio riportare il: valore p= livello di significatività osservato ovvero: il più alto valore di che mi farebbe rifiutare H 0 Se p<0,01 rifiuto H 0 Se 0,010,05 accetto H 0 E un indicatore della plausibilità dellipotesi H 0

92 Lecco, 15 dic 2005Francesco Ronzon 92 Amen


Scaricare ppt "Lecco, 15 dic 2005Francesco Ronzon 1 Statistica applicata allanalisi microbiologica."

Presentazioni simili


Annunci Google