STATISTICA CHEMIOMETRICA

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Le distribuzioni di probabilità continue
progetto SCIENTIA MAGISTRA VITAE
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
2. Introduzione alla probabilità
Approccio metodologico esperienziale all’astronomia: presupposti
Proprietà degli stimatori
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Analisi dei dati per i disegni ad un fattore
Elementi di statistica Elementi di statistica M. Dreucci Masterclasses LNF Elementi di statistica M. Dreucci.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
CONFRONTO TRA DUE MEDIE:
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
Esercizi x1=m-ts x2=m+ts
DALL'INTERVALLO DI PROBABILITÀ
RELAZIONE LINEARE: I MINIMI QUADRATI (cenni)
La distribuzione normale e normale standardizzata
ISTOGRAMMI E DISTRIBUZIONI:
DIFFERENZA TRA LE MEDIE
Introduzione alla fisica
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 5: propagazione degli errori
Corso di biomatematica lezione 9: test di Student
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 4: La funzione di Gauss
Corso di biomatematica lezione 7-2: Test di significatività
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a LA STATISTICA INFERENZIALE
ISTOGRAMMI E DISTRIBUZIONI : i xixi
Esercizi x1=m-ts x2=m+ts
Valutazione della stima: gli intervalli di confidenza
VERIFICA DEI RIFLESSI …Tutto ciò che avreste voluto sapere e non avete mai osato chiedere… M. & D.
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
Parte I (introduzione) Taratura degli strumenti (cfr: UNI 4546) Si parla di taratura in regime statico se lo strumento verrà utilizzato soltanto per misurare.
Il test di ipotesi Cuore della statistica inferenziale!
Verifica delle ipotesi su due campioni di osservazioni
Grandezze e Misure.
Esercitazioni sul calcolo dei valori critici
Le distribuzioni campionarie
PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
TRATTAMENTO DEI DATI ANALITICI
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Le misure sono osservazioni quantitative
PROPAGAZIONE DEGLI ERRORI:
Esercizi Due gruppi di studenti effettuano la misura della densità di un oggetto, trovando rispettivamente i valori 13.7 ± 0.9 g/cm3 e ± 1300 kg/m3.
Statistica Descrittiva
Domande riepilogative per l’esame
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
“Teoria e metodi della ricerca sociale e organizzativa”
Test basati su due campioni Test Chi - quadro
Elementi di statistica Le cifre significative
Intervalli di confidenza
Elementi di statistica La stima del valore vero
Elaborazione statistica di dati
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Problemi analitici quantitativi I metodi chimico-analitici strumentali hanno lo scopo di quantificare o di determinare proprietà chimico-fisiche di uno.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
Trattamento dei dati sperimentali
Transcript della presentazione:

STATISTICA CHEMIOMETRICA per il corso di CHIMICA ANALITICA E CLINICA Laurea Specialistica in Scienze Biologiche Sanitarie 1) TESTO 1 Luigi Spandrio “Principi e Tecniche di Chimica Clinica” PICCIN, 2001 Riferimenti bibliografici 2) TESTO 2 Elio Desimoni, Barbara Brunetti “Assicurazione di qualità nel laboratorio chimico Validazione dei metodi di analisi” CLUEB, 2003 Argomenti Metodi quantitativi ed errori in Chimica Analitica (Spandrio, Cap. 4 e dispense) Qualità del dato analitico e validazione (Spandrio, Cap. 5 e Desimoni: diapo 1-8,11, 14, 17, 21, 186-192, 196, 206-208)

Misurazione: è la determinazione analitica vera e propria. •Tecnica analitica è l’insieme di principi teorici e accorgimenti sperimentali che sfrutta un fenomeno scientifico fondamentale per ottenere un’informazione sulla composizione di un certo campione. •Metodo analitico è l’applicazione di una tecnica analitica per risolvere un problema analitico specifico. •Procedura è l’insieme delle istruzioni base necessarie per utilizzare un metodo analitico. •Protocollo è l’insieme delle istruzioni e direttive dettagliate da eseguire rigidamente affinché il risultato possa essere accettato per fini particolari. Misura: è un’informazione costituita da un numero, un’incertezza ed un’unità di misura. Misurazione: è la determinazione analitica vera e propria.

PROCEDURA ANALITICA TOTALE 1. Definizione generale del problema. (cliente) 2. Definizione analitica del problema. (cliente - analista) 3. Scelta del metodo, tecnica, procedura ed eventuale protocollo. (analista) 4. Campionamento. (cliente-analista) 5. Trattamento del campione. (analista) 6. Analisi. (analista) 7. Elaborazione. (analista) 8. Relazione. (cliente-analista) TRATTAMENTO DATI Procedimento per estrarre da un set di dati numerosi dei valori descrittori che caratterizzano il set di dati Errore: - grossolano - sistematico - casuale Livello di confidenza Livello di significatività

STATISTICA DELLE MISURE RIPETUTE misura di una grandezza X f x m s w1/2 Ripetendo infinite volte una misura, la distribuzione dei valori ottenuti come risultato della misura è gaussiana (o normale). Una curva gaussiana ha: Punto di massimo: x=m Massimo: Punti di flesso: x=m ± s Larghezza a metà altezza

STATISTICA DELLE MISURE RIPETUTE misura di una grandezza X f x m s m +t s m - t s Il punto di massimo è il VALORE VERO m . La semidistanza tra i flessi è la DEVIAZIONE STANDARD s La migliore stima di m è la MEDIA La migliore stima di s è n= numero di misure n-1= numero di gradi di libertà È nota e tabulata la probabilità P che una misura cada nell’intervallo x =(m ± t s ) cioè z = ± t

STATISTICA DELLE MISURE RIPETUTE misura di una grandezza X f x m s m +t s m - t s Ripetendo una misura singola per l’n+1esima volta, abbiamo probabilità Ps che essa cada nell’intervallo, detto INTERVALLO DI CONFIDENZA: Ripetendo n misure abbiamo probabilità Ps che la nuova media cada nell’INTERVALLO DI CONFIDENZA Il parametro t dipende dal livello di probabilità Ps scelto e dal numero di misure.

STIMA DEL’ERRORE PROPAGAZIONE DEGLI ERRORI

ESEMPIO: Stimare la deviazione standard di un dato ottenuto con spettrofotometria UV-Vis sapendo: A=0,529 (s=7,0 X 10-3) e=7900 M-1 cm-1 (s=200 M-1 cm-1 ) b=0.1 cm (s=1,0 X10-3 cm)

PRESENTAZIONE DEI RISULTATI NUMERICI cifre significative Cifre significative = tutte le cifre certe più la prima su cui cade l’errore. La prima cifra incerta è determinata dal numero che dà l’errore, espresso con una sola cifra significativa Es: 0.0137995 ± 0.0003 = 0.0138 ± 0.0003 Esprimendo il risultato numerico in forma esponenziale, le cifre significative sono quelle del fattore pre-esponenziale Esempi: 0.00017368 (errore su 8) = 1.7368 10-4 ha 5 cifre significative 1349000(errore sul 9) = 1.349 106 ha 4 cifre significative ADDIZIONI O SOTTRAZIONI:il risultato ha numero di decimali come il dato a minor cifre decimali (155,5±0,1) + (0,085±0,0011) = 155,585( ±0,1)=155,6 PRODOTTI O QUOZIENTI: il risultato ha numero di cifre significative pari al fattore con minor numero di cifre significative: 2,3567*8,45=19,914115=19.9 10.348/6,24=1,65833=1,66

TEST DI SIGNIFICATIVITÀ LIVELLO DI CONFIDENZA = P LIVELLO DI SIGNIFICATIVITÀ: a = 1 - P Nel caso di misure ripetute distribuite normalmente, il LIVELLO DI CONFIDENZA è l’area sottesa dalla funzione distribuzione sull’intervallo di confidenza, il LIVELLO DI SIGNIFICATIVITÀ è l’area sottesa dalla funzione distribuzione sulle “code” f x m s m +t s m - t s IPOTESI NULLA (H0)= ipotesi che un valore misurato appartenga alla popolazione rappresentata da una certa distribuzione TEST DI SIGNIFICATIVITÀ = stabilire se l’ipotesi nulla è vera ad un certo livello di confidenza P ovvero di significatività a =1-P

TEST DI SIGNIFICATIVITÀ confronto tra un risultato sperimentale ed il valore noto f X Xnoto Non c’è differenza significativa tra e Xnoto

TEST DI SIGNIFICATIVITÀ Esempio: TEST DI SIGNIFICATIVITÀ confronto tra un risultato sperimentale ed il valore noto Si sottopone un campione a concentrazione (c) nota Ad un determinato metodo analitico. Si vuole quindi determinare se tale metodo dà il risultato atteso. Eseguendo 3 misure si ottiene: X1= 38.9 ppb X2= 37.4 ppb X3= 37.1 ppb Quindi: xmedio= 37.8 ppb s=0.964 ppb ttab= 4.3 per livello confidenza 95% e numero gradi di libertà=2 toss= 1.98 Poichè toss<ttab , H0 è accettata, cioè non c’è diffeerenza significativa tra il risultato ottenuto ed il valore vero ad un livello di confidenza del 95%. X = 37.8±4.3(0,964/(3)1/2)= 37.8± 2.4

TEST DI SIGNIFICATIVITÀ confronto tra medie Assumiamo che le due medie appartengano a popolazioni aventi uguale deviazione standard Confrontare due medie e equivale a confrontare la loro differenza con lo zero. Si esegue un t-test analogo al precedente: Non c’è differenza significativa tra e n1= numero di misure ripetute per ottenere n2= numero di misure ripetute per ottenere Numero gradi di libertà: n1+n2-1 s21= varianza delle misure ripetute per ottenere s22= varianza delle misure ripetute per ottenere

TEST DI SIGNIFICATIVITÀ Esempio: TEST DI SIGNIFICATIVITÀ confronto tra medie Due metodi hanno dato i seguenti risultati sullo stesso campione: X1= 28.0 ppm s1= 0.3 ppm n° misure= 10 X2= 26.3 ppm s1= 0.2 ppm n° misure= 9 S= 0.258 toss = (28.0-26.3)/[0.258(1/10+1/9)1/2] =14.3 ttab = 2.11 con un livello di confidenza pari a 95% e con 17 gradi di libertà Poichè toss>ttab , H0 è rifutata, cioè c’è diffeerenza significativa tra i due risultati

TEST DI SIGNIFICATIVITÀ test delle differenze accoppiate Il test delle differenze accoppiate si applica quando si abbiano h campioni diversi e su ciascuno si esegua una singola misura col metodo 1 e una singola misura col metodo 2.   Siano: xi,1 il risultato ottenuto sul campione i-esimo col metodo 1 xi,2 il risultato ottenuto sul campione i-esimo col metodo 2   h-1 gradi di libertà Per verificare se ci sia differenza significativa tra i vari risultati ottenuti con le due tecniche, si fa l’ipotesi nulla che d=0 e si esegue un t-test con:

TEST DI SIGNIFICATIVITÀ test delle differenze accoppiate Esempio: TEST DI SIGNIFICATIVITÀ test delle differenze accoppiate Se ci sono h campioni diversi e su ognuno eseguo una misura con il metodo1 ed una misura con il Metodo2: Campione met1 met2 d 71 76 -5 61 68 -7 50 48 +2 60 57 +3 dmedio= -1.75 Sd=2.5 toss=0.7 Ttab0,005;3=3.18 Poichè toss<ttab , H0 è accettata, cioè i due metodi danno risultati non significativamente diversi

TEST DI SIGNIFICATIVITÀ ANOVA Þ Non c’è differenza significativa tra le due varianze

Q-TEST per la verifica dei dati anomali (valore sospetto-valore più vicino)/(valore massimo-valore minimo) Qoss< Qtab Il dato sospetto non è rigettabile TEST 2 per la verifica della normalità della distribuzione (n>50) TEST della frequenza cumulativa per la verifica della normalità della distribuzione (n<50)

ACCURATEZZA: ESATTEZZA E PRECISIONE Si definisce ACCURATEZZA la contemporanea sussistenza di ESATTEZZA e PRECISIONE Si definisce ESATTEZZA l’accordo tra il valor medio ottenuto da un ampio set di misure e un valore di riferimento accettato (ISO 3534-1, 1993). La mancanza di esattezza è principalmente in relazione con gli errori sistematici Si definisce PRECISIONE l’accordo, ovvero la vicinanza reciproca, tra i risultati di più misure replicate. La mancanza di precisione è principalmente in relazione con gli errori casuali RIPETIBILITÀ E RIPRODUCIBILITÀ Si definisce RIPETIBILITÀ la precisione ottenuta con lo stesso operatore, la stessa strumentazione, in un breve lasso di tempo

ESATTEZZA E PRECISIONE Metodo1. non preciso non esatto Metodo3. non preciso esatto Metodo4. preciso esatto Metodo2. preciso non esatto

CALIBRAZIONI Nella quasi totalità dei metodi analitici quantitativi il dato di quantità incognita viene ottenuto per interpolazione sulla CURVA DI CALIBRAZIONE. Si definisce CURVA DI CALIBRAZIONE il grafico che riporta il segnale analitico (S) in funzione della quantità di analita (q) e viene ottenuta sottoponendo a misura degli standard a quantità nota di analita

INTERVALLO DINAMICO E LINEARE Si definisce INTERVALLO DINAMICO quell’intervallo di quantità di analita entro il quale il SEGNALE ANALITICO varia al variare della quantità stessa Si definisce INTERVALLO LINEARE un intervallo dinamico entro il quale il SEGNALE ANALITICO varia linearmente al variare della quantità di analita A c SENSIBILITÀ Si definisce SENSIBILITÀ di un metodo analitico la PENDENZA della curva di calibrazione.

REGRESSIONE LINEARE retta: y=a+ b x x1 xi xn y1 yi yn

La retta è una buona approssimazione REGRESSIONE LINEARE COEFFICIENTE DI CORRELAZIONE LINEARE (R) La retta è una buona approssimazione dell’andamento dei punti sperimentali se R ha valore vicino ad 1

CALIBRAZIONE CON STANDARD ESTERNI INTERPOLAZIONE x1 xi xn y1 yi yn y0 x0 m = numero di ripetizioni per y0

Concentrazione Mn (ppm) Esempio Calibrazione con standard esterni Determinazione ICP/OES (Mn) Concentrazione Mn (ppm) Segnale 200 100 2200 250 5200 500 10200 1000 20200 2000 40200 1340 27000 minimi quadrati lineari: segnale = a*conc. + b

METODO DELLE AGGIUNTE STANDARD CALIBRAZIONE CON IL METODO DELLE AGGIUNTE STANDARD SA SX OE OS CA xE

METODO DELLE AGGIUNTE STANDARD CALIBRAZIONE CON IL METODO DELLE AGGIUNTE STANDARD Il campione viene suddiviso in più aliquote dello stesso volume (almeno 3). Un’aliquota viene lasciata inalterata, agli altri sub-campioni si addizionano quantità crescenti dell’analita, aggiungendo piccoli volumi di una soluzione standard della specie in esame a concentrazione nota e portando a volume in recipiente tarato. Si effettua la misura su ciascuna soluzione e si costruisce il grafico:

Esempio Calibrazione con metodo delle aggiunte Determinazione del rame in un campione di sangue. Il campione è di 15 mL e viene diviso in 3 aliquote da 5 mL ognuna. -Alla prima aliquota non viene aggiunto nulla, -alla seconda vengono aggiunti 5 mL di una soluzione standard di cloruro di rame a 100 ng/mL -Alla terza aliquota vengono aggiunti 100 mL della stessa soluzione standard (v Tabella). Il rame aggiunto è 0 ng/mL nella prima soluzione, 0.1 ng/ml nella seconda e 0.2 ng/mL nella terza e le relative risposte strumentali sono: 0.2 per il primo campione, 0.31 per il secondo campione e 0.41 per il terzo. Si costruisce la retta con questi punti e per estrapolazione si calcola la concentrazione di rame presente nel campione = 0.17 ppm Aliquota 3 Aliquota 2 Aliquota 1

METODO DELLO STANDARD INTERNO CALIBRAZIONE CON IL METODO DELLO STANDARD INTERNO Gli n campioni standard da sottoporre a misura allo scopo di costruire una retta di taratura, etichettati con i=1,…,n, contengono quantità note xi dell’analita, variabili da standard a standard, e contengono una quantità nota z, uguale per tutti gli standard, di uno STANDARD INTERNO. La retta di taratura si costruisce riportando il rapporto tra il segnale (Sx) dell’analita e il segnale (Sz) dello standard in funzione del rapporto tra x e z.

LIMITE DI RIVELABILITA’ f LIMITE DI RIVELABILITÀ (yLOD) = il minimo segnale significativamente diverso da quello del bianco LIMITE DI RILEVABILITÀ (xLOD) = la quantità di analita che corrisponde al limite di rivelabilità

DETERMINAZIONE DEL LOD DALLA RETTA DI REGRESSIONE LINEARE y x Retta di regressione: y = a + b x

DETERMINAZIONE DEL LoD DAL RAPPORTO SEGNALE/RUMORE

VALIDAZIONE TEST DI ESATTEZZA TEST DI PRECISIONE VALIDARE un metodo analitico significa attestarne l’ESATTEZZA e la PRECISIONE TEST DI ESATTEZZA SI APPLICA UN TEST DI SIGNIFICATIVITÀ PER IL CONFRONTO TRA MEDIE AD UNO DEI CASI SEGUENTI TEST DI PRECISIONE SI APPLICA UN TEST ANOVA PER IL CONFRONTO TRA DEVIAZIONI STANDARD AD UNO DEI CASI SEGUENTI 1) USO DI MATERIALI DI RIFERIMENTO 2) USO DI UN METODO DI RIFERIMENTO VALIDATO 3) USO DI CAMPIONI FORTIFICATI (SPIKING)