STATISTICA CHEMIOMETRICA per il corso di CHIMICA ANALITICA E CLINICA Laurea Specialistica in Scienze Biologiche Sanitarie 1) TESTO 1 Luigi Spandrio “Principi e Tecniche di Chimica Clinica” PICCIN, 2001 Riferimenti bibliografici 2) TESTO 2 Elio Desimoni, Barbara Brunetti “Assicurazione di qualità nel laboratorio chimico Validazione dei metodi di analisi” CLUEB, 2003 Argomenti Metodi quantitativi ed errori in Chimica Analitica (Spandrio, Cap. 4 e dispense) Qualità del dato analitico e validazione (Spandrio, Cap. 5 e Desimoni: diapo 1-8,11, 14, 17, 21, 186-192, 196, 206-208)
Misurazione: è la determinazione analitica vera e propria. •Tecnica analitica è l’insieme di principi teorici e accorgimenti sperimentali che sfrutta un fenomeno scientifico fondamentale per ottenere un’informazione sulla composizione di un certo campione. •Metodo analitico è l’applicazione di una tecnica analitica per risolvere un problema analitico specifico. •Procedura è l’insieme delle istruzioni base necessarie per utilizzare un metodo analitico. •Protocollo è l’insieme delle istruzioni e direttive dettagliate da eseguire rigidamente affinché il risultato possa essere accettato per fini particolari. Misura: è un’informazione costituita da un numero, un’incertezza ed un’unità di misura. Misurazione: è la determinazione analitica vera e propria.
PROCEDURA ANALITICA TOTALE 1. Definizione generale del problema. (cliente) 2. Definizione analitica del problema. (cliente - analista) 3. Scelta del metodo, tecnica, procedura ed eventuale protocollo. (analista) 4. Campionamento. (cliente-analista) 5. Trattamento del campione. (analista) 6. Analisi. (analista) 7. Elaborazione. (analista) 8. Relazione. (cliente-analista) TRATTAMENTO DATI Procedimento per estrarre da un set di dati numerosi dei valori descrittori che caratterizzano il set di dati Errore: - grossolano - sistematico - casuale Livello di confidenza Livello di significatività
STATISTICA DELLE MISURE RIPETUTE misura di una grandezza X f x m s w1/2 Ripetendo infinite volte una misura, la distribuzione dei valori ottenuti come risultato della misura è gaussiana (o normale). Una curva gaussiana ha: Punto di massimo: x=m Massimo: Punti di flesso: x=m ± s Larghezza a metà altezza
STATISTICA DELLE MISURE RIPETUTE misura di una grandezza X f x m s m +t s m - t s Il punto di massimo è il VALORE VERO m . La semidistanza tra i flessi è la DEVIAZIONE STANDARD s La migliore stima di m è la MEDIA La migliore stima di s è n= numero di misure n-1= numero di gradi di libertà È nota e tabulata la probabilità P che una misura cada nell’intervallo x =(m ± t s ) cioè z = ± t
STATISTICA DELLE MISURE RIPETUTE misura di una grandezza X f x m s m +t s m - t s Ripetendo una misura singola per l’n+1esima volta, abbiamo probabilità Ps che essa cada nell’intervallo, detto INTERVALLO DI CONFIDENZA: Ripetendo n misure abbiamo probabilità Ps che la nuova media cada nell’INTERVALLO DI CONFIDENZA Il parametro t dipende dal livello di probabilità Ps scelto e dal numero di misure.
STIMA DEL’ERRORE PROPAGAZIONE DEGLI ERRORI
ESEMPIO: Stimare la deviazione standard di un dato ottenuto con spettrofotometria UV-Vis sapendo: A=0,529 (s=7,0 X 10-3) e=7900 M-1 cm-1 (s=200 M-1 cm-1 ) b=0.1 cm (s=1,0 X10-3 cm)
PRESENTAZIONE DEI RISULTATI NUMERICI cifre significative Cifre significative = tutte le cifre certe più la prima su cui cade l’errore. La prima cifra incerta è determinata dal numero che dà l’errore, espresso con una sola cifra significativa Es: 0.0137995 ± 0.0003 = 0.0138 ± 0.0003 Esprimendo il risultato numerico in forma esponenziale, le cifre significative sono quelle del fattore pre-esponenziale Esempi: 0.00017368 (errore su 8) = 1.7368 10-4 ha 5 cifre significative 1349000(errore sul 9) = 1.349 106 ha 4 cifre significative ADDIZIONI O SOTTRAZIONI:il risultato ha numero di decimali come il dato a minor cifre decimali (155,5±0,1) + (0,085±0,0011) = 155,585( ±0,1)=155,6 PRODOTTI O QUOZIENTI: il risultato ha numero di cifre significative pari al fattore con minor numero di cifre significative: 2,3567*8,45=19,914115=19.9 10.348/6,24=1,65833=1,66
TEST DI SIGNIFICATIVITÀ LIVELLO DI CONFIDENZA = P LIVELLO DI SIGNIFICATIVITÀ: a = 1 - P Nel caso di misure ripetute distribuite normalmente, il LIVELLO DI CONFIDENZA è l’area sottesa dalla funzione distribuzione sull’intervallo di confidenza, il LIVELLO DI SIGNIFICATIVITÀ è l’area sottesa dalla funzione distribuzione sulle “code” f x m s m +t s m - t s IPOTESI NULLA (H0)= ipotesi che un valore misurato appartenga alla popolazione rappresentata da una certa distribuzione TEST DI SIGNIFICATIVITÀ = stabilire se l’ipotesi nulla è vera ad un certo livello di confidenza P ovvero di significatività a =1-P
TEST DI SIGNIFICATIVITÀ confronto tra un risultato sperimentale ed il valore noto f X Xnoto Non c’è differenza significativa tra e Xnoto
TEST DI SIGNIFICATIVITÀ Esempio: TEST DI SIGNIFICATIVITÀ confronto tra un risultato sperimentale ed il valore noto Si sottopone un campione a concentrazione (c) nota Ad un determinato metodo analitico. Si vuole quindi determinare se tale metodo dà il risultato atteso. Eseguendo 3 misure si ottiene: X1= 38.9 ppb X2= 37.4 ppb X3= 37.1 ppb Quindi: xmedio= 37.8 ppb s=0.964 ppb ttab= 4.3 per livello confidenza 95% e numero gradi di libertà=2 toss= 1.98 Poichè toss<ttab , H0 è accettata, cioè non c’è diffeerenza significativa tra il risultato ottenuto ed il valore vero ad un livello di confidenza del 95%. X = 37.8±4.3(0,964/(3)1/2)= 37.8± 2.4
TEST DI SIGNIFICATIVITÀ confronto tra medie Assumiamo che le due medie appartengano a popolazioni aventi uguale deviazione standard Confrontare due medie e equivale a confrontare la loro differenza con lo zero. Si esegue un t-test analogo al precedente: Non c’è differenza significativa tra e n1= numero di misure ripetute per ottenere n2= numero di misure ripetute per ottenere Numero gradi di libertà: n1+n2-1 s21= varianza delle misure ripetute per ottenere s22= varianza delle misure ripetute per ottenere
TEST DI SIGNIFICATIVITÀ Esempio: TEST DI SIGNIFICATIVITÀ confronto tra medie Due metodi hanno dato i seguenti risultati sullo stesso campione: X1= 28.0 ppm s1= 0.3 ppm n° misure= 10 X2= 26.3 ppm s1= 0.2 ppm n° misure= 9 S= 0.258 toss = (28.0-26.3)/[0.258(1/10+1/9)1/2] =14.3 ttab = 2.11 con un livello di confidenza pari a 95% e con 17 gradi di libertà Poichè toss>ttab , H0 è rifutata, cioè c’è diffeerenza significativa tra i due risultati
TEST DI SIGNIFICATIVITÀ test delle differenze accoppiate Il test delle differenze accoppiate si applica quando si abbiano h campioni diversi e su ciascuno si esegua una singola misura col metodo 1 e una singola misura col metodo 2. Siano: xi,1 il risultato ottenuto sul campione i-esimo col metodo 1 xi,2 il risultato ottenuto sul campione i-esimo col metodo 2 h-1 gradi di libertà Per verificare se ci sia differenza significativa tra i vari risultati ottenuti con le due tecniche, si fa l’ipotesi nulla che d=0 e si esegue un t-test con:
TEST DI SIGNIFICATIVITÀ test delle differenze accoppiate Esempio: TEST DI SIGNIFICATIVITÀ test delle differenze accoppiate Se ci sono h campioni diversi e su ognuno eseguo una misura con il metodo1 ed una misura con il Metodo2: Campione met1 met2 d 71 76 -5 61 68 -7 50 48 +2 60 57 +3 dmedio= -1.75 Sd=2.5 toss=0.7 Ttab0,005;3=3.18 Poichè toss<ttab , H0 è accettata, cioè i due metodi danno risultati non significativamente diversi
TEST DI SIGNIFICATIVITÀ ANOVA Þ Non c’è differenza significativa tra le due varianze
Q-TEST per la verifica dei dati anomali (valore sospetto-valore più vicino)/(valore massimo-valore minimo) Qoss< Qtab Il dato sospetto non è rigettabile TEST 2 per la verifica della normalità della distribuzione (n>50) TEST della frequenza cumulativa per la verifica della normalità della distribuzione (n<50)
ACCURATEZZA: ESATTEZZA E PRECISIONE Si definisce ACCURATEZZA la contemporanea sussistenza di ESATTEZZA e PRECISIONE Si definisce ESATTEZZA l’accordo tra il valor medio ottenuto da un ampio set di misure e un valore di riferimento accettato (ISO 3534-1, 1993). La mancanza di esattezza è principalmente in relazione con gli errori sistematici Si definisce PRECISIONE l’accordo, ovvero la vicinanza reciproca, tra i risultati di più misure replicate. La mancanza di precisione è principalmente in relazione con gli errori casuali RIPETIBILITÀ E RIPRODUCIBILITÀ Si definisce RIPETIBILITÀ la precisione ottenuta con lo stesso operatore, la stessa strumentazione, in un breve lasso di tempo
ESATTEZZA E PRECISIONE Metodo1. non preciso non esatto Metodo3. non preciso esatto Metodo4. preciso esatto Metodo2. preciso non esatto
CALIBRAZIONI Nella quasi totalità dei metodi analitici quantitativi il dato di quantità incognita viene ottenuto per interpolazione sulla CURVA DI CALIBRAZIONE. Si definisce CURVA DI CALIBRAZIONE il grafico che riporta il segnale analitico (S) in funzione della quantità di analita (q) e viene ottenuta sottoponendo a misura degli standard a quantità nota di analita
INTERVALLO DINAMICO E LINEARE Si definisce INTERVALLO DINAMICO quell’intervallo di quantità di analita entro il quale il SEGNALE ANALITICO varia al variare della quantità stessa Si definisce INTERVALLO LINEARE un intervallo dinamico entro il quale il SEGNALE ANALITICO varia linearmente al variare della quantità di analita A c SENSIBILITÀ Si definisce SENSIBILITÀ di un metodo analitico la PENDENZA della curva di calibrazione.
REGRESSIONE LINEARE retta: y=a+ b x x1 xi xn y1 yi yn
La retta è una buona approssimazione REGRESSIONE LINEARE COEFFICIENTE DI CORRELAZIONE LINEARE (R) La retta è una buona approssimazione dell’andamento dei punti sperimentali se R ha valore vicino ad 1
CALIBRAZIONE CON STANDARD ESTERNI INTERPOLAZIONE x1 xi xn y1 yi yn y0 x0 m = numero di ripetizioni per y0
Concentrazione Mn (ppm) Esempio Calibrazione con standard esterni Determinazione ICP/OES (Mn) Concentrazione Mn (ppm) Segnale 200 100 2200 250 5200 500 10200 1000 20200 2000 40200 1340 27000 minimi quadrati lineari: segnale = a*conc. + b
METODO DELLE AGGIUNTE STANDARD CALIBRAZIONE CON IL METODO DELLE AGGIUNTE STANDARD SA SX OE OS CA xE
METODO DELLE AGGIUNTE STANDARD CALIBRAZIONE CON IL METODO DELLE AGGIUNTE STANDARD Il campione viene suddiviso in più aliquote dello stesso volume (almeno 3). Un’aliquota viene lasciata inalterata, agli altri sub-campioni si addizionano quantità crescenti dell’analita, aggiungendo piccoli volumi di una soluzione standard della specie in esame a concentrazione nota e portando a volume in recipiente tarato. Si effettua la misura su ciascuna soluzione e si costruisce il grafico:
Esempio Calibrazione con metodo delle aggiunte Determinazione del rame in un campione di sangue. Il campione è di 15 mL e viene diviso in 3 aliquote da 5 mL ognuna. -Alla prima aliquota non viene aggiunto nulla, -alla seconda vengono aggiunti 5 mL di una soluzione standard di cloruro di rame a 100 ng/mL -Alla terza aliquota vengono aggiunti 100 mL della stessa soluzione standard (v Tabella). Il rame aggiunto è 0 ng/mL nella prima soluzione, 0.1 ng/ml nella seconda e 0.2 ng/mL nella terza e le relative risposte strumentali sono: 0.2 per il primo campione, 0.31 per il secondo campione e 0.41 per il terzo. Si costruisce la retta con questi punti e per estrapolazione si calcola la concentrazione di rame presente nel campione = 0.17 ppm Aliquota 3 Aliquota 2 Aliquota 1
METODO DELLO STANDARD INTERNO CALIBRAZIONE CON IL METODO DELLO STANDARD INTERNO Gli n campioni standard da sottoporre a misura allo scopo di costruire una retta di taratura, etichettati con i=1,…,n, contengono quantità note xi dell’analita, variabili da standard a standard, e contengono una quantità nota z, uguale per tutti gli standard, di uno STANDARD INTERNO. La retta di taratura si costruisce riportando il rapporto tra il segnale (Sx) dell’analita e il segnale (Sz) dello standard in funzione del rapporto tra x e z.
LIMITE DI RIVELABILITA’ f LIMITE DI RIVELABILITÀ (yLOD) = il minimo segnale significativamente diverso da quello del bianco LIMITE DI RILEVABILITÀ (xLOD) = la quantità di analita che corrisponde al limite di rivelabilità
DETERMINAZIONE DEL LOD DALLA RETTA DI REGRESSIONE LINEARE y x Retta di regressione: y = a + b x
DETERMINAZIONE DEL LoD DAL RAPPORTO SEGNALE/RUMORE
VALIDAZIONE TEST DI ESATTEZZA TEST DI PRECISIONE VALIDARE un metodo analitico significa attestarne l’ESATTEZZA e la PRECISIONE TEST DI ESATTEZZA SI APPLICA UN TEST DI SIGNIFICATIVITÀ PER IL CONFRONTO TRA MEDIE AD UNO DEI CASI SEGUENTI TEST DI PRECISIONE SI APPLICA UN TEST ANOVA PER IL CONFRONTO TRA DEVIAZIONI STANDARD AD UNO DEI CASI SEGUENTI 1) USO DI MATERIALI DI RIFERIMENTO 2) USO DI UN METODO DI RIFERIMENTO VALIDATO 3) USO DI CAMPIONI FORTIFICATI (SPIKING)