La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

La distribuzione gaussiana è caratterizzata da una certa larghezza, chiamata deviazione standard (  ). Se  cresce, l’altezza cala.  è un misura degli.

Presentazioni simili


Presentazione sul tema: "La distribuzione gaussiana è caratterizzata da una certa larghezza, chiamata deviazione standard (  ). Se  cresce, l’altezza cala.  è un misura degli."— Transcript della presentazione:

1 La distribuzione gaussiana è caratterizzata da una certa larghezza, chiamata deviazione standard (  ). Se  cresce, l’altezza cala.  è un misura degli errori casuali. distribuzione gaussiana con  elevato: metodo con elevati errori casuali distribuzione gaussiana con  ridotto: metodo con ridotti errori casuali Elementi di statistica La stima del valore vero 1 La grande maggioranza delle misure chimico-analitiche (ma non solo queste), si distribuisce secondo la distribuzione gaussiana, detta anche distribuzione normale.

2 La larghezza della distribuzione, che è la deviazione standard , ed il valore centrale, che è il valore vero , definiscono univocamente una distribuzione gaussiana. conoscendo  e , si può prevedere con quale probabilità si otterranno certi valori sperimentali x i piuttosto che altri. Cioè, conoscendo , si conosce perfettamente come è fatta la distribuzione. Infatti, si conoscono tutti i termini della sua formula: Integrando la formula, per un qualsiasi intervallo di valori di x, si ricava la probabilità di ottenere valori di x compresi nell’intervallo dato. Elementi di statistica La stima del valore vero 2

3 In particolare, si può dimostrare che la probabilità di ottenere dei valori compresi tra  –  e  +  è pari al 68.3%. 68.3% Ad esempio, se  = 0.11 e  = 0.02, si ha il 68.3% di probabilità di ottenere dei valori sperimentali compresi tra 0.09 e 0.13 Elementi di statistica La stima del valore vero 3

4 La probabilità di ottenere dei valori compresi tra  – 2  e  + 2  è pari al 95.5%. 95.5% Nell’esempio di prima (  = 0.11,  = 0.02), si ha il 95.5% di probabilità di ottenere dei valori sperimentali compresi tra 0.07 e 0.15 Elementi di statistica La stima del valore vero 4

5 Noi non conosciamo né  né , ma si possono stimare a partire dal set sperimentale di misure ripetute. Per stimare  si calcola la media dei dati sperimentali, dato che la media è la stima migliore per il valore vero. Per stimare , si sfruttano le proprietà algebriche della distribuzione gaussiana. Si può dimostrare che: Elementi di statistica La stima del valore vero 5 s, stima di , =

6 Esempio Si eseguono 4 misure ripetute della titolazione di un acido a concentrazione incognita C i,A con una base. I valori di C i,A ottenuti sono i seguenti: M, M, M, M. Stimare il valore vero e la deviazione standard dei dati. Elementi di statistica La stima del valore vero 6 = M Per stimare il valore vero si calcola la media: Per stimare la deviazione standard si utilizza la formula: da cui si ottiene: s = M (dare sempre le unità di misura!) s ha le stesse unità di misura degli x i

7 deviazione standard 7 Ogni(!) calcolatrice scientifica è in grado di eseguire automaticamente il calcolo di s

8 Esercizio Elementi di statistica La stima del valore vero 8 Un campione a concentrazione nota di analita, pari a M, viene analizzato con due metodi diversi, metodo A e metodo B. In entrambi i casi si ripete la misura tre volte, e vengono così ottenuti i seguenti valori di concentrazione dell'analita: Metodo A: , , M Metodo B: , , M Qual è il metodo più esatto? Qual è il metodo più preciso? Qual è il risultato più accurato? Calcoliamo innanzitutto media e deviazione standard per entrambe le serie di dati. Metodo A: M M M M Metodo B:

9 Elementi di statistica La stima del valore vero 9 Metodo A: M M M M Metodo B: A questo punto ricordiamo il concetto di esattezza: metodo la cui media più si avvicina al valore vero (in questo caso M). Il metodo B è più esatto. Concetto di precisione: metodo la cui deviazione standard è più bassa. Il metodo A è più preciso. Concetto di accuratezza: risultato più vicino al valore vero. Metodo A: , , M Metodo B: , , M M è il risultato più accurato.

10 Altro esercizio Elementi di statistica La stima del valore vero 10 Un campione viene analizzato con due metodi diversi, metodo A e metodo B. In entrambi i casi si ripete la misura tre volte, e vengono così ottenuti tre valori di concentrazione dell'analita: Metodo A: , , M Metodo B: , , M Qual è il metodo più esatto? Qual è il metodo più preciso? Qual è il risultato più accurato? L’unica differenza rispetto all’esempio precedente è che qui non è noto il valore vero Metodo A: M M Metodo B: M M Quindi medie e deviazioni standard sono le stesse di prima:

11 Altro esempio Elementi di statistica La stima del valore vero 11 Un campione viene analizzato con due metodi diversi, metodo A e metodo B. In entrambi i casi si ripete la misura tre volte, e vengono così ottenuti tre valori di concentrazione dell'analita: Metodo A: , , M Metodo B: , , M Metodo A: M M Metodo B: M M Qual è il metodo più esatto? Qual è il metodo più preciso? Qual è il risultato più accurato? non si può rispondere, poiché non è noto il valore vero. il metodo A è più preciso poiché la sua s è minore. non si può rispondere, poiché non è noto il valore vero.

12 In pratica, dalle n misure ripetute abbiamo dedotto (stimato) come è fatta la distribuzione delle probabilità per le misure sperimentali da noi ottenute. cioè abbiamo dedotto (stimato) l’equazione della distribuzione delle probabilità, che come detto ci dice dettagliatamente con quale probabilità si può ottenere un certo intervallo di dati Elementi di statistica La stima del valore vero 12 Torniamo al significato statistico del calcolo di media e deviazione standard. Ricordando i numeri elencati precedentemente (valori compresi tra  –  e  +  col 68.3% di probabilità, ecc.), e con riferimento all’esempio di qualche diapositiva fa in cui la media è M ed s è M, si ha che:

13 i valori sperimentali che si possono ottenere sono compresi: - tra – e M col 68.3% di probabilità - tra – e M col 95.5% di probabilità - ecc. Questa è dunque una statistica sui valori sperimentali. A noi però interessa una statistica sul valore vero! Cioè a noi interessa una statistica che dica: il valore vero (non i singoli dati sperimentali) è compreso entro un certo intervallo  con una certa probabilità. Elementi di statistica La stima del valore vero 13 media = M, s = M

14 Per stimare la statistica sul valore vero dobbiamo considerare che tale valore è stimato dalla media, e quindi dobbiamo conoscere la statistica sulle medie. Elementi di statistica La stima del valore vero Cioè, dobbiamo conoscere qual è la distribuzione delle probabilità per tutte le possibili medie che si possono ottenere ripetendo le misure sperimentali. La distribuzione statistica delle medie è la distribuzione di Student. Tale distribuzione è molto simile alla distribuzione gaussiana (andamento a campana, distribuzione simmetrica), con lievi differenze di forma (non è la stessa formula della gaussiana, anzi, non esiste nemmeno una formula, dato che la distribuzione di Student è stata ottenuta sperimentalmente). Student La distribuzione di Student, così come la gaussiana, è caratterizzata da un valore centrale e da una larghezza. 14

15 William Sealy Gosset (1876–1937) è un chimico e matematico che elaborò la teoria statistica alla base della distribuzione di Student lavorando presso la fabbrica di birra Guinness, e sfruttando la grande quantità di dati che raccoglieva riguardo alla preparazione della birra stessa. 15 Il nome “Student” prese origine dallo pseudonimo che Gosset usò per pubblicare i suoi risultati statistici: la Guinness, infatti, non permetteva ai suoi dipendenti di fare pubblicazioni, nel timore che venissero rivelati i segreti della preparazione della birra stessa.

16 Elementi di statistica La stima del valore vero La larghezza è la deviazione standard della media. Se s è la stima della deviazione standard per la distribuzione dei dati, il valore: è la stima della deviazione standard per la distribuzione delle medie degli stessi dati, con: n = numero di misure ripetute t = parametro di Student (valore, come vedremo, tabulato). Il valore centrale è anche in questo caso il valore vero, e può essere stimato dalla media ottenuta dalle misure sperimentali eseguite, 16

17 Elementi di statistica La stima del valore vero Quindi, tutte le medie che si possono ottenere sono comprese tra e con una certa probabilità Poiché tra tutte le medie è presente il valore vero , si può dire: il valore vero  è compreso, con una certa probabilità, tra e Si può anche scrivere: 17

18 Elementi di statistica La stima del valore vero Per stimare tale intervallo da n misure ripetute: 1) si calcola la media dei dati ottenuti 2) si calcola la deviazione standard s dei dati ottenuti 3) si sceglie la probabilità con cui si vuole che il valore vero sia incluso entro l’intervallo, e sulla base della probabilità voluta si sceglie t : maggiore è la probabilità voluta, maggiore è t 18 il valore vero  è compreso, con una certa probabilità, tra e Infatti, l’intervallo deve essere ampliato per poter essere più sicuri che il valore vero vi sia compreso.

19 Elementi di statistica La stima del valore vero Di solito si sceglie una probabilità del 95% (quindi piuttosto alta). t dipende anche dal numero di misure ripetute n : minore è n, maggiore è t Infatti, se abbiamo poche misure ripetute ( n piccolo), è meno probabile che la media ottenuta sia vicina al valore vero (dato che gli errori casuali non si annullano con poche misure ripetute), per cui l’intervallo entro cui è compreso il valore vero si deve un po’ allargare a parità di probabilità. 19 il valore vero  è compreso, con una certa probabilità, tra e

20 Elementi di statistica La stima del valore vero Di solito si sceglie una probabilità del 95% (quindi piuttosto alta). Valori di t tabulati, per una probabilità del 95%, in funzione del numero di misure ripetute n nt Valori per n > 9, o per probabilità diverse da 95%, sono tabulati in libri di statistica, o anche su internet. 20 il valore vero  è compreso, con una certa probabilità, tra e

21 Elementi di statistica La stima del valore vero Esercizio Dalle 4 misure ripetute dell’esercizio della diapositiva 6 (0.1104, , , M), calcolare l’intervallo entro il quale il valore vero è compreso con una probabilità del 95%. Esprimere il risultato in notazione rigorosa. Per stimare tale intervallo, come visto, si devono operare i passaggi seguenti: 1) si calcola la media dei dati ottenuti = M 2) si calcola la deviazione standard s dei dati ottenuti s = M 3) scelta la probabilità (95%) con cui si vuole dare il valore vero, si sceglie il valore di t corrispondente ad n = 4 21

22 Elementi di statistica La stima del valore vero Dalle 4 misure ripetute dell’esercizio della lezione precedente (0.1104, , , ), calcolare l’intervallo entro il quale il valore vero è compreso con una probabilità del 95%. Esprimere il risultato in notazione rigorosa. nt Avendo n = 4, il valore che deve essere preso è t = Quindi, il valore vero è compreso, con una probabilità del 95%, = M s = M tra – M e M Si calcola l’intervallo: = M 22 Si scrive:  = ( ± ) M (95%)

23 Elementi di statistica La stima del valore vero L’intervallo entro il quale è compreso il valore vero con la probabilità data è chiamato intervallo di fiducia (oppure intervallo di confidenza). Nell’esempio precedente, è l’intervallo compreso tra – e M La probabilità con la quale il valore vero è compreso nell’intervallo di fiducia è chiamata grado di fiducia (oppure grado di confidenza). Nell’esempio precedente, ed in genere, il grado di fiducia è del 95% L’intervallo di fiducia è anche chiamato incertezza, dato che è una misura di quanto è incerto il valore ottenuto (da non confondersi con l’incertezza strumentale). Un risultato è tanto migliore, quanto più stretto è l’intervallo di fiducia, quindi tanto minore è la sua incertezza. 23

24 Elementi di statistica La stima del valore vero Quando si eseguono n misure ripetute nell’analisi di un campione, e si ottengono n valori sperimentali, la loro media rappresenta la stima migliore del valore vero, e l’intervallo di fiducia (o incertezza): rappresenta l’intervallo entro il quale è contenuto il valore vero, con un certo grado di fiducia (di solito 95%). 24 Riassumendo:

25 Elementi di statistica La stima del valore vero Invece dell'incertezza (o intervallo di fiducia) in quanto tale, a volte è utile dare l'incertezza relativa, pari al rapporto tra l'incertezza ed il valore medio: 25 incertezza relativa % = Nell'esempio precedente, dove la media è M e l'intervallo di fiducia è M, l'incertezza relativa è pari al 3.6% L'incertezza relativa % è una misura migliore della precisione di un metodo che non l'incertezza assoluta: ad esempio, un metodo che dà media 0.1 M e incertezza 0.01 M (incertezza relativa = 10%) è più preciso di un metodo che dà media 0.01 M e incertezza M (incertezza relativa = 50%).

26 Elementi di statistica Riprendiamo uno degli esempi della lezione scorsa, ed il risultato finale ottenuto: C i,A = ( ± ) M (95%) In realtà, il numero , preso con tutte le cifre che dà una calcolatrice scientifica a 10 cifre, sarebbe stato Anche la deviazione standard dei dati, s, scritta come , sarebbe stata in realtà (ed evidentemente, essendo quasi sempre dei numeri irrazionali, tali valori potrebbero essere dati con un numero infinito di cifre). Quante cifre si devono usare per s ? Quante cifre si devono usare per l’intervallo di fiducia? Quante cifre si devono usare per la media? 26

27 Elementi di statistica Le cifre significative Intanto spieghiamo un concetto correlato, quello delle cifre significative di un numero. Per ricavare quante cifre significative ci sono in un numero si scrive il numero in notazione scientifica. Per esempio: = 2.34 · 10 – = · 10 – = · = 2 · 10 0 Il numero delle cifre, “depurato” dalla sua parte esponenziale, rappresenta il numero delle cifre significative. per esempio:0.0234ha 3 cifre significative ha 4 cifre significative 854.1ha 4 cifre significative 2ha 1 cifra significativa 27

28 Elementi di statistica Le cifre significative Se il numero rappresenta una grandezza sperimentale (per es. la concentrazione di una sostanza), il numero di cifre significative da utilizzare deve essere coerente con l’incertezza con la quale è nota tale grandezza. In altre parole, le cifre che usiamo per scrivere un numero devono avere un significato (devono appunto essere significative). Ad esempio, se si misura la lunghezza di un oggetto con un metro (col quale si riesce ad apprezzare al massimo la mezza tacca, 0.5 mm), si può dare il numero fino alla prima cifra dopo la virgola dei millimetri. 28 Per esempio, per un certo oggetto si può scrivere L = 45.5 mm. O per un altro oggetto si può scrivere L = 38.0 mm

29 Elementi di statistica Le cifre significative 29 Se si scrivesse L = 45 mm, o L = 38 mm, si sarebbe “sacrificata” inutilmente una parte delle conoscenze che si ha su tale grandezza, dato che mancherebbe una cifra dopo la virgola pur essendo nota. D’altra parte, se si scrivesse L = o L = mm non avrebbe senso, la seconda cifra dopo la virgola e quelle successive sono inutili poiché non sono note. Anzi, sono pure dannose, perché potrebbero fare credere a chi legge che L è nota con un’incertezza molto migliore dei 0.5 mm In genere, quando un numero viene dato senza la sua incertezza, si assume che l’incertezza sia sull’ultima cifra significativa.

30 Elementi di statistica Le cifre significative 30 Tutto questo vale dal punto di vista di chi “legge” i valori ottenuti da altri. Dall’altro punto di vista (cioè di chi deve scrivere), quando si deve dare un risultato sperimentale si deve usare un numero corretto ed opportuno di cifre significative: I valori sperimentali vanno scritti con un numero di cifre tali che l’ultima scritta sia la prima incerta. Ad esempio, chi ha ottenuto il valore di L e la sua incertezza, scrive 45.5 o 38.0 mm perché la prima cifra incerta è la prima dopo la virgola (incertezza = 0.5 mm).

31 Elementi di statistica Le cifre significative Tali concetti si applicano a qualunque misura sperimentale, e dunque anche alle concentrazioni medie delle sostanze e ai relativi intervalli di fiducia. Iniziamo a ragionare sull’intervallo di fiducia di una media. Per scegliere il numero di cifre da usare per scrivere il valore dell'intervallo di fiducia, andrebbe conosciuta l’incertezza con cui è noto tale intervallo. è la cosiddetta “incertezza dell’incertezza” (dato che l’intervallo di fiducia è l’incertezza del valore medio). Non lo si dimostra, ma si verifica che “l’incertezza dell’incertezza” relativa è dell’ordine del 10%. 31

32 Elementi di statistica Le cifre significative Se ad esempio l’intervallo di fiducia fosse ± , l’incertezza con cui è noto tale numero risulterebbe (circa) 0.01, per cui l’incertezza dell’incertezza cadrebbe sulla seconda cifra significativa: Se ad esempio l’intervallo di fiducia fosse ± , l’incertezza con cui è noto tale numero sarebbe (circa) Dunque anche qui l’incertezza dell’incertezza cadrebbe sulla seconda cifra significativa:

33 Elementi di statistica Le cifre significative Ne consegue che l’intervallo di fiducia (l'incertezza) di un numero va scritta sempre con 2 cifre significative. Nei due casi precedenti: va scritto come va scritto come Le cifre “eliminate”, dal “4” in poi nel primo caso, dal “3” in poi nel secondo caso, sono cifre non significative. L’eliminazione delle cifre non significative va fatta con delle regole. Ad esempio, se anziché fosse stato ? andrebbe scritto come 0.11, perché è più vicino a 0.11 che a 0.10

34 Elementi di statistica Le cifre significative Quando si eliminano le cifre non significative, l’ultima cifra non eliminata va aumentata di 1 se la prima cifra eliminata è maggiore di 5 (6, 7, 8, 9); l’ultima cifra non eliminata va lasciata invariata se la prima cifra eliminata è minore di 5 (0, 1, 2, 3, 4) va scritto come va scritto come 0.11 Se anziché fosse stato ? va scritto come 0.11 dato che è più vicino a 0.11 che a 0.10 Quando la prima cifra eliminata è uguale a 5, l’ultima cifra non eliminata va aumentata di 1...

35 Elementi di statistica Le cifre significative 35 Se anziché fosse stato ? Quando la prima cifra eliminata è uguale a 5 e quelle successive sono nulle o assenti, si lascia invariata l’ultima cifra non eliminata se è pari, la si aumenta di 1 se è dispari può indifferentemente essere scritto come 0.11 o 0.10, poiché è equidistante dai due. In casi come questo (piuttosto rari), si è convenzionalmente deciso che l’ultima cifra non eliminata sia pari (dunque 0.10 in questo esempio). ad esempio: diventa 0.14, diventa 0.14 (mentre diventa 0.15).

36 Elementi di statistica Le cifre significative Una volta determinato quante cifre usare per l’intervallo di fiducia (2 significative), si può scegliere quante cifre usare per la media. 36 La media va data con un numero di cifre tale per cui l’ultima cifra scritta per la media corrisponda all’ultima delle due cifre significative dell’intervallo di fiducia. Ad esempio, se la media fosse e l’intervallo di fiducia fosse : a) si scrive l’intervallo di fiducia con 2 cifre significative: b) Si “allineano” (corrispondenza delle cifre decimali) media ed intervallo di fiducia:

37 Elementi di statistica Le cifre significative c) Si tagliano tante cifre sulla media, in modo da arrivare allo stesso decimale dell’incertezza: d) Infine, si scrive il risultato nella maniera seguente: ± Anche gli zeri finali vanno scritti se sono significativi. Ad esempio, se la media fosse e l’intervallo di fiducia fosse : a) si scrive l’intervallo di fiducia con 2 cifre significative:

38 Elementi di statistica Le cifre significative c) Si tagliano tante cifre sulla media, in modo da arrivare allo stesso decimale dell’incertezza: d) Infine, si scrive il risultato nella maniera seguente: ± a) si scrive l’intervallo di fiducia con 2 cifre significative: b) Si “allineano” media ed intervallo di fiducia:

39 Elementi di statistica Le cifre significative 39 Maniera corretta e rigorosa di riportare dei risultati sperimentali, come i risultati di un’analisi chimica: – dare media ± intervallo di fiducia; – usare il numero di cifre corretto; – indicare l'unità di misura; – esplicitare il grado di fiducia (95%). Si può anche accettare che l’incertezza sia scritta con una sola cifra significativa, e quindi la media con un’ulteriore cifra di meno. Nell'esempio di sopra si scriverebbe: ± All'esame, però, si usino 2 cifre per l'incertezza! Per esempio (risultato di un esercizio della lezione precedente):  = ( ± ) M (95%)


Scaricare ppt "La distribuzione gaussiana è caratterizzata da una certa larghezza, chiamata deviazione standard (  ). Se  cresce, l’altezza cala.  è un misura degli."

Presentazioni simili


Annunci Google