La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Il numero di cifre significative indica la precisione dell’esperimento

Presentazioni simili


Presentazione sul tema: "Il numero di cifre significative indica la precisione dell’esperimento"— Transcript della presentazione:

1 Il numero di cifre significative indica la precisione dell’esperimento
Statistica: concetti base CIFRE SIGNIFICATIVE Il numero di cifre significative è il numero minore di cifre necessarie per esprimere una quantità con la precisione richiesta Il numero di cifre significative indica la precisione dell’esperimento

2 In pratica come cifre significative si indicano tutte le cifre certe più la prima incerta
Quattro cifre significative: 278.4; ·101; ·102; ·10-1 Cinque cifre significative: 2.7840·10-3 Quattro cifre significative: 3.604·10-3;

3 CALCOLI Addizione e sottrazione:
il risultato finale non può avere più cifre significative, dopo la virgola decimale, dei dati con il minor numero di cifre significative dopo la virgola decimale: = 5.557; = 5.551 5.55 Moltiplicazione e divisione: il risultato finale non può avere più cifre significative di quante ne abbia il dato con il minor numero di cifre significative: 73.24 x 4.52 = 1648 / = ·103 Logaritmi ed esponenti Il numero di cifre significative dell’argomento deve essere pari a quello della mantissa: log 236 = 2.373

4 Moltiplicazione/Divisione Addizione / Sottrazione
Dati Codificati CODIFICA Una semplice operazione matematica che consente di semplificare i calcoli statistici Moltiplicazione/Divisione 0.51, 0.52, 0.47, 0.50,… X 100 51, 52, 47, 50, ….. Addizione / Sottrazione 1.08, 1.10, 1.03, 1.05 -1, X 100 8, 10, 3, 5, …..

5 TIPI DI ERRORE GROSSOLANI SISTEMATICI CASUALI accuratezza precisione prossimità al valore vero dispersione dei dati ottenuti intorno al valore medio

6 Errori casuali e sistematici
Studente Risultato Commento (ml) 10.08 10.11 A Preciso 10.10 Inaccurato 10.12 9.88 10.14 B Accurato 9.80 Impreciso 10.21 10.19 9.79 C Inaccurato 10.05 Impreciso 9.78 10.04 9.98 D Accurato 9.97 Preciso JC Miller, JN Miller; Statistics for analytical chemistry Ellis Horwood, 1988,

7 REGOLE PER L’ARROTONDAMENTO
Eliminare le cifre tutte insieme Se la prime cifra da eliminare è minore di cinque, l’ultima cifra significativa non cambia Se la prime cifra da eliminare è maggiore di cinque, l’ultima cifra significativa si aumenta di uno 4. Se la prima cifra da eliminare è cinque e le altre sono zeri: se l’ultima cifra significativa è pari, questa rimane invariata se l’ultima cifra significativa è dispari, questa viene aumentata di uno 1.5 2 12.25 12.2 103.75 103.8

8 ORGANIZZAZIONE E RAPPRESENTAZIONE DEI DATI
Esempio: il classico lancio del dado Un insieme di 35 dati Si tratta di una VARIABILE DISCRETA: può assumere solo determinati valori

9 Rappresentazione dei dati
DISTRIBUZIONE DI FREQUENZA Rappresentazione dei dati Una prima classificazione dell’informazione è effettuata impiegando le distribuzioni di frequenza Rapporto fra effettivo della modalità e effettivo della serie statistica Numero di volte in cui la modalità compare in una serie statistica modalità

10 Rappresentazione dei dati
DISTRIBUZIONE DI FREQUENZA Rappresentazione dei dati

11 Rappresentazione dei dati
DISTRIBUZIONE DI FREQUENZA Rappresentazione dei dati Distribuzione della FREQUENZA CUMULATA dei punteggi ottenuti in 35 lanci di un dado

12 Rappresentazione dei dati
DISTRIBUZIONE DI FREQUENZA Rappresentazione dei dati In presenza di VARIABILI CONTINUE è necessario suddividere il campo di variazioni in classi Ogni classe è delimitata da LIMITI DI CLASSE che ne definiscono l’INTERVALLO Il valore assoluto della differenza dei limiti definisce l’ AMPIEZZA della classe La media aritmetica dei due limiti definisce il CENTRO della classe

13 Rappresentazione dei dati
DISTRIBUZIONE DI FREQUENZA Rappresentazione dei dati Esempio: determinazione di ione nitrato in acqua Un insieme di 50 dati

14 Gli intervalli delle classi devono avere tutti la stessa ampiezza
DISTRIBUZIONE DI FREQUENZA Rappresentazione dei dati La definizione dell’ampiezza dell’intervallo della classe deve essere scelto in modo da ottenere una rappresentazione che non abbia troppo o troppo poco dettaglio Gli intervalli delle classi devono avere tutti la stessa ampiezza La pratica porta a consigliare l’impiego di un numero di classi variabile da 5 a 25 e, indicativamente, pari alla radice quadrata del numero di dati

15 DISTRIBUZIONE DI FREQUENZA Rappresentazione dei dati
Nell’esempio dei dati del nitrato l’intervallo della serie è 0.53 – 0.46 = 0.07 Il numero di dati è 50 Il numero di classi che si potrebbero scegliere è sette Guardando però la struttura dei dati si vede che per avere intervalli di classe identici conviene suddividere la serie in otto classi

16 Rappresentazione dei dati
DISTRIBUZIONE DI FREQUENZA Rappresentazione dei dati Questa suddivisione porta alla seguente rappresentazione grafica

17 Rappresentazione dei dati
DISTRIBUZIONE DI FREQUENZA Rappresentazione dei dati Riduciamo a quattro il numero di classi, in modo da mantenere costante il valore dell’intervallo di classe

18 Rappresentazione dei dati
DISTRIBUZIONE DI FREQUENZA Rappresentazione dei dati Questa suddivisione porta alla seguente rappresentazione grafica

19 Rappresentazione dei dati Riduciamo a due sole classi
DISTRIBUZIONE DI FREQUENZA Rappresentazione dei dati Riduciamo a due sole classi

20 Rappresentazione dei dati
DISTRIBUZIONE DI FREQUENZA

21 Rappresentazione dei dati
DISTRIBUZIONE DI FREQUENZA Rappresentazione dei dati La CURVA DELLE FREQUENZE CUMULATE viene costruita riportando sull’asse delle ascisse il limite inferiore della prima classe e quello superiore della prima classe e di quelle successive. L’ordinata è la frequenza cumulata

22 Rappresentazione dei dati
VALORI CARATTERISTICI Rappresentazione dei dati È possibile rappresentare una serie di dati in modo sintetico attraverso l’uso di indicatori di posizione La distribuzione dei dati può assumere diverse forme, riconducibili ad una forma “a campana” caratterizzate da tre parametri principali LOCALIZZAZIONE DELLA SERIE DI DATI DISPERSIONE DELLA SERIE DI DATI FORMA DELLA SERIE DI DATI

23 Rappresentazione dei dati
Media, Mediana e Percentili Rappresentazione dei dati Somma dei valori divisa per l’effettivo della serie MEDIA ARITMETICA

24 valori caratteristici di tendenza centrale
Media Sergio Zappoli: Media, mediana e percentili Sergio Zappoli: Sergio Zappoli: La media aritmetica è uno dei più usati fra i valori caratteristici di tendenza centrale La media aritmetica di una serie di dati si ottiene dividendo la somma di tutti i valori della serie per il numero dei dati della serie 15

25 Mediana Media, mediana e percentili La mediana è quel valore della variabile statistica tale per cui la metà dei valori osservati presenta un valore inferiore e l’altra metà un valore superiore La mediana, a differenza della media, è meno sensibile ai valori estremi della serie di dati e, talvolta, rappresenta meglio le condizioni “medie” di un sistema

26 Mediana Media, mediana e percentili Per calcolare la mediana si deve innanzitutto ordinare in senso crescente i valori osservati:

27 Mediana Media, mediana e percentili Se il numero di osservazioni è dispari, la mediana è il valore dell’elemento che divide la serie in due gruppi Se il numero di osservazioni è pari, si individua un intervallo mediano. La mediana è la media aritmetica fra i due valori delimitanti tale intervallo 5.5

28 Quantili Media, mediana e percentili I quantili (o percentili) sono parametri di posizione che dividono una serie di dati in gruppi. La mediana è quel particolare quantile che divide la serie dei dati in due parti di uguale dimensione. Il quantile di ordine 0.98, o 98° percentile, divide la serie di dati in due parti: il 98% dei dati ha valore inferiore al quantile dato

29 Quantili Media, mediana e percentili Le procedure di calcolo dei percentili sono simili a quelle per il calcolo della mediana. Una misura più accurata del valore della mediana o dei percentile si ottiene per interpolazione.

30 Consideriamo una serie di 72 misure di SO2 (µg/m3) in atmosfera
Esempio Media, mediana e percentili Consideriamo una serie di 72 misure di SO2 (µg/m3) in atmosfera 26/07/99 31/07/99 16/08/99 Ora Ora Ora Ora Ora Ora Ora Ora Ora Ora Ora Ora 26/07/99 31/07/99 16/08/99 Ora Ora Ora Ora Ora Ora Ora Ora Ora Ora Ora Ora

31 Ordiniamo la serie di dati in senso crescente
Esempio Media, mediana e percentili Ordiniamo la serie di dati in senso crescente 9.1; 10.3; 10.3; 10.3; 10.3; 10.3; 10.3; 10.3; 11.5; 11.5; 11.5; 11.5; 11.5; 11.5; 11.5; 11.5; 11.5; 11.5; 11.5; 11.5; 11.5; 11.5; 11.5; 11.5; 11.5; 11.5; 11.5; 12.6; 12.6; 12.6; 12.6; 12.6; 12.6; 12.6; 12.6; 12.6; 12.6; 12.6; 12.6; 12.6; 12.6; 12.6; 12.6; 12.6; 12.6; 12.6; 13.8; 13.8; 13.8; 13.8; 13.8; 13.8; 13.8; 13.8; 13.8; 13.8; 14.9; 14.9; 14.9; 14.9; 14.9; 14.9; 14.9; 14.9; 14.9; 16.1; 16.1; 16.1; 16.1; 17.2; 20.7; 24.2 72 x 0,98 =  71 Senza l’applicazione dell’interpolazione il 98° percentile è 20.7

32 Media, mediana e percentili
Esempio Media, mediana e percentili In realtà più la serie di dati aumenta più l’assunzione della omogeneità della distribuzione dei dati nella classe diventa realistica Il 98° percentile è un valore intermedio fra 20.7 e 17.2, calcolato in modo da tenere conto del numero dei valori delle due classi nelle quali sono divisi i dati e dell’ampiezza dell’intervallo nel quale ricade il percentile

33 Esempio Media, mediana e percentili
L’interpolazione può essere effettuata per via grafica ingrandiamo questa zona, dove è compreso il valore del percentile Valore parametro Evento

34 Esempio Media, mediana e percentili 19.2 Valore parametro Evento

35 Grafico dei dati e dei parametri statistici

36 Rappresentazione dei dati
VALORI CARATTERISTICI DI DISPERSIONE Rappresentazione dei dati Campo o Intervallo di variazione Nell’esempio dei dati del nitrato il campo di variazione è: Nell’esempio dei dati di SO2 campo di variazione è:

37 Varianza Consideriamo tre serie di dati di uguale media e numero di dati e calcoliamo la somma dei quadrati dei dati 13, 13, 13, 13, 13, 13, 10, 11, 12, 13, 14, 15, 8, 9, 10, 13, 16, 17, La somma dei quadrati dei dati cresce con la dispersione dei dati

38 Varianza Una delle proprietà della media è che la sommatoria degli scarti è uguale a zero Sviluppiamo il quadrato degli scarti:

39 Varianza Consideriamo ora che:
che ci consente la scomposizione della somma dei quadrati dei dati in due termini

40 Varianza Vediamo cosa succede applicando la scomposizione ai nostri dati: Dipende dalla dispersione dei dati Dipende dalla media

41 Varianza Per normalizzare la misura di dispersione trovata, la sommatoria dei quadrati degli scarti, ne facciamo la media, dividendo per il numero N dei dati Tale valore di dispersione si definisce VARIANZA della serie di dati e si indica con il termine s2

42 Deviazione standard La DEVIAZIONE STANDARD della serie di dati è data dalla radice quadrata della varianza si indica con il termine s

43 Coefficiente di variazione
Il COEFFICIENTE DI VARIAZIONE della serie di dati è un indicatore relativo, ottenuto dal rapporto percentuale fra deviazione standard e media della serie e si indica con il termine CV

44 Rappresentazioni grafiche
Box & Whisker Plot Box & Whisker Plot per le tre serie di dati

45 Rappresentazioni grafiche
Box & Whisker Plot Box & Whisker Plot per i dati del nitrato

46 Rappresentazione dei dati
DISTRIBUZIONE DI FREQUENZA Rappresentazione dei dati Distribuzione dei risultati per la determinazione del NO3 L’insieme di queste 50 misure è detto: CAMPIONE la POPOLAZIONE è l’insieme di tutte le possibili misure

47 La distribuzione normale
La legge di probabilità di Laplace-Gauss, si applica alle variabili statistiche le cui variazioni sono dovute all’azione concomitante di numerose sorgenti di variazione indipendenti fra loro e i cui effetti si sommano senza che nessuno di essi abbia a prevalere I parametri della distribuzione sono MEDIA m e la DEVIAZIONE STANDARD s

48 La distribuzione normale
Una forma particolarmente utile della distribuzione normale è quella nella quale viene introdotta la variabile ridotta Z Z ha media pari a zero e deviazione standard pari a uno. In questa distribuzione normale ridotta alla variabile X si sostituiscono gli scarti dalla media.

49 La distribuzione normale
La funzione di distribuzione permette di determinare la probabilità di ottenere un valore della variabile aleatoria X inferiore od uguale ad un determinato limite x1 determinare la probabilità di ottenere un valore della variabile aleatoria X superiore ad un determinato limite x1 Calcolare la probabilità di ottenere un valore della variabile aleatoria X compresa fra i limiti x1 e x2 La probabilità cumulata dell’insieme dei valori della distribuzione di probabilità è per definizione pari a 1

50 DISTRIBUZIONE DI FREQUENZA

51 Tavole della distribuzione normale ridotta
Quale è la probabilità che un elemento della popolazione sia > 1.96 ? Ovvero che a = P (Z >1.96) ? 0.025 Ovvero il 2.5%

52 Tavole della distribuzione normale ridotta
La probabiltà trovata sulle tavole è quella segnata in rosso

53 La distribuzione normale: valori notevoli
Inoltre… 5 % di probabilità di avere uno scarto dalla media superiore a 1.96s 1 % di probabilità di avere uno scarto dalla media superiore a 2.58s

54 La distribuzione della media e il teorema centrale limite
Se si prendono tutti i possibili campioni, ognuno di dimensione n, da qualsiasi popolazione di media m e deviazione standard s, la distribuzione delle medie dei campioni avrà media mx = m e varianza s2x = s2/n e sarà distribuita normalmente se lo sarà la distribuzione di origine oppure tenderà ad essere normale per un numero grande di campioni.

55 Il teorema centrale limite
Popolazione originaria campioni di dimensione n=2 campioni di dimensione n=4 Popolazione delle medie campioni di dimensione n=25

56 Il teorema centrale limite
Popolazione originaria 2; 21; 12 ; 34; 35; 5; 9; 12; 23; 3 Media = 15.6 s2 = 132.4

57 Il teorema centrale limite
Dalla popolazione originaria Estrazione (con reimmissione) di campioni di dimensione 2: 100 campioni

58 Il teorema centrale limite
Popolazione campionaria Media = 15.6 s2 = 66.2

59 s2 = s2 /n s = s /n Il teorema centrale limite Media = 15.6
Popolazione originaria Media = 15.6 s2 = 66.2 Popolazione campionaria s2 / s2 = / 66.2 = 2 n=2 rappresenta la dimensione dei campioni estratti dalla popolazione di origine s2 = s2 /n s = s /n

60 Il teorema centrale limite
La distribuzione di queste medie è detta distribuzione della media campionaria. La media di questa popolazione è la stessa di quella originale e la sua deviazione standard è detta: deviazione standard della media o errore standard della media, s.e.m. =

61 Confidenza IL VALORE MEDIO, m, E’ UNA STIMA DEL VALORE VERO,  SI DEVE DEFINIRE UN INTERVALLO ALL’INTERNO DEL QUALE SI POSSA ASSUMERE CHE GIACCIA IL VALORE VERO TALE INTERVALLO E’ DETTO INTERVALLO DI CONFIDENZA I SUOI LIMITI SONO DETTI: LIMITI DI CONFIDENZA

62 Confidenza INTRODURRE LA SPIEGAZIONE DELLA SCELTA DELL’INTERVALLO E DEL VALORE DI Z Coefficienti per il calcolo dei limiti di confidenza ( N>30) P% 90 95 98 99 z 1.645 1.960 2.326 2.576

63 Teoria dei piccoli campioni
La distribuzione t di Student Dove B è la funzione beta data da:

64 La distribuzione t di Student

65 La distribuzione t di Student

66 dove il valore di t dipende: 1) dal numero di gradi di libertà
La distribuzione t di Student Più la popolazione si riduce più l’incertezza introdotta usando s per stimare  aumenta, allora: dove il valore di t dipende: 1) dal numero di gradi di libertà 2) dal livello di confidenza voluto

67 Limiti di confidenza: esempio
Sette misure di pH: 5.12; 5.20; 5.15; 5.17; 5.16; 5.19; 5.15 Gradi di liberta: 7-1 = 6 Media: 5.163 s2: sem: Calcolo del limite di confidenza per P=0.95 (a=0.05) a/2=0.025 quindi si cerca il valore di t per P = e DF = 6 t = 2.447 pH = ± 2.447· = 5.16 ± 0.025 Calcolo del limite di confidenza per P=0.99 (a=0.01) t = 3.707 a/2=0.005 quindi si cerca il valore di t per P = e DF = 6 pH = ± 3.707· = 5.16 ± 0.04

68 TEST DI ACCURATEZZA: TEST t
TEST DI SIGNIFICATIVITÀ Quando si effettua un test di significatività si deve definire una ipotesi (ipotesi nulla,H0) la cui verità è confermata o rigettata. All’ipotesi nulla si contrappone l’ipotesi alternativa, H1, che è la negazione dell’ipotesi nulla. TEST DI ACCURATEZZA: TEST t Confronto di una media sperimentale con un valore noto Confronto delle medie di due campioni TEST DI PRECISIONE: TEST F Confronto delle deviazioni standard di due serie di misure

69 TEST DI SIGNIFICATIVITÀ
Ipotesi nulla, H0: H0: mA = mA Ipotesi alternativa, H1: H1: mA  mA a e b non sono complementari

70 Errore di I e II tipo

71 TEST DI ACCURATEZZA: TEST t
Confronto di una media sperimentale con un valore noto Il campione di dimensione n media m e varianza s2 , può considerarsi appartenete alla popolazione di media ?. L’ipotesi nulla è che non vi sia differenza fra i due valori  = m ± t (s/n) tcalc = (m- ) (s/  n) se |t| >tcrit allora H0 è scartata

72 TEST DI ACCURATEZZA: TEST t
Confronto delle medie di due campioni I due campioni indipendenti di dimensione n1 e n2 , media m1 e m2 e varianza s12 e s22 , possono considerarsi appartenenti alla popolazione di media  =  1 =  2? L’ipotesi nulla è che i due metodi diano lo stesso risultato Se s12 e s22 sono omoscedastiche:

73 TEST DI ACCURATEZZA: TEST t
Confronto delle medie di due campioni Se s12 e s22 sono eteroscedastiche non è possibile calcolare una varianza comune. Si applica il test di Cochran: Si confronta Con Dove: t1 è il tcrit per (n1-1) df t2 è il tcrit per (n2-1) df

74 Test a una e a due code AMPLIARE QUESTA PARTE I test che sono stati descritti sono detti a due code. Infatti la differenza fra le due medie può esistere in entrambe le direzioni. In alcuni casi può essere utile chiedersi se un determinato valore sia significativamente maggiore (o minore) di un altra. Un esempio può essere la resa di una reazione o l’efficienza di una estrazione. In tutti questi casi sono più opportuni i test a una coda. In un test a una coda il tcrit per P=0.05 è il valore che è superato con una probabilità del 5%. Per la simmetria della distribuzione della media, questa probabilità è la metà di quella che si otterrebbe in un test a due code, per cui il valore appropriato di t per il test a una coda si trova nella colonna di P=0.10. Test a una coda con a = si usa t = 1 – a Test a due code con a = si usa t = 1 – a/2

75 Test a una e a due code: esempio

76 Valori di t per diversi gradi di libertà e limiti di confidenza.
La probabilità per la variabile di essere fuori dell’intervallo –t,t è pari ad a.

77 Presentazione dei risultati

78 TEST DI PRECISIONE: TEST F
Il test F considera il rapporto di due varianze: scritto in modo che F > 1 H0: le popolazioni da cui sono stati estratti campioni sono normali e le varianze delle popolazioni sono identiche. Se Fcalc > Fcrit , H0 è rigettata

79 TEST DI PRECISIONE: TEST F
test a una coda Se si vuole verificare se un metodo è più preciso di un altro: test a due code Se si vuole verificare se due s differiscono significativamente:

80 DATI SOSPETTI: TEST Q di DIXON
Si dispongono i dati in ordine crescente e si calcola il valore di Q: Il DIVARIO e l’INTERVALLO, e di conseguenza il valore di Q, dipendono dalla dimensione del set di dati Il Qcalc viene poi confrontato con tabelle che riportano i valori critici di Q per l’intervallo di confidenza desiderato

81 DATI SOSPETTI: TEST Q di DIXON
Dato un insieme di n dati, la prima operazione è il loro ordinamento in ordine crescente Dimensione campione da 3 a 7 oppure Dimensione campione da 8 a 12 oppure Dimensione campione > 13 oppure Se Qcalc > Qtab il dato sospetto andrebbe scartato

82 DATI SOSPETTI: TEST Q di DIXON

83 Risultati determinazione Ni con DimetilGliossima

84 Test di normalità H0: le osservazioni appartengono ad una popolazione caratterizzata da una legge di probabilità normale TEST DI SHAPIRO-WILK ESEMPIO Prima serie di dati (n=16) : 90, 90, 80, 90, 92, 88, 90, 63, 70, 54, 78, 86, 99, 84, 56, 85 Seconda serie di dati (n=25): 19, 25, 26, 32, 35, 36, 38, 38, 41, 44, 44, 46, 46, 47, 48, 49, 50, 52, 54, 57, 58, 63, 64, 68, 76

85 Test di Shapiro Wilk: Serie 1

86 Test di Shapiro Wilk: Serie 1

87 Test di Shapiro Wilk: Serie 1
Dalle tavole di valori critici si legge per n=16 e a = 0.05 (P=0.95) Wa = 0.981 Siccome W < Wa abbiamo il 95% di probabilità di non sbagliare nell’affermare che la distribuzione NON È NORMALE

88 Test di Shapiro Wilk: Serie 2

89 Test di Shapiro Wilk: Serie 2
Dalle tavole di valori critici si legge per n=25 e a = 0.05 (P=0.95) Wa = 0.985 Siccome W > Wa abbiamo il 95% di probabilità di non sbagliare nell’affermare che la distribuzione È NORMALE

90 Shewart ha introdotto le carte di controllo
Controllo di qualità Il controllo statistico di qualità fu introdotto da W.A.Shewart nel 1924 (Bell telephones) “Quality improvement is the process of reducing the level of variability in a process so that it can be predicted” Shewart ha introdotto le carte di controllo consentono di mantenere in osservazione continua un sistema per rilevare variabilità nelle sue prestazioni

91 Tipi di carte di controllo
1. Carte di controllo della tendenza centrale 2. Carte di controllo della dispersione 3. Carte di controllo di misure singole UCL UWL CL LWL LCL

92 Criterio nella scelta delle unità prodotte
Costruzione delle carte di controllo DEFINIRE A PRIORI: Parametro da esaminare Frequenza ispezioni Criterio nella scelta delle unità prodotte Misure da effettuare Strumenti di misura Unità di misura

93 I parametri di controllo vanno determinati utilizzando un training set
Costruzione delle carte di controllo I parametri di controllo vanno determinati utilizzando un training set Campionamento del sistema effettuando almeno 100 osservazioni suddivise in campioni Si ottiene: le medie dei singoli campioni: la media generale il campo di variazione dei singoli campioni la media dei campi di variazione

94 SENZA CAMPIONE NON CI PUÒ
Trattamento del campione SENZA CAMPIONE NON CI PUÒ ESSERE ALCUNA ANALISI Da Skoog, West, Holler: Chimica analitica

95 Il campione deve essere rappresentativo della popolazione di origine
CAMPIONAMENTO Il campione deve essere rappresentativo della popolazione di origine Gli elementi della popolazione vanno scelti in modo casuale ma seguendo regole precise Campione aleatorio o casuale: gli elementi disponibili della popolazione di riferimento hanno la stessa probabilità di entrare a far parte del campione

96 CAMPIONAMENTO I campioni si estraggono in base a diversi piani di campionamento Campionamento elementare (a stadi) Si estraggono a caso dalla popolazione di origine i singoli elementi che entrano nel campione Campionamento a grappoli Popolazione di origine ripartita in sottoinsiemi (grappoli) con un criterio di omogeneità Ogni grappolo è un’unità primaria di campionamento. Campionamento sistematico In questo caso si ordinano e numerano gli elementi dell’insieme di partenza e si prelevano ad intervalli regolari. Il punto di partenza del campionamento dovrebbe essere scelto in modo casuale.

97 Esempio di tavola di numeri casuali

98 Uso dei numeri casuali Un numero casuale è un numero composto da cinque cifre, ciascuna delle quali è stata estratta, in modo aleatorio, da un insieme di dieci cifre (da 0 a 9) in modo che ogni cifra abbia una probabilità su dieci di essere estratta. A questo punto numeriamo i campioni (dando lo stesso numero di cifre a tutti i campioni). Si sceglie una pagina delle tavole e si sceglie in modo arbitrario una riga e una colonna da cui si comincia la lettura dei numeri. Si opta per quale delle cinque cifre deve essere letta e si cominciano a elencare i vari numeri mantenendo quelli che corrispondono ai campioni (per ottenere una serie di numeri casuali si può visitare il sito

99 Tipi di Campionamento:
dal Decreto 13 Settembre 1999

100 Zone di Campionamento:

101 Zone di Campionamento:

102 Zone di Campionamento:

103 Un reticolo ideale determina la suddivisione della zona da campionare
Campionamento sistematico Un reticolo ideale determina la suddivisione della zona da campionare I settori risultanti sono di uguali dimensioni. Il loro numero dipende dal dettaglio voluto All’interno di ogni UC si preleva casualmente un campione

104 Si scelgono i punti usando tabelle di numeri casuali
Campionamento irregolare Si scelgono i punti usando tabelle di numeri casuali Si preleva il campione all’interno del punto

105 Si scelgono i punti lungo un tracciato a X o W
Campionamento non sistematico Si scelgono i punti lungo un tracciato a X o W Si preleva un campione elementare in ogni punto


Scaricare ppt "Il numero di cifre significative indica la precisione dell’esperimento"

Presentazioni simili


Annunci Google