Scaricare la presentazione
PubblicatoVioletta Gallo Modificato 11 anni fa
1
Varianza campionaria Errore standard della varianza campionaria
2
Media (s2) = 2 Varianza(s2) = 24/(N-1)
Data una popolazione composta da N unità, {x} =2,3,6,8,11, μ=6, σ2=10.8 Possibili campioni 5 (2,2);(3,3);(6,6);(8,8);(11,11) 0.0 583.20 0.5 2 (2,3);(3,2) 1.0 212.18 2.0 (6,8);(8,6); 4.0 154.88 4.5 4 (3,6);(6,3);(8,11);(11,8); 18.0 158.76 8.0 (2,6);(6,2); 16.0 15.68 12.5 (3,8);(8,3);(6,11);(11,6); 50.0 11.56 (2,8);(8,2); 36.0 103.68 32.0 (3,11);(11,3); 64.0 898.88 40.5 (2,11);(11,2); 81.0 S 25 270.00 calcolo della media aritmetica e della varianza della varianza campionaria. Media (s2) = 2 Varianza(s2) = 24/(N-1) Media= /25= 10.80 Varianza= 3903/25= 24/(N-1)=2*10.82/4=58.32 Nota: Varianza(s2)= dove (μ4-(2/4) μ22)/4=
3
Dalla stessa popolazione si sono poi estratti:
Data una popolazione, costituita da soggetti in buona salute e di età compresa tra i 25 e i 50 anni, la distribuzione dei livelli ematici di calcio approssima una gaussiana con media = 240 e deviazione standard = 15 moli/dl. Dalla stessa popolazione si sono poi estratti: 1000 campioni di dimensione n = 2 1000 campioni di dimensione n = 3 1000 campioni di dimensione n = 4 1000 campioni di dimensione n = 10 Di ciascun campione si sono calcolate la media e la varianza.
4
calcemia media in campioni di numerosità 2 , 3 , …. , 40
Come già sappiamo, all'aumentare della dimensione del campione la distribuzione delle medie campionarie è gaussiana con varianza inversamente proporzio-nale alla dimensione del campione. ... ma come sono distribuite le varianze campionarie?
5
Varianza della calcemia
in campioni di numerosità 2 , 3 , …. , 40 La distribuzione delle varianze campionarie dipende dalla dimensione del campione non solo per la dispersione ma anche per la forma: l'asimmetria positiva, assai elevata se i campioni sono molto piccoli, si riduce lentamente all'aumentare della numerosità campionaria. ,
6
E(s2)=2 se x~N (, 2), V(s2)=24/n
VARIANZE CAMPIONARIE n σ2 24/n 2 1 222.65 225 96 013.22 101 250 3 214.48 44 893.13 50 625 4 226.15 34 950.30 33 750 10 9 221.50 11 378.49 11 250 Si può dimostrare che il valore atteso E(s2) delle varianze campionarie coincide con la varianza dell'universo (2) da cui si sono estratti i campioni, e che se tale universo ha distribuzione gaussiana, la varianza delle varianze campionarie è pari a due volte il quadrato della varianza diviso per i gradi di libertà (n) della varianza campionaria. E(s2)= se x~N (, 2), V(s2)=24/n Il numero di gradi di libertà della varianza campionaria è dato dal numero di scarti indipendenti su cui essa è basata. Mentre gli n elementi del campione sono indipendenti, gli scarti dalla media campionaria non lo sono: infatti, dati n-1 scarti, lo scarto restante è univocamente determinato dal vincolo. Perciò i gradi di libertà di una varianza campionaria sono pari a n-1
7
In sintesi Si vuole studiare una caratteristica X presente nelle N unità di una popolazione . Popolazione: N unità con media m e deviazione standard s; da essa si estrae un campione (con reinserimento) di ampiezza n ottenendo (Nn possibili campioni) Voglio conoscere ignoto Voglio conoscere ignoto se e solo se x~N (, 2). Formula esatta dove Varianza(s2)=
8
FUNZIONE CHI-QUADRATO
Si può dimostrare che, se i campioni sono tratti da una variabile gaussiana, il rapporto s2/2 è una variabile casuale, la cui distribuzione può essere descritta da una funzione la cui forma dipende da , e che è nota con il nome di 2 (Chi-quadrato): dove
9
Frattili della distribuzione 2 (Chi-quadrato)
10
USO DELLA DISTRIBUZIONE CHI-QUADRATO
Esempio: Si vogliono calcolare il 5° e il 95° percentile della distribuzione delle varianze campionarie per campioni di dimensione n=10 tratti dalla distribuzione dei livelli ematici di Calcio [x ~ N (240, 225)]. Dalla tabella si ricava che il 5° ed il 95° percentile della distribuzione 2 con 9 gradi di libertà sono Pertanto i corrispondenti per-centili della distribuzione delle varianze campionarie sono
11
Esempio Durante un progetto di screening sull’ipertensione, si è analizzata una popolazione in cui la pressione sistolica media era 120 mmHg con dev. stand. 20 mmHg. a) Estraendo a caso un campione di 100 soggetti, qual è la probabilità che la pressione sistolica media sia > di 126 mmHg? b) Qual è il valore di pressione sistolica media oltre il quale si trovano il 10% delle pressioni sistoliche medie più alte? Risposte a) Supponendo che la pressione sistolica si distribuisca nella popolazione come una normale: b)
12
1) La probabilità che la media del campione sia maggiore di 85.
Esempio 2 Qual è l’errore standard della media campionaria calcolata su un campione di 16 unità, se la popolazione dalla quale è stato estratto il campione si distribuisce in modo gaussiano come =80 e =20? Calcolare inoltre: 1) La probabilità che la media del campione sia maggiore di 85. 2) La probabilità che una unità estratta dalla popolazione abbia un valore compreso tra 83 e 88. 3) Quante delle 16 unità campionarie vi aspettate abbiano un valore > 83? Risposte 1) L’errore standard delle medie campionarie è: 2) = 3) Delle 16 unità campionarie ci si aspetta che (16 )=7.046 abbiano un valore di x maggiore di 83.
13
Esempio (3) Una variabile casuale ha distribuzione gaussiana con =80 e =8. La distribuzione di campionamento della media per campioni di numerosità 25, … [indicare la risposta corretta]. [A] è gaussiana con media 80 e deviazione standard 8 [B] è gaussiana con media 80 e deviazione standard 8/25 [C] è di forma ignota con media 80 e deviazione standard 8/25 [D] è gaussiana con media 80 e deviazione standard 8/5 Esempio 4 La distribuzione della variabile x è asimmetrica positiva, con media = g/m3 e deviazione standard =2.25 g/m3 . Descrivete la forma della distribuzione delle medie di campioni di dimensioni uguale a 40. Per il teorema del limite centrale la distribuzione delle medie di una variabile casuale x calcolate su campioni di numerosità 40 è gaussiana con media = g/m3 ed errore standard =2.25/√40 g/m3 = g/m3 .
14
Esempio 5 Per definizione, la variabile chi-quadrato con n-1 gdl è la somma di n variabili zeta al quadrato La statura degli iscritti alla leva nati nel Molise nel 1974 è distribuita in modo gaussiano con media pari a cm e dev stand pari a Qual è la probabilità che, considerata la statura di 3 iscritti alla leva (x1,x2,x3) si abbia: La variabile w è ottenuta come somma dei quadrati di 3 variabili casuali gaussiane standardizzate, si distribuisce quindi come un chi-quadrato con 3 gradi di libertà. Pertanto, la probabilità di osservare un valore di w maggiore di 6.15 si ricava direttamente dalle tavole della distribuzione chi-quadrato:
15
Esempio 6 Risposte a) b) c)
Calcolare la probabilità che rifendosi ad una distribuzione chi-quadrato: a) la variabile X2 con 17 gradi di libertà abbia valori nell’intervallo [10.09;24.77]; b) la variabile X2 con 3 gradi di libertà abbia valori tra il 20° e il 50° centile della distribuzione; c) la variabile X2 con 5 gradi di libertà abbia un valore minore di Risposte a) b) c)
16
La funzione di densità f(x) per x = χ²ν
Appendice: funzione χ²ν chi quadro con ν gradi di libertà Si considerino n distribuzioni normali Z1(0;1); Z2(0;1); ... Zν (0;1) con media nulla e varianza unitaria indipendenti tra loro. Sarà : χ²ν= Z1² + Z2² Zν² La funzione di densità f(x) per x = χ²ν dove Γ() è la funzione Gamma. Pertanto si ottiene: valore atteso μ = ν (dove ν sono i gradi di libertà) varianza σ² = 2 ν simmetria β1 = 8/ ν curtosi β2 = / ν moda ν0 = ν -2 (per ν ≥ 3)
17
Statistica dello scarto quadratico medio
Sia s2 lo scarto quadratico medio di una serie di misure: con la variabile h: è distribuita come il con n-1 gradi di libertà. Si ha quindi: dove E(h) è il valore aspettato di h, mentre V(h) è la sua varianza. E quindi:
18
Inoltre per sufficientemente grande
. Una migliore approssimazione la si ottiene considerando che, sempre per sufficientemente grande, se è la distribuzione normale con media dove e varianza è distribuito come il allora e varianza dove è la distribuzione normale con media è distribuito come: e . e quindi:
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.