La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Varianza campionaria Errore standard della varianza campionaria.

Presentazioni simili


Presentazione sul tema: "Varianza campionaria Errore standard della varianza campionaria."— Transcript della presentazione:

1 Varianza campionaria Errore standard della varianza campionaria

2 Data una popolazione composta da N unità, {x} = 2,3,6,8,11, μ=6, σ 2 =10.8 Possibili campioni 05(2,2);(3,3);(6,6);(8,8);(11,11) (2,3);(3,2) (6,8);(8,6); (3,6);(6,3);(8,11);(11,8); (2,6);(6,2); (3,8);(8,3);(6,11);(11,6); (2,8);(8,2); (3,11);(11,3); (2,11);(11,2); calcolo della media aritmetica e della varianza della varianza campionaria. Media= 270/25= Varianza= 3903/25= Media (s 2 ) = 2 Varianza(s 2 ) = 2 4 /(N-1) 2 4 /(N-1)=2* /4=58.32 Varianza(s 2 )= dove (μ 4 -(2/4) μ 2 2 )/4= Nota:

3 Data una popolazione, costituita da soggetti in buona salute e di età compresa tra i 25 e i 50 anni, la distribuzione dei livelli ematici di calcio approssima una gaussiana con media = 240 e deviazione standard = 15 moli/dl. Dalla stessa popolazione si sono poi estratti: 1000 campioni di dimensione n = campioni di dimensione n = campioni di dimensione n = campioni di dimensione n = 10 Di ciascun campione si sono calcolate la media e la varianza.

4 Come già sappiamo, all'aumentare della dimensione del campione la distribuzione delle medie campionarie è gaussiana con varianza inversamente proporzio- nale alla dimensione del campione.... ma come sono distribuite le varianze campionarie? calcemia media in campioni di numerosità 2, 3, …., 40

5 La distribuzione delle varianze campionarie dipende dalla dimensione del campione non solo per la dispersione ma anche per la forma: l'asimmetria positiva, assai elevata se i campioni sono molto piccoli, si riduce lentamente all'aumentare della numerosità campionaria., Varianza della calcemia in campioni di numerosità 2, 3, …., 40

6 VARIANZE CAMPIONARIEn σ2σ2σ2σ2 2 4 / 2 4 / Si può dimostrare che il valore atteso E(s 2 ) delle varianze campionarie coincide con la varianza dell'universo ( 2 ) da cui si sono estratti i campioni, e che se tale universo ha distribuzione gaussiana, la varianza delle varianze campionarie è pari a due volte il quadrato della varianza diviso per i gradi di libertà ( ) della varianza campionaria. Il numero di gradi di libertà della varianza campionaria è dato dal numero di scarti indipendenti su cui essa è basata. Mentre gli n elementi del campione sono indipendenti, gli scarti dalla media campionaria non lo sono: infatti, dati n-1 scarti, lo scarto restante è univocamente determinato dal vincolo. E(s 2 )= 2 se x~N (, 2 ), V(s 2 )=2 4 / Perciò i gradi di libertà di una varianza campionaria sono pari a n-1

7 In sintesi Si vuole studiare una caratteristica X presente nelle N unità di una popolazione. Popolazione: N unità con media e deviazione standard ; da essa si estrae un campione (con reinserimento) di ampiezza n ottenendo (N n possibili campioni) Voglio conoscere ignoto Voglio conoscere ignoto se e solo se x~N (, 2 ). dove Varianza(s 2 )= Formula esatta

8 FUNZIONE CHI-QUADRATO Si può dimostrare che, se i campioni sono tratti da una variabile gaussiana, il rapporto s 2 / 2 è una variabile casuale, la cui distribuzione può essere descritta da una funzione la cui forma dipende da, e che è nota con il nome di 2 (Chi-quadrato): dove

9 Frattili della distribuzione 2 (Chi-quadrato)

10 USO DELLA DISTRIBUZIONE CHI-QUADRATO Esempio: Si vogliono calcolare il 5° e il 95° percentile della distribuzione delle varianze campionarie per campioni di dimensione n=10 tratti dalla distribuzione dei livelli ematici di Calcio [x ~ N (240, 225)]. Pertanto i corrispondenti per- centili della distribuzione delle varianze campionarie sono Dalla tabella si ricava che il 5° ed il 95° percentile della distribuzione 2 con 9 gradi di libertà sono

11 Esempio Durante un progetto di screening sullipertensione, si è analizzata una popolazione in cui la pressione sistolica media era 120 mmHg con dev. stand. 20 mmHg. a) Estraendo a caso un campione di 100 soggetti, qual è la probabilità che la pressione sistolica media sia > di 126 mmHg? b) Qual è il valore di pressione sistolica media oltre il quale si trovano il 10% delle pressioni sistoliche medie più alte? Risposte a) Supponendo che la pressione sistolica si distribuisca nella popolazione come una normale: b)

12 Qual è lerrore standard della media campionaria calcolata su un campione di 16 unità, se la popolazione dalla quale è stato estratto il campione si distribuisce in modo gaussiano come =80 e =20? Calcolare inoltre: 1) La probabilità che la media del campione sia maggiore di 85. 2) La probabilità che una unità estratta dalla popolazione abbia un valore compreso tra 83 e 88. 3) Quante delle 16 unità campionarie vi aspettate abbiano un valore > 83? Esempio 2 3) Delle 16 unità campionarie ci si aspetta che ( )=7.046 abbiano un valore di x maggiore di 83. 1) Lerrore standard delle medie campionarie è: 2) = Risposte

13 Esempio (3) Una variabile casuale ha distribuzione gaussiana con =80 e =8. La distribuzione di campionamento della media per campioni di numerosità 25, … [indicare la risposta corretta]. [A] è gaussiana con media 80 e deviazione standard 8 [B] è gaussiana con media 80 e deviazione standard 8/25 [C] è di forma ignota con media 80 e deviazione standard 8/25 [D] è gaussiana con media 80 e deviazione standard 8/5 Esempio 4 La distribuzione della variabile x è asimmetrica positiva, con media = g/m 3 e deviazione standard =2.25 g/m 3. Descrivete la forma della distribuzione delle medie di campioni di dimensioni uguale a 40. Per il teorema del limite centrale la distribuzione delle medie di una variabile casuale x calcolate su campioni di numerosità 40 è gaussiana con media = g/m 3 ed errore standard =2.25/40 g/m 3 = g/m 3.

14 La statura degli iscritti alla leva nati nel Molise nel 1974 è distribuita in modo gaussiano con media pari a cm e dev stand pari a 6.4. Qual è la probabilità che, considerata la statura di 3 iscritti alla leva (x 1,x 2,x 3 ) si abbia: La variabile w è ottenuta come somma dei quadrati di 3 variabili casuali gaussiane standardizzate, si distribuisce quindi come un chi-quadrato con 3 gradi di libertà. Pertanto, la probabilità di osservare un valore di w maggiore di 6.15 si ricava direttamente dalle tavole della distribuzione chi-quadrato: Esempio 5 Per definizione, la variabile chi-quadrato con n-1 gdl è la somma di n variabili zeta al quadrato

15 Esempio 6 Calcolare la probabilità che rifendosi ad una distribuzione chi- quadrato: a) la variabile X 2 con 17 gradi di libertà abbia valori nellintervallo [10.09;24.77]; b) la variabile X 2 con 3 gradi di libertà abbia valori tra il 20° e il 50° centile della distribuzione; c) la variabile X 2 con 5 gradi di libertà abbia un valore minore di a) b) c) Risposte

16 Si considerino n distribuzioni normali Z 1 (0;1); Z 2 (0;1);... Z ν (0;1) con media nulla e varianza unitaria indipendenti tra loro. Sarà : χ² ν = Z 1 ² + Z 2 ² Z ν ² La funzione di densità f(x) per x = χ² ν dove Γ() è la funzione Gamma. Pertanto si ottiene: valore atteso μ = ν (dove ν sono i gradi di libertà) varianza σ² = 2 ν simmetria β 1 = 8/ ν curtosi β 2 = / ν moda ν 0 = ν -2 (per ν 3) Appendice: funzione χ² ν chi quadro con ν gradi di libertà

17 Statistica dello scarto quadratico medio Sia s 2 lo scarto quadratico medio di una serie di misure: con la variabile h: è distribuita come il con n-1 gradi di libertà. dove E(h) è il valore aspettato di h, mentre V(h) è la sua varianza. Si ha quindi: E quindi:

18 Inoltre per sufficientemente grande dove è la distribuzione normale con media e varianza. doveè la distribuzione normale con media e varianza. Una migliore approssimazione la si ottiene considerando che, sempre per sufficientemente grande, se e è distribuito come il allora è distribuito come: e quindi:


Scaricare ppt "Varianza campionaria Errore standard della varianza campionaria."

Presentazioni simili


Annunci Google