La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento.

Presentazioni simili


Presentazione sul tema: "Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento."— Transcript della presentazione:

1 Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento

2 Nomenclatura Indicheremo con U una popolazione, con N la sua numerosità, con k la sua etichetta e con lettere maiuscole i valori di interesse (Y k ) Se Y è un carattere quantitativo sono di interesse il totale, la media aritmetica e la varianza Se Y è qualitativo interessano le proporzioni degli elementi suddivise per ogni modalità Indicheremo con c un campione, con n la sua numerosità, con i la sua etichetta, con Y i * la variabile aleatoria continua associata e con le lettere maiuscole le realizzazioni campionarie (y i )

3 Stimatori La struttura di un generico stimatore lineare è una funzione delle variabile aleatoria continua dove a i rappresenta un coefficiente o un peso Le proprietà più importanti di uno stimatore che permettono di valutarne la qualità sono: Correttezza: valore atteso di * è uguale a Consistenza: limite n p( n *) converge a Efficienza: lerrore quadratico medio di *, ossia E( * - ) 2, tende alla varianza di * *

4 Disposizioni con ripetizione Consideriamo un campione di ampiezza n=2 di una popolazione U={1, 2, 3, 4} con quindi N=4 I campioni sono ordinati Gli elementi dellinsieme sono: (1,1) (1,2) (1,3) (1,4) (2,1) (2,2) (2,3) (2,4) (3,1) (3,2) (3,3) (3,4) (4,1) (4,2) (4,3) (4,4) è formato da 16 punti campione: N = 2 n = 16 Notare che (1,1), (2,2), (3,3), (4,4) derivano dallaver pescato due volte lo stesso elemento

5 Disposizioni senza ripetizione Consideriamo un campione di ampiezza n=2 di una popolazione U={1, 2, 3, 4} con quindi N=4 I campioni sono sempre ordinati Gli elementi dellinsieme sono: (1,1) (1,2) (1,3) (1,4) (2,1) (2,2) (2,3) (2,4) (3,1) (3,2) (3,3) (3,4) (4,1) (4,2) (4,3) (4,4) è formato adesso da 12 punti campione, cioè (N) n = N (N-1) (N-2) ….. (N-n+1) = 4 · 3 = 12 Notare che lelemento (i, j) è distinto da (j, i)

6 Combinazioni con ripetizione Consideriamo un campione di ampiezza n=2 di una popolazione U={1, 2, 3, 4} con quindi N=4 I campioni non tengono conto dellordine Gli elementi dellinsieme sono: (1,1) (1,2) (1,3) (1,4) (2,2) (2,3) (2,4) (3,3) (3,4) (4,4) è formato da 10 punti campione:

7 Combinazioni senza ripetizione Consideriamo un campione di ampiezza n=2 di una popolazione U={1, 2, 3, 4} con quindi N=4 I campioni non tengono conto dellordine e non possono essere ripetuti Gli elementi dellinsieme sono: (1,2) (1,3) (1,4) (2,3) (2,4) (3,4) è formato da 6 punti campione:

8 Esempio 1 Consideriamo una popolazione X={1, 2, 3, 4, 5} in cui ogni elemento ha probabilità 0.2 e una popolazione Y={1, 2, 3, 4, 5} con elementi aventi probabilità p(Y) = (0.4, 0.2, 0.2, 0.1, 0.1)

9 Valori della popolazione Media e varianza della popolazione X è: E(X) = X = k=1…N x k p(x k ) = 3 Var(X) = X 2 = k=1…N (x k – E(X)) 2 / N = 2 Il problema è quello di stimare i parametri e della popolazione usando i dati del campione Media e varianza della popolazione Y è: E(Y) = Y = k=1…N x k p(y k ) = 2.3 Var(Y) = Y 2 = k=1…N (y k – E(Y)) 2 / N = 1.81

10 Campioni di numerosità 2

11 Alcuni casi Caso (2, 1) p(X) = 0.2 · 0.2 = 0.04 p(Y) = 0.4 · 0.2 = 0.08 media stimata = (2 + 1) / 2 = 1.5 varianza stimata = [(2-1.5) 2 + (1-1.5) 2 ] / 2 = 0.25 Caso (4, 3) p(X) = 0.2 · 0.2 = 0.04 p(Y) = 0.1 · 0.2 = 0.02 media stimata = (4 + 3) / 2 = 3.5 varianza stimata = [(4-3.5) 2 + (3-3.5) 2 ] / 2 = 0.25

12 Distribuzioni parametri x1.01.52.02.53.03.54.04.55.0 p(x)0.040.080.120.160.200.160.120.080.04 y1.01.52.02.53.03.54.04.55.0 p(y)0.16 0.200.16 0.080.050.020.01 var(x)00.2512.254 p(var(x))0.200.320.240.160.08 var(y)00.2512.254 p(var(y))0.260.300.240.120.08

13 Conclusioni Considerando le variabili aleatorie X e Y E(var(X))= i=1,N var(x i ) p(var(x i )) = 1 (0 · 0.20 + 0.25 · 0.32 + 1 · 0.24 + 2.25 · 0.16 + 4 · 0.08) E(var(Y))= i=1,N var(y i ) p(var(y i )) = 0.905 (0 · 0.26 + 0.25 · 0.30 + 1 · 0.24 + 2.25 · 0.12 + 4 · 0.08) La varianza della distribuzione delle medie ha valore quello della varianza della popolazione divisa per la numerosità del campione E(X ) = 3 = µ X E(Y ) = 2.3 = µ Y

14 Valore medio della media In generale X rappresenta una caratteristica della popolazione con E(X)=µ sconosciuta e var(X) = 2 sconosciuta = n / n Se x 1, x 2, …, x n è un campione estratto da X si considerano X 1, X 2, …, X n variabili aleatorie con la stessa legge (uguale media e varianza) di X La media del valore di X risulta = ( + + …. + ) / n = = [E(X 1 ) + E(X 2 ) + …. + E(X n )] / n = E(X) = E((X 1 + X 2 + …. + X n ) / n) = =

15 Varianza della media = n 2 / n2n2 = ( 2 + 2 + …. + 2 ) / n2 n2 = = [var(X 1 ) + var(X 2 ) + …. + var(X n )] / n2 n2 = var(X) = var((X 1 + X 2 + …. + X n ) / n) = = / n In conclusione la distribuzione delle medie ha la medesima media della distribuzione della popolazione ma dispersione minore ( 2 /n) Questa quantità è chiamata errore standard della media (mean standard error, MSE) e viene indicata con x = / n

16 Stima Uno degli scopi della statistica inferenziale è quello di ottenere informazioni circa i parametri di una popolazione (considerati fissi) a partire da valori determinati in base al campione I valori del campione possono essere considerati come i valori assunti da variabili aleatorie che hanno la stessa legge della popolazione dalla quale provengono Si cercano indicazioni il più possibile precise sui parametri ignoti di una popolazione (media e varianza) attraverso i valori campionari (processo di stima)

17 Stimatore La stima dei parametri di una popolazione si effettua attraverso uno stimatore che fornisce un valore approssimato del parametro lo stimatore è una funzione T(X 1, X 2,...., X n ) del campione la stima è il risultato dello studio: t(x 1, x 2,...., x n ) Siano X 1, X 2,...., X n n variabili aleatorie indipendenti con la legge uguale a X siano x 1, x 2,...., x n i valori assunti dalle n variabili aleatorie nella realizzazione dello studio

18 Processo di stima Lo stimatore T è quindi una regola che si utilizza per determinare il possibile valore del parametro incognito (media, varianza) Quando la regola è stata stabilita saranno i valori del campione a determinare la stima t del parametro. Se una caratteristica X (variabile aleatoria) della popolazione ha legge f(x) significa che ciascun elemento del campione X 1, X 2,...., X n è a sua volta una variabile aleatoria di legge f(x) ed è quindi possibile determinare f(x 1 ), f(x 2 ),...., f(x n )

19 Determinare la norma Risulta sempre nota la legge di X ma non sono noti (incognite) uno o più parametri della sua distribuzione Ad esempio: X ha legge Binomiale [X~B(n,p)]: p è sconosciuto X ha legge di Poisson [X~P(k)]: k è sconosciuto X ha legge di Gaussiana [X~N(µ, )]: µ e/o sono sconosciuti


Scaricare ppt "Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento."

Presentazioni simili


Annunci Google