Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento.

Slides:



Advertisements
Presentazioni simili
Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Advertisements

8) GLI INTERVALLI DI CONFIDENZA
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
2. Introduzione alla probabilità
STATISTICA A – K (60 ore) Esercizi di riepilogo al corso
20 – Lincertezza di misura Tecnologie Informatiche per la Qualità Università degli Studi di Milano – Polo di Crema - Dipartimento di Tecnologie dellInformazione.
variabili aleatorie discrete e continue
STATISTICA DESCRITTIVA
Distribuzione Normale o Curva di Gauss
STATISTICA DESCRITTIVA
Intervalli di confidenza
Proprietà degli stimatori
Scale di misura delle variabili
Fondamenti della Misurazione
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Intervalli di Confidenza
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Inferenza statistica per un singolo campione
Valutazione delle ipotesi
CONFRONTO TRA DUE MEDIE:
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
intervallo di confidenza e test di significatività per una proporzione
DALL'INTERVALLO DI PROBABILITÀ
Varianza campionaria Errore standard della varianza campionaria
Campionamento casuale semplice
DIFFERENZA TRA LE MEDIE
Analisi della varianza (a una via)
1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.
Distribuzioni di probabilità
Appunti di inferenza per farmacisti
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
Stima dei parametri di una distribuzione
Lezione 8 Numerosità del campione
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
Lezione 6 Inferenza statistica
Lezione 5 Strumenti statistici: campioni e stimatori
Test della differenza tra le medie di due popolazioni
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Le distribuzioni campionarie
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
STATISTICA INFERENZIALE
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Gli indici di dispersione
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
IL CAMPIONE.
“Teoria e metodi della ricerca sociale e organizzativa”
Le distribuzioni campionarie
Def : uno stimatore è una statistica T n le cui determinazioni servono a fornire delle stime del parametro ignoto  della v.c. X in cui sono state effettuate.
Intervalli di confidenza
La distribuzione campionaria della media
Elaborazione statistica di dati
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Campionamento procedimento attraverso il quale si estrae, da un insieme di unità (popolazione) costituenti l’oggetto delle studio, un numero ridotto di.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Inferenza.
A partire da determinate condizioni iniziali, un esperimento e’ l’osservazione del verificarsi di qualche “accadimento” che, se si ripete l’esperimento.
Scienze tecniche e psicologiche
Il DEFF Il DEFF (Design EFFect) è l’Effetto del Piano di
Transcript della presentazione:

Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento

Nomenclatura Indicheremo con U una popolazione, con N la sua numerosità, con k la sua etichetta e con lettere maiuscole i valori di interesse (Y k ) Se Y è un carattere quantitativo sono di interesse il totale, la media aritmetica e la varianza Se Y è qualitativo interessano le proporzioni degli elementi suddivise per ogni modalità Indicheremo con c un campione, con n la sua numerosità, con i la sua etichetta, con Y i * la variabile aleatoria continua associata e con le lettere maiuscole le realizzazioni campionarie (y i )

Stimatori La struttura di un generico stimatore lineare è una funzione delle variabile aleatoria continua dove a i rappresenta un coefficiente o un peso Le proprietà più importanti di uno stimatore che permettono di valutarne la qualità sono: Correttezza: valore atteso di * è uguale a Consistenza: limite n p( n *) converge a Efficienza: lerrore quadratico medio di *, ossia E( * - ) 2, tende alla varianza di * *

Disposizioni con ripetizione Consideriamo un campione di ampiezza n=2 di una popolazione U={1, 2, 3, 4} con quindi N=4 I campioni sono ordinati Gli elementi dellinsieme sono: (1,1) (1,2) (1,3) (1,4) (2,1) (2,2) (2,3) (2,4) (3,1) (3,2) (3,3) (3,4) (4,1) (4,2) (4,3) (4,4) è formato da 16 punti campione: N = 2 n = 16 Notare che (1,1), (2,2), (3,3), (4,4) derivano dallaver pescato due volte lo stesso elemento

Disposizioni senza ripetizione Consideriamo un campione di ampiezza n=2 di una popolazione U={1, 2, 3, 4} con quindi N=4 I campioni sono sempre ordinati Gli elementi dellinsieme sono: (1,1) (1,2) (1,3) (1,4) (2,1) (2,2) (2,3) (2,4) (3,1) (3,2) (3,3) (3,4) (4,1) (4,2) (4,3) (4,4) è formato adesso da 12 punti campione, cioè (N) n = N (N-1) (N-2) ….. (N-n+1) = 4 · 3 = 12 Notare che lelemento (i, j) è distinto da (j, i)

Combinazioni con ripetizione Consideriamo un campione di ampiezza n=2 di una popolazione U={1, 2, 3, 4} con quindi N=4 I campioni non tengono conto dellordine Gli elementi dellinsieme sono: (1,1) (1,2) (1,3) (1,4) (2,2) (2,3) (2,4) (3,3) (3,4) (4,4) è formato da 10 punti campione:

Combinazioni senza ripetizione Consideriamo un campione di ampiezza n=2 di una popolazione U={1, 2, 3, 4} con quindi N=4 I campioni non tengono conto dellordine e non possono essere ripetuti Gli elementi dellinsieme sono: (1,2) (1,3) (1,4) (2,3) (2,4) (3,4) è formato da 6 punti campione:

Esempio 1 Consideriamo una popolazione X={1, 2, 3, 4, 5} in cui ogni elemento ha probabilità 0.2 e una popolazione Y={1, 2, 3, 4, 5} con elementi aventi probabilità p(Y) = (0.4, 0.2, 0.2, 0.1, 0.1)

Valori della popolazione Media e varianza della popolazione X è: E(X) = X = k=1…N x k p(x k ) = 3 Var(X) = X 2 = k=1…N (x k – E(X)) 2 / N = 2 Il problema è quello di stimare i parametri e della popolazione usando i dati del campione Media e varianza della popolazione Y è: E(Y) = Y = k=1…N x k p(y k ) = 2.3 Var(Y) = Y 2 = k=1…N (y k – E(Y)) 2 / N = 1.81

Campioni di numerosità 2

Alcuni casi Caso (2, 1) p(X) = 0.2 · 0.2 = 0.04 p(Y) = 0.4 · 0.2 = 0.08 media stimata = (2 + 1) / 2 = 1.5 varianza stimata = [(2-1.5) 2 + (1-1.5) 2 ] / 2 = 0.25 Caso (4, 3) p(X) = 0.2 · 0.2 = 0.04 p(Y) = 0.1 · 0.2 = 0.02 media stimata = (4 + 3) / 2 = 3.5 varianza stimata = [(4-3.5) 2 + (3-3.5) 2 ] / 2 = 0.25

Distribuzioni parametri x p(x) y p(y) var(x) p(var(x)) var(y) p(var(y))

Conclusioni Considerando le variabili aleatorie X e Y E(var(X))= i=1,N var(x i ) p(var(x i )) = 1 (0 · · · · · 0.08) E(var(Y))= i=1,N var(y i ) p(var(y i )) = (0 · · · · · 0.08) La varianza della distribuzione delle medie ha valore quello della varianza della popolazione divisa per la numerosità del campione E(X ) = 3 = µ X E(Y ) = 2.3 = µ Y

Valore medio della media In generale X rappresenta una caratteristica della popolazione con E(X)=µ sconosciuta e var(X) = 2 sconosciuta = n / n Se x 1, x 2, …, x n è un campione estratto da X si considerano X 1, X 2, …, X n variabili aleatorie con la stessa legge (uguale media e varianza) di X La media del valore di X risulta = ( + + …. + ) / n = = [E(X 1 ) + E(X 2 ) + …. + E(X n )] / n = E(X) = E((X 1 + X 2 + …. + X n ) / n) = =

Varianza della media = n 2 / n2n2 = ( …. + 2 ) / n2 n2 = = [var(X 1 ) + var(X 2 ) + …. + var(X n )] / n2 n2 = var(X) = var((X 1 + X 2 + …. + X n ) / n) = = / n In conclusione la distribuzione delle medie ha la medesima media della distribuzione della popolazione ma dispersione minore ( 2 /n) Questa quantità è chiamata errore standard della media (mean standard error, MSE) e viene indicata con x = / n

Stima Uno degli scopi della statistica inferenziale è quello di ottenere informazioni circa i parametri di una popolazione (considerati fissi) a partire da valori determinati in base al campione I valori del campione possono essere considerati come i valori assunti da variabili aleatorie che hanno la stessa legge della popolazione dalla quale provengono Si cercano indicazioni il più possibile precise sui parametri ignoti di una popolazione (media e varianza) attraverso i valori campionari (processo di stima)

Stimatore La stima dei parametri di una popolazione si effettua attraverso uno stimatore che fornisce un valore approssimato del parametro lo stimatore è una funzione T(X 1, X 2,...., X n ) del campione la stima è il risultato dello studio: t(x 1, x 2,...., x n ) Siano X 1, X 2,...., X n n variabili aleatorie indipendenti con la legge uguale a X siano x 1, x 2,...., x n i valori assunti dalle n variabili aleatorie nella realizzazione dello studio

Processo di stima Lo stimatore T è quindi una regola che si utilizza per determinare il possibile valore del parametro incognito (media, varianza) Quando la regola è stata stabilita saranno i valori del campione a determinare la stima t del parametro. Se una caratteristica X (variabile aleatoria) della popolazione ha legge f(x) significa che ciascun elemento del campione X 1, X 2,...., X n è a sua volta una variabile aleatoria di legge f(x) ed è quindi possibile determinare f(x 1 ), f(x 2 ),...., f(x n )

Determinare la norma Risulta sempre nota la legge di X ma non sono noti (incognite) uno o più parametri della sua distribuzione Ad esempio: X ha legge Binomiale [X~B(n,p)]: p è sconosciuto X ha legge di Poisson [X~P(k)]: k è sconosciuto X ha legge di Gaussiana [X~N(µ, )]: µ e/o sono sconosciuti