Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoGiuseppa Dolce Modificato 8 anni fa
1
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Inferenza e Intervalli di confidenza 2.Stima dei parametri a intervalli 3.Intervalli di confidenza per la media (varianza nota) 4.Intervalli di confidenza per la media (varianza non nota) 5.Differenza tra statistica Z e T per piccoli campioni (dimostratore Excel) 6.Intervalli di confidenza per la proporzione 7.Corrispondenza tra IC e test di ipotesi bidirezionale (dimostratore Excel) 8.Dimensione campionaria e IC 9.Probabilità di copertura dell’ IC (dimostrazione Excel) 10.Definire la grandezza del campione in base al margine di errore 11.G-power come dimostratore 12.Comunicazioni conclusive
2
H0 con p 0 non bilanciato Una ditta afferma che il farmaco è efficace al 90%. In un campione di 200 persone che lo hanno usato si è rivelato efficace per 160 casi (80%). L’affermazione della dittà è legittima ad un livello di significatività dello 0.01? H0: l’affermazione è legittima: p 0.9 H1: l’affermazione non è legittima: p < 0.9 Lo z-score cade nella regione di rifiuto {z < NORMSINV(0.01)} quindi si può rigettare H0 e concludere che l’affermazione non è legittima
3
test di ipotesi e intervalli di confidenza (IC) Il test di ipotesi bilaterale identifica
4
test di ipotesi e intervalli di confidenza (IC) Il test di ipotesi bilaterale identifica se l’osservazione ricade nell’intervallo al livello 1- non esistono evidenze sufficienti per respingere H0
5
test di ipotesi e intervalli di confidenza (IC) Una tecnica alternativa per stabilire se una osservazione è consistente o meno con H0 consiste nella stima dei parametri per intervalli dal TLC abbiamo visto che la stima puntuale E( ) di un parametro è come il tiro al bersaglio a causa dell’ errore campionario la media del singolo campione sarà diversa da quella della popolazione correttezza= E( ) - efficienza= Var
6
stimatore distorto ma efficente stimatore distorto e inefficiente/disperso stimatore corretto ed efficente test di ipotesi e intervalli di confidenza (IC) Una tecnica alternativa per stabilire se una osservazione è consistente o meno con H0 consiste nella stima dei parametri per intervalli dal TLC abbiamo visto che la stima puntuale E( ) di un parametro è come il tiro al bersaglio a causa dell’ errore campionario la media del singolo campione sarà diversa da quella della popolazione
7
test di ipotesi e intervalli di confidenza (IC) Una tecnica alternativa per stabilire se una osservazione è consistente o meno con H0 consiste nella stima dei parametri per intervalli L’indice sintetico della correttezza ed efficienza è lo scarto quadratico medio dal valore atteso (MSE) correttezza= E( ) – efficienza= Var SQM= Var 2
8
test di ipotesi e intervalli di confidenza (IC) Una tecnica alternativa per stabilire se una osservazione è consistente o meno con H0 consiste nella stima dei parametri per intervalli Jerzy Neyman 1930 (U. California, Berkeley) identifica la statistica per definire quanto sia precisa la stima rispetto al vero valore del parametro
9
test di ipotesi e intervalli di confidenza (IC) Una tecnica alternativa per stabilire se una osservazione è consistente o meno con H0 consiste nella stima dei parametri per intervalli Quale è la probabilità che, dato un certo set di osservazioni, la media della popolazione ricada all’interno di un intervallo diciamo con il 90, 95 o 99 % della confidenza IC= stima puntuale ± un margine di errore
10
caso con varianza nota Dal TLC sappiamo che il miglior stimatore puntuale della media della popolazione incognita è dato dalla media aritmetica delle osservazioni campionarie Analogamente lo stimatore puntuale della varianza è: Si stima quindi da come?
11
Inverto l’equazione in livello di confidenza +2sd; 74.6 -2sd; 35.4 0255075100 I risultati ad un test di inteligenza ottenuti su un campione di 200 osservazioni danno una media di 55.5. La deviazione standard raccolta sulla popolazione è di 20 Una media della popolazione pari a 50 può far parte di questo campione?
12
Inverto l’equazione in livello di confidenza 52.7 +2sd; 74.6 -2sd; 35.4 0255075100 58.2 52.7 58.2 NORMINV(1- /2;0;1)
13
Inverto l’equazione in livello di confidenza 52.7 +2sd; 74.6 -2sd; 35.4 0255075100 58.2 C’è il 95% delle probabilità che l’intelligenza media della popolazione sia compresa fra [52.7, 58.2] Osservare una media di 50 sarebbe improbabile Analogo a rigettare H0: per 95% 2.5%
14
ricettario Ricettario_IC_mediaNormale.xls
15
l’esempio, ha scarsa applicabilità dato che è raro essere a conoscenza della varianza della popolazione Come procediamo?
16
IC: caso con varianza non nota Grandi campioni (n> 30) Piccoli campioni (n< 30) il procedimento con la statistica t fornisce una stima aggiustata per i gradi di libertà quindi un IC sempre minore e più preciso della statistica z stimiamo la varianza della popolazione con la varianza del campione Gradi di libertà
17
vediamo un esempio nel caso di piccoli campioni calcoliamo l’IC con z con un grado di fiducia del 95% +2sd; 74.6 -2sd; 35.4 0255075100 Osservare una media di 50 sarebbe improbabile Analogo a rigettare H0: = 50 per = 0.05 IC: caso con varianza non nota
18
vediamo un esempio nel caso di piccoli campioni calcoliamo l’IC con t con un grado di fiducia del 95% +2sd; 74.6 -2sd; 35.4 0255075100 INVT( ;COUNT()-1) L’IC sarà quindi maggiore IC: caso con varianza non nota
19
concludiamo che vediamo un esempio nel caso di piccoli campioni +2sd; 74.6 -2sd; 35.4 0255075100 In base alla statistica t non possiamo rigettare H0: = 50 per = 0.05 In base alla statistica z invece una = 50 è inverosimile non rigettiamo H0 Il campione è piccolo e la statistica t corregge per i gdl
20
ricettario Ricettario_IC_mediaT.xls
21
dimostratore IC Excel LimitDiConfidenza.xls per una distribuzione random gaussiana di punteggi calcola i limiti fiduciari in accordo con la statistica z e t e ne visualizza il risultato Foglio: ICVarianzaNonNotaSMALLs
22
dimostratore IC Excel LimitDiConfidenza.xls $B$8-$B$9*$B$6/SQRT(COUNT(D2:D201)) Foglio: ICVarianzaNonNotaSMALLs
23
dimostratore IC Excel LimitDiConfidenza.xls =$B$8-$B$9*$B$7/SQRT(COUNT(D2:D201)) Foglio: ICVarianzaNonNotaSMALLs
24
IC e proporzioni su 100 studenti solo 35 hanno passato l’esame di statistica. Quale è la probabilità al 95% associata a tale stima puntuale?
25
L'errore standard della proporzione campionaria è riassumendo: errore standard delle proporzioni La proporzione della popolazione p è la media µ della distribuzione di probabilità le cui probabilità sono pari a: La deviazione standard di questa distribuzione di probabilità è pari a Dal TLC sappiamo che la formula per l'errore standard della media campionaria è
26
si trova entro unità dal parametro , cioè, tra e....., con probabilità pari 0.95. IC al 95% di contro, la probabilità che non si trovi entro da è pari a 0.05. anche in questo caso, come nel caso di medie con varianza incognita, il parametro non è noto e si usa l’errore standard stimato
27
IC per proporzioni 35 studenti su 100 passano l’esame disegniamo la distribuzione campionaria delle proporzioni 0.35
28
IC per proporzioni 35 studenti su 100 passano l’esame disegniamo la distribuzione campionaria delle proporzioni 0.35 la probabilità di raggiungere il 50% con le stesse modalità è a dir poco vana p 0 = 0.5 è a tre deviazioni standard dalla media campionaria
29
corrispondenza IC – test di ipotesi 0.35 z critico z score 0 0.1 0.2 0.3 0.4 0.5 -505 normale standard H0: p= p 0 = 0.5 H1: p ≠ p 0 formulando le due ipotesi possiamo tradurre l’ IC nello spazio di decisione del test di ipotesi rappresentato dalla normale standard
30
ricettario Ricettario_IC_proporzione.xls
31
Corrispondenza tra IC e test di ipotesi in Excel Test_Ipotesi_vs_IC.xls Dimostratore simile a quello creato per Normale_standard_e_proporzioni.xls con l’aggiunta della distribuzione campionaria delle proporzioni (approssimata con la normale) e il calcolo dell’ IC usando i riferimenti personalizzati Normale_standard_e_proporzioni.xls /n
32
Test_Ipotesi_vs_IC.xls definiamo i nomi delle celle per scrivere le formule p n fr alfa p0 media errore standard /n Corrispondenza tra IC e test di ipotesi in Excel
33
Test_Ipotesi_vs_IC.xls la distribuzione campionaria delle proporzioni è approssimata da una normale con media e deviazione standard usando NORMDIST(T i ;media;errore_standard;0) /n Corrispondenza tra IC e test di ipotesi in Excel
34
Test_Ipotesi_vs_IC.xls I due estremi dell’intervallo di confidenza sono calcolati: p-(NORMINV(1-alfa/2;0;1))*(SQRT(p*(1-p)/n)); p+(NORMINV(1-alfa/2;0;1))*(SQRT(p*(1-p)/n)); e vengono disegnati assieme alla distribuzione di densità /n Corrispondenza tra IC e test di ipotesi in Excel
35
Osservazione n. 1: p= 0.4, n= 100, = 0.05 rigetto H0 in tutti e tre i casi: test di ipotesi monodirezionale p= 0.0228 < test di ipotesi bidirezionale p= 0.045 < IC: P(0.30 < 0.5 < 0.496) < /n
36
Osservazione n. 2: p= 0.41, n= 100, = 0.05 non rigetto H0 solo nel test monodirezionale: test di ipotesi monodirezionale p= 0.039 < test di ipotesi bidirezionale p= 0.071 > IC: P(0.31 /n
37
Conclusione n.1 Test di ipotesi e calcolo degli intervalli di confidenza si equivalgono come procedure inferenziali E’ utile combinare il test di ipotesi con gli IC in maniera da fornire una idea di quali valori sono verosimili /n
38
Osservazione n. 3: p= 0.41, n= 150, = 0.05 nonostante p non sia cambiata rigetto H0 in tutti e tre i casi: test di ipotesi monodirezionale p= 0.00137< test di ipotesi bidirezionale p= 0.0275 < IC: P(0.33 < 0.5 < 0.489) < /n
39
Conclusione n. 2: Campioni di maggiore ampiezza forniscono intervalli più stretti dato che IC è inversamente proporzionale alla radice quadrata di n /n
40
dimensione campinaria e IC p= 0.4 n= 50 n= 80 n= 160 Dal TLC sappiamo che la distribuzione campionaria si restringe attorno alla media all’aumentare di n
41
Fig. 4.14 pag 96 Effetto della dimenzione campionaria
42
probabilità di copertura degli IC e TLC Cap. 10 Paganoni, Pontiggia: Esempio 1 L’ IC è un intervallo aleatorio che ha una probabilità 1- di contenere un parametro incognito (diciamo la media) L’ IC al 95% per la media di una popolazione ha una probabilità di contenere il vero valore della media al 95% Verifichiamo con un documento in tutto simile a PotenzaTESTeTLC.xls PotenzaTESTeTLC.xls
43
probabilità di copertura in Excel generiamo 20 variabili aleatorie (n) ciascuna di 500 osservazioni con legge normale di parametri 50 (B1) e 2.5 (B2) applicando ad ogni cella IntervalloDIFIDUCIAeTLC.xls
44
probabilità di copertura in Excel definiamo il livello del quantile della normale standard di ordine 1 – IntervalloDIFIDUCIAeTLC.xls
45
probabilità di copertura in Excel calcoliamo l’estremo inferiore con V20-NORMINV(1-$B$3 /2;0;1)*($B$2)/SQRT(20) IntervalloDIFIDUCIAeTLC.xls
46
probabilità di copertura in Excel creiamo una colonna che con la funzione SE riporta 1 se il vero valore della media 50 è incluso nell’intervallo, 0 se non lo contiene IntervalloDIFIDUCIAeTLC.xls
47
probabilità di copertura in Excel ad esempio: IF(AND( $B$1 > X20; $B$1 < Y20);1;0) IntervalloDIFIDUCIAeTLC.xls
48
probabilità di copertura in Excel adesso calcoliamo la proporzione di realizzazioni che ricadono nell’ IC nella calla M19 la probabilità di copertura per l’intervallo z al 95% è 0.952 nel 95.2% dei casi l’IC conteneva la vera media IntervalloDIFIDUCIAeTLC.xls
49
visualizzare la probabilità di copertura calcoli la lunghezza dell’intervallo per ciascuna prova (LS -LI) calcoli la lunghezza media crei uno scatterplot con in ascissa i valori medi e in ordinata l’osservazione campionaria (i=1 → N) aggiungi come barre di errore in x la lunghezza media dell’ IC
50
Esercizio fate la stessa operazione di verifica per la distribuzione t ossia nel caso in cui la varianza della popolazione non sia nota cosa vi aspettate?
51
Quanto deve essere grande il mio campione affinchè il margine di errore al 95% della proporzione/media sia un valore predefinito m? applicazione IC: quanto grande il campione? margine di errore, m invertendo per n si ottiene: varianza più in generale
52
Dal TLC sappiamo che la distribuzione campionaria si restringe al crescere di n fino a che, in corrispondenza del valore di n richiesto, il 95% della distribuzione si trova all'interno del margine di errore prescelto. per p= 0.5 e m= 0.035 = 784
53
commento su CI e n la grandezza del campione dipende dal livello di fiducia prescelto (maggiore il livello di confidenza maggiore deve essere n) e dalla variabilità della popolazione (maggiore variabilità maggiore n) stimare n non è facile dato che (1) dipende da molti parametri; (2) risorse limitate nel reclutamento di partecipanti e si deve spesso ricorrere a compromessi
54
G-power http://www.gpower.hhu.de/en.html
55
l’interfaccia http://www.gpower.hhu.de/en.html Restituisce la grandezza del campione necessaria per osservare una differenza fra proporzioni g (effect size) dati e
56
l’interfaccia http://www.gpower.hhu.de/en.html aumentando la potenza del test si riduce il numero di osservazioni necessarie
57
l’interfaccia http://www.gpower.hhu.de/en.html stessa cosa per il caso della differenza di una media da un valore atteso (t test) H0: H0: Ipotizzo = 2 Grandezza relativa attesa dell’effetto (effect size)
58
l’interfaccia http://www.gpower.hhu.de/en.html Cliccando su X-Y plot: si può vedere come la grandezza del campione aumenta all’aumentare della potenza del test fino a che questa raggiungere il valore desiderato di 0.95 per n= 45
59
Inferenza statistica: test di ipotesi, stima dei parametri, intervalli di confidenza confronto tra due gruppi Agresti e Finlay: 1-6 + 7.1, 7.3, 7.4, 7.5 + 9.1, 9.2 Borazzo, Perchinunno: 1-2; 4; 5.4-5.5; 6- 9.3 Paganoni, Pontiggia: 1-6; 8-10; 12-13 comunicazioni aggiornamento programma
60
Prof. Corrado Cavallero Giovedì 16/04, 14:00 -16:00, Aula 2B Test non parametrici circa 18 ore comunicazioni inizio modulo 2
61
Solo appelli ordinari: Giugno e Luglio; Due appelli parziali, uno per ciascun modulo: senza registrazione; Un appello generale: registrazione solo nel momento in cui avrete inserito l’esito di entrambi i moduli; Firma digitale direttamente alla scadenza dell’appello generale comunicazioni modalità d’esame
62
Buona Pasqua buona preparazione
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.