La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Inferenza.

Presentazioni simili


Presentazione sul tema: "Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Inferenza."— Transcript della presentazione:

1 Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Inferenza e Intervalli di confidenza 2.Stima dei parametri a intervalli 3.Intervalli di confidenza per la media (varianza nota) 4.Intervalli di confidenza per la media (varianza non nota) 5.Differenza tra statistica Z e T per piccoli campioni (dimostratore Excel) 6.Intervalli di confidenza per la proporzione 7.Corrispondenza tra IC e test di ipotesi bidirezionale (dimostratore Excel) 8.Dimensione campionaria e IC 9.Probabilità di copertura dell’ IC (dimostrazione Excel) 10.Definire la grandezza del campione in base al margine di errore 11.G-power come dimostratore 12.Comunicazioni conclusive

2 H0 con p 0 non bilanciato Una ditta afferma che il farmaco è efficace al 90%. In un campione di 200 persone che lo hanno usato si è rivelato efficace per 160 casi (80%). L’affermazione della dittà è legittima ad un livello di significatività dello 0.01? H0: l’affermazione è legittima: p  0.9 H1: l’affermazione non è legittima: p < 0.9 Lo z-score cade nella regione di rifiuto {z < NORMSINV(0.01)} quindi si può rigettare H0 e concludere che l’affermazione non è legittima

3 test di ipotesi e intervalli di confidenza (IC) Il test di ipotesi bilaterale identifica 

4 test di ipotesi e intervalli di confidenza (IC) Il test di ipotesi bilaterale identifica  se l’osservazione ricade nell’intervallo al livello 1-  non esistono evidenze sufficienti per respingere H0

5 test di ipotesi e intervalli di confidenza (IC) Una tecnica alternativa per stabilire se una osservazione è consistente o meno con H0 consiste nella stima dei parametri per intervalli dal TLC abbiamo visto che la stima puntuale E(  ) di un parametro  è come il tiro al bersaglio a causa dell’ errore campionario la media del singolo campione sarà diversa da quella della popolazione correttezza= E(  ) -  efficienza= Var 

6 stimatore distorto ma efficente stimatore distorto e inefficiente/disperso stimatore corretto ed efficente test di ipotesi e intervalli di confidenza (IC) Una tecnica alternativa per stabilire se una osservazione è consistente o meno con H0 consiste nella stima dei parametri per intervalli dal TLC abbiamo visto che la stima puntuale E(  ) di un parametro  è come il tiro al bersaglio a causa dell’ errore campionario la media del singolo campione sarà diversa da quella della popolazione

7 test di ipotesi e intervalli di confidenza (IC) Una tecnica alternativa per stabilire se una osservazione è consistente o meno con H0 consiste nella stima dei parametri per intervalli L’indice sintetico della correttezza ed efficienza è lo scarto quadratico medio dal valore atteso (MSE) correttezza= E(  ) –  efficienza= Var  SQM= Var  2

8 test di ipotesi e intervalli di confidenza (IC) Una tecnica alternativa per stabilire se una osservazione è consistente o meno con H0 consiste nella stima dei parametri per intervalli Jerzy Neyman 1930 (U. California, Berkeley) identifica la statistica per definire quanto sia precisa la stima rispetto al vero valore del parametro

9 test di ipotesi e intervalli di confidenza (IC) Una tecnica alternativa per stabilire se una osservazione è consistente o meno con H0 consiste nella stima dei parametri per intervalli Quale è la probabilità che, dato un certo set di osservazioni, la media della popolazione ricada all’interno di un intervallo diciamo con il 90, 95 o 99 % della confidenza IC= stima puntuale ± un margine di errore

10 caso con varianza nota Dal TLC sappiamo che il miglior stimatore puntuale della media della popolazione incognita è dato dalla media aritmetica delle osservazioni campionarie Analogamente lo stimatore puntuale della varianza è: Si stima quindi  da come?

11 Inverto l’equazione in  livello di confidenza +2sd; 74.6 -2sd; 35.4 0255075100  I risultati ad un test di inteligenza ottenuti su un campione di 200 osservazioni danno una media di 55.5.  La deviazione standard raccolta sulla popolazione è di 20  Una media della popolazione pari a 50 può far parte di questo campione?

12 Inverto l’equazione in  livello di confidenza 52.7 +2sd; 74.6 -2sd; 35.4 0255075100 58.2 52.7 58.2 NORMINV(1-  /2;0;1)

13 Inverto l’equazione in  livello di confidenza 52.7 +2sd; 74.6 -2sd; 35.4 0255075100 58.2  C’è il 95% delle probabilità che l’intelligenza media della popolazione sia compresa fra [52.7, 58.2]  Osservare una media di 50 sarebbe improbabile  Analogo a rigettare H0:  per   95% 2.5%

14 ricettario Ricettario_IC_mediaNormale.xls

15 l’esempio, ha scarsa applicabilità dato che è raro essere a conoscenza della varianza della popolazione Come procediamo?

16 IC: caso con varianza non nota Grandi campioni (n> 30) Piccoli campioni (n< 30) il procedimento con la statistica t fornisce una stima aggiustata per i gradi di libertà quindi un IC sempre minore e più preciso della statistica z stimiamo la varianza della popolazione con la varianza del campione Gradi di libertà

17 vediamo un esempio nel caso di piccoli campioni calcoliamo l’IC con z con un grado di fiducia del 95% +2sd; 74.6 -2sd; 35.4 0255075100  Osservare una media di 50 sarebbe improbabile  Analogo a rigettare H0:  = 50 per  = 0.05 IC: caso con varianza non nota

18 vediamo un esempio nel caso di piccoli campioni calcoliamo l’IC con t con un grado di fiducia del 95% +2sd; 74.6 -2sd; 35.4 0255075100 INVT(  ;COUNT()-1) L’IC sarà quindi maggiore IC: caso con varianza non nota

19 concludiamo che vediamo un esempio nel caso di piccoli campioni +2sd; 74.6 -2sd; 35.4 0255075100  In base alla statistica t non possiamo rigettare H0:  = 50 per  = 0.05  In base alla statistica z invece una  = 50 è inverosimile  non rigettiamo H0  Il campione è piccolo e la statistica t corregge per i gdl

20 ricettario Ricettario_IC_mediaT.xls

21 dimostratore IC Excel LimitDiConfidenza.xls per una distribuzione random gaussiana di punteggi calcola i limiti fiduciari in accordo con la statistica z e t e ne visualizza il risultato Foglio: ICVarianzaNonNotaSMALLs

22 dimostratore IC Excel LimitDiConfidenza.xls $B$8-$B$9*$B$6/SQRT(COUNT(D2:D201)) Foglio: ICVarianzaNonNotaSMALLs

23 dimostratore IC Excel LimitDiConfidenza.xls =$B$8-$B$9*$B$7/SQRT(COUNT(D2:D201)) Foglio: ICVarianzaNonNotaSMALLs

24 IC e proporzioni su 100 studenti solo 35 hanno passato l’esame di statistica. Quale è la probabilità al 95% associata a tale stima puntuale?

25  L'errore standard della proporzione campionaria è riassumendo: errore standard delle proporzioni  La proporzione della popolazione p è la media µ della distribuzione di probabilità le cui probabilità sono pari a:  La deviazione standard di questa distribuzione di probabilità è pari a  Dal TLC sappiamo che la formula per l'errore standard della media campionaria è

26  si trova entro unità dal parametro , cioè, tra e....., con probabilità pari 0.95. IC al 95%  di contro, la probabilità che non si trovi entro da  è pari a 0.05.  anche in questo caso, come nel caso di medie con varianza incognita, il parametro  non è noto e si usa l’errore standard stimato

27 IC per proporzioni 35 studenti su 100 passano l’esame disegniamo la distribuzione campionaria delle proporzioni 0.35

28 IC per proporzioni 35 studenti su 100 passano l’esame disegniamo la distribuzione campionaria delle proporzioni 0.35  la probabilità di raggiungere il 50% con le stesse modalità è a dir poco vana  p 0 = 0.5 è a tre deviazioni standard dalla media campionaria

29 corrispondenza IC – test di ipotesi 0.35 z critico z score 0 0.1 0.2 0.3 0.4 0.5 -505 normale standard H0: p= p 0 = 0.5 H1: p ≠ p 0 formulando le due ipotesi possiamo tradurre l’ IC nello spazio di decisione del test di ipotesi rappresentato dalla normale standard

30 ricettario Ricettario_IC_proporzione.xls

31 Corrispondenza tra IC e test di ipotesi in Excel Test_Ipotesi_vs_IC.xls Dimostratore simile a quello creato per Normale_standard_e_proporzioni.xls con l’aggiunta della distribuzione campionaria delle proporzioni (approssimata con la normale) e il calcolo dell’ IC usando i riferimenti personalizzati Normale_standard_e_proporzioni.xls /n

32 Test_Ipotesi_vs_IC.xls definiamo i nomi delle celle per scrivere le formule p n fr alfa p0 media errore standard /n Corrispondenza tra IC e test di ipotesi in Excel

33 Test_Ipotesi_vs_IC.xls la distribuzione campionaria delle proporzioni è approssimata da una normale con media e deviazione standard usando NORMDIST(T i ;media;errore_standard;0) /n Corrispondenza tra IC e test di ipotesi in Excel

34 Test_Ipotesi_vs_IC.xls I due estremi dell’intervallo di confidenza sono calcolati:  p-(NORMINV(1-alfa/2;0;1))*(SQRT(p*(1-p)/n));  p+(NORMINV(1-alfa/2;0;1))*(SQRT(p*(1-p)/n)); e vengono disegnati assieme alla distribuzione di densità /n Corrispondenza tra IC e test di ipotesi in Excel

35 Osservazione n. 1: p= 0.4, n= 100,  = 0.05 rigetto H0 in tutti e tre i casi:  test di ipotesi monodirezionale p= 0.0228 <   test di ipotesi bidirezionale p= 0.045 <    IC: P(0.30 < 0.5 < 0.496) <  /n

36 Osservazione n. 2: p= 0.41, n= 100,  = 0.05 non rigetto H0 solo nel test monodirezionale:  test di ipotesi monodirezionale p= 0.039 <   test di ipotesi bidirezionale p= 0.071 >    IC: P(0.31  /n

37 Conclusione n.1  Test di ipotesi e calcolo degli intervalli di confidenza si equivalgono come procedure inferenziali  E’ utile combinare il test di ipotesi con gli IC in maniera da fornire una idea di quali valori sono verosimili /n

38 Osservazione n. 3: p= 0.41, n= 150,  = 0.05 nonostante p non sia cambiata rigetto H0 in tutti e tre i casi:  test di ipotesi monodirezionale p= 0.00137<   test di ipotesi bidirezionale p= 0.0275 <    IC: P(0.33 < 0.5 < 0.489) <  /n

39 Conclusione n. 2: Campioni di maggiore ampiezza forniscono intervalli più stretti dato che IC è inversamente proporzionale alla radice quadrata di n /n

40 dimensione campinaria e IC p= 0.4 n= 50 n= 80 n= 160 Dal TLC sappiamo che la distribuzione campionaria si restringe attorno alla media all’aumentare di n

41 Fig. 4.14 pag 96 Effetto della dimenzione campionaria

42 probabilità di copertura degli IC e TLC  Cap. 10 Paganoni, Pontiggia: Esempio 1  L’ IC è un intervallo aleatorio che ha una probabilità 1-  di contenere un parametro incognito (diciamo la media)  L’ IC al 95% per la media di una popolazione ha una probabilità di contenere il vero valore della media al 95%  Verifichiamo con un documento in tutto simile a PotenzaTESTeTLC.xls PotenzaTESTeTLC.xls

43 probabilità di copertura in Excel generiamo 20 variabili aleatorie (n) ciascuna di 500 osservazioni con legge normale di parametri  50 (B1) e  2.5 (B2) applicando ad ogni cella IntervalloDIFIDUCIAeTLC.xls

44 probabilità di copertura in Excel definiamo il livello  del quantile della normale standard di ordine 1 –  IntervalloDIFIDUCIAeTLC.xls

45 probabilità di copertura in Excel calcoliamo l’estremo inferiore con V20-NORMINV(1-$B$3 /2;0;1)*($B$2)/SQRT(20) IntervalloDIFIDUCIAeTLC.xls

46 probabilità di copertura in Excel creiamo una colonna che con la funzione SE riporta 1 se il vero valore della media 50 è incluso nell’intervallo, 0 se non lo contiene IntervalloDIFIDUCIAeTLC.xls

47 probabilità di copertura in Excel ad esempio: IF(AND( $B$1 > X20; $B$1 < Y20);1;0) IntervalloDIFIDUCIAeTLC.xls

48 probabilità di copertura in Excel adesso calcoliamo la proporzione di realizzazioni che ricadono nell’ IC nella calla M19  la probabilità di copertura per l’intervallo z al 95% è 0.952  nel 95.2% dei casi l’IC conteneva la vera media  IntervalloDIFIDUCIAeTLC.xls

49 visualizzare la probabilità di copertura  calcoli la lunghezza dell’intervallo per ciascuna prova (LS -LI)  calcoli la lunghezza media  crei uno scatterplot con in ascissa i valori medi e in ordinata l’osservazione campionaria (i=1 → N)  aggiungi come barre di errore in x la lunghezza media dell’ IC

50 Esercizio fate la stessa operazione di verifica per la distribuzione t ossia nel caso in cui la varianza della popolazione non sia nota cosa vi aspettate?

51 Quanto deve essere grande il mio campione affinchè il margine di errore al 95% della proporzione/media sia un valore predefinito m? applicazione IC: quanto grande il campione? margine di errore, m invertendo per n si ottiene: varianza più in generale

52 Dal TLC sappiamo che la distribuzione campionaria si restringe al crescere di n fino a che, in corrispondenza del valore di n richiesto, il 95% della distribuzione si trova all'interno del margine di errore prescelto. per p= 0.5 e m= 0.035 = 784

53 commento su CI e n  la grandezza del campione dipende dal livello di fiducia prescelto (maggiore il livello di confidenza maggiore deve essere n) e dalla variabilità della popolazione (maggiore variabilità maggiore n)  stimare n non è facile dato che (1) dipende da molti parametri; (2) risorse limitate nel reclutamento di partecipanti e si deve spesso ricorrere a compromessi

54 G-power http://www.gpower.hhu.de/en.html

55 l’interfaccia http://www.gpower.hhu.de/en.html Restituisce la grandezza del campione necessaria per osservare una differenza fra proporzioni g (effect size) dati  e 

56 l’interfaccia http://www.gpower.hhu.de/en.html aumentando la potenza del test si riduce il numero di osservazioni necessarie

57 l’interfaccia http://www.gpower.hhu.de/en.html  stessa cosa per il caso della differenza di una media da un valore atteso (t test)  H0:     H0:   Ipotizzo  = 2  Grandezza relativa attesa dell’effetto (effect size)

58 l’interfaccia http://www.gpower.hhu.de/en.html Cliccando su X-Y plot: si può vedere come la grandezza del campione aumenta all’aumentare della potenza del test fino a che questa raggiungere il valore desiderato di 0.95 per n= 45

59  Inferenza statistica: test di ipotesi, stima dei parametri, intervalli di confidenza confronto tra due gruppi  Agresti e Finlay: 1-6 + 7.1, 7.3, 7.4, 7.5 + 9.1, 9.2  Borazzo, Perchinunno: 1-2; 4; 5.4-5.5; 6- 9.3  Paganoni, Pontiggia: 1-6; 8-10; 12-13 comunicazioni aggiornamento programma

60  Prof. Corrado Cavallero  Giovedì 16/04, 14:00 -16:00, Aula 2B  Test non parametrici  circa 18 ore comunicazioni inizio modulo 2

61  Solo appelli ordinari: Giugno e Luglio;  Due appelli parziali, uno per ciascun modulo: senza registrazione;  Un appello generale: registrazione solo nel momento in cui avrete inserito l’esito di entrambi i moduli;  Firma digitale direttamente alla scadenza dell’appello generale comunicazioni modalità d’esame

62 Buona Pasqua buona preparazione


Scaricare ppt "Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Inferenza."

Presentazioni simili


Annunci Google