Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Test di ipotesi.

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
8) GLI INTERVALLI DI CONFIDENZA
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
STATISTICA DESCRITTIVA
Intervalli di confidenza
Confronto tra 2 campioni Nella pratica è utilissimo confrontare se 2 campioni provengono da popolazioni con la stessa media: Confronti tra produzioni di.
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Analisi dei dati per i disegni ad un fattore
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Inferenza statistica per un singolo campione
Valutazione delle ipotesi
Analisi della varianza (a una via)
1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.
Distribuzioni di probabilità
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 7-2: Test di significatività
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a LA STATISTICA INFERENZIALE
di cosa si occupa la statistica inferenziale?
Lezione 8 Numerosità del campione
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Il test di ipotesi Cuore della statistica inferenziale!
Verifica delle ipotesi su due campioni di osservazioni
Un buon latinista è anche un bravo matematico? I.S. Artemisia Gentileschi - NAPOLI Convegno finale Progetto Lauree Scientifiche – Matematica Università
Le distribuzioni campionarie
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
Unità 7 Test parametrici ☐ Test t di Student ☐ Analisi della varianza ad una via ☐ Confronti multipli.
Test parametrici I test studiati nelle lezioni precedenti (test- t, test-z) consentono la verifica di ipotesi relative al valore di specifici parametri.
STATISTICA INFERENZIALE
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
La verifica d’ipotesi Docente Dott. Nappo Daniela
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
“Teoria e metodi della ricerca sociale e organizzativa”
La statistica F Permette di confrontare due varianze, per stabilire se sono o no uguali. Simile al valore t di Student o al chi quadrato, l’F di Fisher.
ANALISI STATISTICA DI DATI CAMPIONARI
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
Verifica di ipotesi statistiche
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
“Teoria e metodi della ricerca sociale e organizzativa”
Intervalli di confidenza
La distribuzione campionaria della media
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
Dalmine, 26 Maggio 2004 Esercitazioni di Statistica con Matlab Dott. Orietta Nicolis fttp:\ingegneria.unibg.it.
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Statistica di Base per le Scienze Pediatriche luigi greco D.C.H, M.D., M.Sc.M.C.H., Ph.D. Dipartimento di Pediatria UniFEDERICOII.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Rosoluzione.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Campionamento.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Inferenza.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Campionamento.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Postulati.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Scienze tecniche e psicologiche
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Implementazione.
Introduzione all’inferenza
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Varianza.
Transcript della presentazione:

Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi sulla media (varianza incognita) 2.Tabella dei t-score 3.Test di ipotesi su proporzioni (variabile Bernoulliana) 4.Effetto della dimensione campionaria sul test di ipotesi 5.Potenza del test e dimensione del campione 6.Errore statistico del I tipo e teorema del limite centrale 7.Summary: procedimenti su test d’ipotesi sulla media

La distribuzione t presenta un'ampiezza leggermente diversa per ciascun differente valore dei gdl e si applicano, quindi, differenti t-scores per ciascun valore dei gdl. tavole t TINV(0.05;10)= 2.3 Il valore t riporta i t-score di una probabilità di sottesa dalla coda destra o di 0.05 su entrambe le code nota che P(t 0.025, 10 gdl ) > P(z ) =1. 96 T_student_e_normale.xls

La distribuzione t presenta un'ampiezza leggermente diversa per ciascun differente valore dei gdl e si applicano, quindi, differenti t-scores per ciascun valore dei gdl. tavole t TINV(0.05;10)= 2.3 Il valore t riporta i t-score di una probabilità di sottesa dalla coda destra o di 0.05 su entrambe le code

esempio  ipotizzata;  ignota calcoliamo il t score sulle differenze ES_trattamento_ADHD_diff2gruppi_Ttest.xls

esempio  ipotizzata;  ignota calcoliamo il t score sulle differenze stimiamo l’errore standard ES_trattamento_ADHD_diff2gruppi_Ttest.xls

esempio  ipotizzata;  ignota calcoliamo il t score sulle differenze ES_trattamento_ADHD_diff2gruppi_Ttest.xls

Ipotesi monodirezionale a una coda H0: nessuna effetto del trattamento:  T –  NT =  diff = 0 H1: il trattamento ha effetto:  T –  NT =  diff > 0 Se P(T < t) <  rifiuto H0 Se P(T  accetto H0  rifiuto Ho accetto Ho pongo  = 0.05 oppure (in assenza di calcolatrice) Se T > P( T < t  ) rifiuto H0 Se T < P( T < t  ) accetto H0

visualizziamo il risultato t score= 3.22, gdl= 24-1  Visualizziamo t  : TINV(0.05; 23)= ± 2.1  Visualizziamo il P(t-score): TDIST(3.22; 23;1)=  Se la droga non ha effetto la probabilità di trovare una differenza fra medie come quella trovata è molto piccola (0.0018)  L’ipotesi H0 che la differenza fra le popolazioni sia nulla può essere rigettata, quindi  La media della popolazione sotto trattamento è maggiore di quella in assenza t critico t score

ricettario Ricettario_T.xls

inferenza su proporzioni il caso di popolazioni Bernoulliane  In molti casi è necessario testare l’ipotesi che la proporzione della popolazione assuma un determinato valore p 0  Su 1200 intervistati il 52% (p) preferesce un’ “aumento delle tasse” piuttosto che una “diminuzione dei servizi”. Tale percentuale si discosta in maniera significativa da quella ipotizzata della popolazione (i.e., p 0 =50%) ?  H0: p = p 0 ; H1: p ≠ p 0 (bidirezionale); H1: p > p 0 (monodirezionale)

inferenza su proporzioni il caso di popolazioni Bernoulliane Dal TLC abbiamo visto che la distribuzione campionaria di una proporzioni ha media p 0 ed errore standard nel caso in cui H0 sia vera la statistica sarà ottenuta rispettatando l'impostazione vista per la media campionaria

risolviamo quindi il problema p= 0.52; p 0 = 0.50; n= 1200 Visualizziamo la distribuzione campionaria di z quando H0 è vera z critico visualizziamo lo z  critico nel caso di un ipotesi bidirezionale per p= 0.05 con NORMSINV(0.025) visualizziamo lo z-score z score calcoliamo il p valore a due code, 2*P(Z<z) con (1-NORMSDIST(z-score))*

Attenzione! dire “non si rifiuta H0” è corretto dire “si accetta H0” è sbagliato

dimensione campionaria e p-valore z critico z score p= 0.52; p 0 = 0.50; n= 4800 adesso p= < forte evidenza contro H0 a favore di H1 si può concludere: la maggioranza della popolazione è favorevole all’aumento delle tasse

corrispondenza con la binomiale la statistica corrisponde a quella che si estrae dalla binomiale quando n è grande e p → 0.5 dato che essa si approssima alla normale con variabile aleatoria standardizzata appross_normale_binomiale.xls

paranormale o no? si consegna un mazzo di 50 carte di colore rosso e blu. La prova per il soggetto A consiste nell'indovinare il colore della carta scelta da un soggetto B che si trova in un'altra stanza. Il soggetto A indovina 32 carte, è possibile sostenere che si tratta di un fenomeno paranormale, ad un livello di signicativita del 5%? H0: S = I = 50 H1: S > I > 50 (unidirezionale) Lo z-critico tale che P(Z  z 0.05 ) = 0.95 è z critico z oss > z c (1.98 > 1.645), si riuta l'ipotesi H0

dimostratore Excel:  Si costruisce un grafico dinamico in Excel che illustra la normale standard, il valore critico per p= 0.05 e i valori della statistica z risultanti da possibili proporzioni  Osserva come il p-valore cambia al variare della dimensione del campione Normale_standard_e_proporzioni.xls

 Le dimensioni del campione sono un fattore critico per i test statistici.  se n è piccolo, 1.la stima è imprecisa 2.è difficile rifiutare H0 a meno che la media del campione non sia molto diversa da μ 0 ; 3.quindi la probabilità di commettere un errore di II tipo sarà grande P di commettere l’errore del II tipo

potenza del test Calcoliamo la capacità del test statistico di riconoscere la falsità di H0 quando questa è effettivamente falsa (1-  ) Se p <  rifiuto H0 Se p >  accetto H0 rifiuto Ho accetto Ho    Come fare ? Simuliamo due distribuzioni campionarie normali in Excel e verifichiamo

potenza del test in Excel Potenza_Test_NORMALE_VISUALIZZA.xls  Immaginiamo un test di intelligenza standardizzato con media 100 e  = 20  H1 è rappresentata da qualunque distribuzione di dati normali con media diversa da 100

potenza del test in Excel Potenza_Test_NORMALE_VISUALIZZA.xls  Usiamo NORMDIST(C i=1→n ; $B$1;$B$2 ;0) per generare H0  NORMDIST( F i=1→n ; $B$5;$B$6 ;0) per generare H1  Visualizziamo le distribuzioni campionarie delle medie

potenza del test in Excel Potenza_Test_NORMALE_VISUALIZZA.xls Valore critico di z per l’alfa specificato nella cella K2 calcolato con NORMINV(J2; $B$1;$B$2) Corrisponderà alla probabilità sottesa dalla distribuzione H1 sotto il valore critico, quindi: NORMDIST(J3;$B$5;$B$6;TRUE) 1- beta, quindi: 1-J5

potenza del test in Excel Potenza_Test_NORMALE_VISUALIZZA.xls la probabilità che con un  il mio test sia effettivamente in grado di riconoscere la  falsità di H0 quando questa è effettivamente falsa è dell’ 80%

potenza del test in Excel Potenza_Test_NORMALE_VISUALIZZA.xls  Se  diminuisce la potenza del test aumenta o diminuisce?  con  diminuisce al 27%

Funzione continua della potenza Potenza_Test_NORMALE_VISUALIZZA.xls  Possiamo quindi calcolare la funzione che associa a ciascun valore di z-critico il valore corrispondente della potenza del test  Facciamolo nella seconda parte del foglio

Funzione continua della potenza Potenza_Test_NORMALE_VISUALIZZA.xls Otteniamo il seguente grafico

Funzione continua della potenza Potenza_Test_NORMALE_VISUALIZZA.xls La potenza del test diminuisce al diminuire della differenza fra le distribuzioni

Funzione continua della potenza Potenza_Test_NORMALE_VISUALIZZA.xls la potenza del test diminuisce all’aumentare della deviazione standard delle distribuzioni e quindi al diminuire di n  = 20  = 30

errori statistici e TLC  Cap. 12 Paganoni, Pontiggia: Esempio 1  La standardizzazione in z permette di suddividere lo spazio dell’ inferenza statistica in due regioni PotenzaTESTeTLC.xls

errori statistici e TLC PotenzaTESTeTLC.xls  Cap. 12 Paganoni, Pontiggia: Esempio 1  La standardizzazione in z permette di suddividere lo spazio dell’ inferenza statistica in due regioni  Per un quantile di ordine (z ) la % di realizzazioni campionarie di rifiuti di H0 anche se vera dovrebbe essere prossima ad  = 2.5% indipendentemente dalla dimensione campionaria  Verifichiamo con un documento in tutto simile a Teorema_del_Limite_Centrale.xls Teorema_del_Limite_Centrale.xls

errori statistici e TLC TLC con 500 numeri casuali da 1, 5, o 20 variabili aleatorie di legge gaussiana di media 50 e  = 2.5 …. dovreste essere in grado di generarli …. proviamo assieme ? PotenzaTESTeTLC.xls

verifica delle ipotesi con Excel TLC con 500 numeri casuali da 1, 5, o 20 variabili aleatorie di legge gaussiana di media 50 e  = Calcoliamo lo z critico= NORMINV(1- z ;0;1)= Calcoliamo le Regioni Critiche per le 3 dimensioni campionarie PotenzaTESTeTLC.xls

TLC con variabile aleatoria gaussiana generiamo 20 variabili aleatorie (n) ciascuna di 500 osservazioni con legge normale di parametri  50 (B1) e  2.5 (B2) applicando ad ogni cella

Calcoliamo le regioni critiche per la distribuzione delle medie campionarie con n= 1, n= 5 e n= 20 = B1 + B4 * SQRT(I5) TLC con variabile aleatoria gaussiana

Con la funzione COUNTIF(Intervallo;Criterio) troviamo per quanti campioni simulati possiamo rifiutare H0 sulla base del valore della media campionaria = COUNTIF(V20:V519;">"&I8)/COUNT(V20:V519) TLC con variabile aleatoria gaussiana

La percentuale di realizzazioni campionarie in cui rifiutiamo H0 anche se è vera si approssima ad  indipendentemente da n TLC con variabile aleatoria gaussiana

Esercizio  H0:  = 50; H1:  = 52 con  = 2.5  Verificane gli errori del secondo tipo  la % di realizzazioni campionarie di rifiuti di H1 anche se vera, al variare della dimensione campionaria (n= 1; n= 5; n= 20)  Cap. 12 Paganoni, Pontiggia: Esempio 2 1-NORMDIST(RC;  ;  ;  )

procedimenti su test d’ipotesi sulla media ProcedimentoIpotesiStatistica test Distribuzione Statistica test 1 n ≥ 30 Varianza σ 2 nota Distribuzione normale 2 n ≥ 30 Varianza σ 2 incognita Distribuzione normale 3 n < 30 Pop. normale Varianza σ 2 nota Distribuzione normale 4 n < 30 Pop. normale Varianza σ 2 incognita Distribuzione t di Student con n -1 gradi di libertà Il proc. 4 può essere usato anche per grandi campioni da pop.normale al posto del procedimento 2: il proc. esatto è quello basato sulla distribuzione t mentre l’altro è approssimato.