Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Inferenza.

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
8) GLI INTERVALLI DI CONFIDENZA
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
LA VARIABILITA’ IV lezione di Statistica Medica.
Intervalli di confidenza
Proprietà degli stimatori
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento.
Analisi dei dati per i disegni ad un fattore
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Inferenza statistica per un singolo campione
Valutazione delle ipotesi
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 7-2: Test di significatività
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a LA STATISTICA INFERENZIALE
Valutazione della stima: gli intervalli di confidenza
di cosa si occupa la statistica inferenziale?
Lezione 8 Numerosità del campione
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 7 i Test statistici
Il test di ipotesi Cuore della statistica inferenziale!
Verifica delle ipotesi su due campioni di osservazioni
Le distribuzioni campionarie
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
La verifica d’ipotesi Docente Dott. Nappo Daniela
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
IL CAMPIONE.
“Teoria e metodi della ricerca sociale e organizzativa”
ANALISI STATISTICA DI DATI CAMPIONARI
Le distribuzioni campionarie
Test basati su due campioni Test Chi - quadro
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
“Teoria e metodi della ricerca sociale e organizzativa”
Intervalli di confidenza
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
La distribuzione campionaria della media
Elaborazione statistica di dati
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Accademia europea dei pazienti sull'innovazione terapeutica Lo scopo e i fondamenti della statistica negli studi clinici.
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Statistica di Base per le Scienze Pediatriche luigi greco D.C.H, M.D., M.Sc.M.C.H., Ph.D. Dipartimento di Pediatria UniFEDERICOII.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Rosoluzione.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Campionamento.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Campionamento.
Corso di Laurea Magistrale in Economia e Professioni
V - 1 Prof. Giorgio Tassinari Corso di Laurea Magistrale in Economia e Professioni Statistica per l’analisi dei dati Prima parte: il campionamento nella.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Scienze tecniche e psicologiche
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Implementazione.
Introduzione all’inferenza
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Varianza.
Transcript della presentazione:

Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Inferenza e Intervalli di confidenza 2.Stima dei parametri a intervalli 3.Intervalli di confidenza per la media (varianza nota) 4.Intervalli di confidenza per la media (varianza non nota) 5.Differenza tra statistica Z e T per piccoli campioni (dimostratore Excel) 6.Intervalli di confidenza per la proporzione 7.Corrispondenza tra IC e test di ipotesi bidirezionale (dimostratore Excel) 8.Dimensione campionaria e IC 9.Probabilità di copertura dell’ IC (dimostrazione Excel) 10.Definire la grandezza del campione in base al margine di errore 11.G-power come dimostratore 12.Comunicazioni conclusive

H0 con p 0 non bilanciato Una ditta afferma che il farmaco è efficace al 90%. In un campione di 200 persone che lo hanno usato si è rivelato efficace per 160 casi (80%). L’affermazione della dittà è legittima ad un livello di significatività dello 0.01? H0: l’affermazione è legittima: p  0.9 H1: l’affermazione non è legittima: p < 0.9 Lo z-score cade nella regione di rifiuto {z < NORMSINV(0.01)} quindi si può rigettare H0 e concludere che l’affermazione non è legittima

test di ipotesi e intervalli di confidenza (IC) Il test di ipotesi bilaterale identifica 

test di ipotesi e intervalli di confidenza (IC) Il test di ipotesi bilaterale identifica  se l’osservazione ricade nell’intervallo al livello 1-  non esistono evidenze sufficienti per respingere H0

test di ipotesi e intervalli di confidenza (IC) Una tecnica alternativa per stabilire se una osservazione è consistente o meno con H0 consiste nella stima dei parametri per intervalli dal TLC abbiamo visto che la stima puntuale E(  ) di un parametro  è come il tiro al bersaglio a causa dell’ errore campionario la media del singolo campione sarà diversa da quella della popolazione correttezza= E(  ) -  efficienza= Var 

stimatore distorto ma efficente stimatore distorto e inefficiente/disperso stimatore corretto ed efficente test di ipotesi e intervalli di confidenza (IC) Una tecnica alternativa per stabilire se una osservazione è consistente o meno con H0 consiste nella stima dei parametri per intervalli dal TLC abbiamo visto che la stima puntuale E(  ) di un parametro  è come il tiro al bersaglio a causa dell’ errore campionario la media del singolo campione sarà diversa da quella della popolazione

test di ipotesi e intervalli di confidenza (IC) Una tecnica alternativa per stabilire se una osservazione è consistente o meno con H0 consiste nella stima dei parametri per intervalli L’indice sintetico della correttezza ed efficienza è lo scarto quadratico medio dal valore atteso (MSE) correttezza= E(  ) –  efficienza= Var  SQM= Var  2

test di ipotesi e intervalli di confidenza (IC) Una tecnica alternativa per stabilire se una osservazione è consistente o meno con H0 consiste nella stima dei parametri per intervalli Jerzy Neyman 1930 (U. California, Berkeley) identifica la statistica per definire quanto sia precisa la stima rispetto al vero valore del parametro

test di ipotesi e intervalli di confidenza (IC) Una tecnica alternativa per stabilire se una osservazione è consistente o meno con H0 consiste nella stima dei parametri per intervalli Quale è la probabilità che, dato un certo set di osservazioni, la media della popolazione ricada all’interno di un intervallo diciamo con il 90, 95 o 99 % della confidenza IC= stima puntuale ± un margine di errore

caso con varianza nota Dal TLC sappiamo che il miglior stimatore puntuale della media della popolazione incognita è dato dalla media aritmetica delle osservazioni campionarie Analogamente lo stimatore puntuale della varianza è: Si stima quindi  da come?

Inverto l’equazione in  livello di confidenza +2sd; sd;  I risultati ad un test di inteligenza ottenuti su un campione di 200 osservazioni danno una media di  La deviazione standard raccolta sulla popolazione è di 20  Una media della popolazione pari a 50 può far parte di questo campione?

Inverto l’equazione in  livello di confidenza sd; sd; NORMINV(1-  /2;0;1)

Inverto l’equazione in  livello di confidenza sd; sd;  C’è il 95% delle probabilità che l’intelligenza media della popolazione sia compresa fra [52.7, 58.2]  Osservare una media di 50 sarebbe improbabile  Analogo a rigettare H0:  per   95% 2.5%

ricettario Ricettario_IC_mediaNormale.xls

l’esempio, ha scarsa applicabilità dato che è raro essere a conoscenza della varianza della popolazione Come procediamo?

IC: caso con varianza non nota Grandi campioni (n> 30) Piccoli campioni (n< 30) il procedimento con la statistica t fornisce una stima aggiustata per i gradi di libertà quindi un IC sempre minore e più preciso della statistica z stimiamo la varianza della popolazione con la varianza del campione Gradi di libertà

vediamo un esempio nel caso di piccoli campioni calcoliamo l’IC con z con un grado di fiducia del 95% +2sd; sd;  Osservare una media di 50 sarebbe improbabile  Analogo a rigettare H0:  = 50 per  = 0.05 IC: caso con varianza non nota

vediamo un esempio nel caso di piccoli campioni calcoliamo l’IC con t con un grado di fiducia del 95% +2sd; sd; INVT(  ;COUNT()-1) L’IC sarà quindi maggiore IC: caso con varianza non nota

concludiamo che vediamo un esempio nel caso di piccoli campioni +2sd; sd;  In base alla statistica t non possiamo rigettare H0:  = 50 per  = 0.05  In base alla statistica z invece una  = 50 è inverosimile  non rigettiamo H0  Il campione è piccolo e la statistica t corregge per i gdl

ricettario Ricettario_IC_mediaT.xls

dimostratore IC Excel LimitDiConfidenza.xls per una distribuzione random gaussiana di punteggi calcola i limiti fiduciari in accordo con la statistica z e t e ne visualizza il risultato Foglio: ICVarianzaNonNotaSMALLs

dimostratore IC Excel LimitDiConfidenza.xls $B$8-$B$9*$B$6/SQRT(COUNT(D2:D201)) Foglio: ICVarianzaNonNotaSMALLs

dimostratore IC Excel LimitDiConfidenza.xls =$B$8-$B$9*$B$7/SQRT(COUNT(D2:D201)) Foglio: ICVarianzaNonNotaSMALLs

IC e proporzioni su 100 studenti solo 35 hanno passato l’esame di statistica. Quale è la probabilità al 95% associata a tale stima puntuale?

 L'errore standard della proporzione campionaria è riassumendo: errore standard delle proporzioni  La proporzione della popolazione p è la media µ della distribuzione di probabilità le cui probabilità sono pari a:  La deviazione standard di questa distribuzione di probabilità è pari a  Dal TLC sappiamo che la formula per l'errore standard della media campionaria è

 si trova entro unità dal parametro , cioè, tra e....., con probabilità pari IC al 95%  di contro, la probabilità che non si trovi entro da  è pari a  anche in questo caso, come nel caso di medie con varianza incognita, il parametro  non è noto e si usa l’errore standard stimato

IC per proporzioni 35 studenti su 100 passano l’esame disegniamo la distribuzione campionaria delle proporzioni 0.35

IC per proporzioni 35 studenti su 100 passano l’esame disegniamo la distribuzione campionaria delle proporzioni 0.35  la probabilità di raggiungere il 50% con le stesse modalità è a dir poco vana  p 0 = 0.5 è a tre deviazioni standard dalla media campionaria

corrispondenza IC – test di ipotesi 0.35 z critico z score normale standard H0: p= p 0 = 0.5 H1: p ≠ p 0 formulando le due ipotesi possiamo tradurre l’ IC nello spazio di decisione del test di ipotesi rappresentato dalla normale standard

ricettario Ricettario_IC_proporzione.xls

Corrispondenza tra IC e test di ipotesi in Excel Test_Ipotesi_vs_IC.xls Dimostratore simile a quello creato per Normale_standard_e_proporzioni.xls con l’aggiunta della distribuzione campionaria delle proporzioni (approssimata con la normale) e il calcolo dell’ IC usando i riferimenti personalizzati Normale_standard_e_proporzioni.xls /n

Test_Ipotesi_vs_IC.xls definiamo i nomi delle celle per scrivere le formule p n fr alfa p0 media errore standard /n Corrispondenza tra IC e test di ipotesi in Excel

Test_Ipotesi_vs_IC.xls la distribuzione campionaria delle proporzioni è approssimata da una normale con media e deviazione standard usando NORMDIST(T i ;media;errore_standard;0) /n Corrispondenza tra IC e test di ipotesi in Excel

Test_Ipotesi_vs_IC.xls I due estremi dell’intervallo di confidenza sono calcolati:  p-(NORMINV(1-alfa/2;0;1))*(SQRT(p*(1-p)/n));  p+(NORMINV(1-alfa/2;0;1))*(SQRT(p*(1-p)/n)); e vengono disegnati assieme alla distribuzione di densità /n Corrispondenza tra IC e test di ipotesi in Excel

Osservazione n. 1: p= 0.4, n= 100,  = 0.05 rigetto H0 in tutti e tre i casi:  test di ipotesi monodirezionale p= <   test di ipotesi bidirezionale p= <    IC: P(0.30 < 0.5 < 0.496) <  /n

Osservazione n. 2: p= 0.41, n= 100,  = 0.05 non rigetto H0 solo nel test monodirezionale:  test di ipotesi monodirezionale p= <   test di ipotesi bidirezionale p= >    IC: P(0.31  /n

Conclusione n.1  Test di ipotesi e calcolo degli intervalli di confidenza si equivalgono come procedure inferenziali  E’ utile combinare il test di ipotesi con gli IC in maniera da fornire una idea di quali valori sono verosimili /n

Osservazione n. 3: p= 0.41, n= 150,  = 0.05 nonostante p non sia cambiata rigetto H0 in tutti e tre i casi:  test di ipotesi monodirezionale p= <   test di ipotesi bidirezionale p= <    IC: P(0.33 < 0.5 < 0.489) <  /n

Conclusione n. 2: Campioni di maggiore ampiezza forniscono intervalli più stretti dato che IC è inversamente proporzionale alla radice quadrata di n /n

dimensione campinaria e IC p= 0.4 n= 50 n= 80 n= 160 Dal TLC sappiamo che la distribuzione campionaria si restringe attorno alla media all’aumentare di n

Fig pag 96 Effetto della dimenzione campionaria

probabilità di copertura degli IC e TLC  Cap. 10 Paganoni, Pontiggia: Esempio 1  L’ IC è un intervallo aleatorio che ha una probabilità 1-  di contenere un parametro incognito (diciamo la media)  L’ IC al 95% per la media di una popolazione ha una probabilità di contenere il vero valore della media al 95%  Verifichiamo con un documento in tutto simile a PotenzaTESTeTLC.xls PotenzaTESTeTLC.xls

probabilità di copertura in Excel generiamo 20 variabili aleatorie (n) ciascuna di 500 osservazioni con legge normale di parametri  50 (B1) e  2.5 (B2) applicando ad ogni cella IntervalloDIFIDUCIAeTLC.xls

probabilità di copertura in Excel definiamo il livello  del quantile della normale standard di ordine 1 –  IntervalloDIFIDUCIAeTLC.xls

probabilità di copertura in Excel calcoliamo l’estremo inferiore con V20-NORMINV(1-$B$3 /2;0;1)*($B$2)/SQRT(20) IntervalloDIFIDUCIAeTLC.xls

probabilità di copertura in Excel creiamo una colonna che con la funzione SE riporta 1 se il vero valore della media 50 è incluso nell’intervallo, 0 se non lo contiene IntervalloDIFIDUCIAeTLC.xls

probabilità di copertura in Excel ad esempio: IF(AND( $B$1 > X20; $B$1 < Y20);1;0) IntervalloDIFIDUCIAeTLC.xls

probabilità di copertura in Excel adesso calcoliamo la proporzione di realizzazioni che ricadono nell’ IC nella calla M19  la probabilità di copertura per l’intervallo z al 95% è  nel 95.2% dei casi l’IC conteneva la vera media  IntervalloDIFIDUCIAeTLC.xls

visualizzare la probabilità di copertura  calcoli la lunghezza dell’intervallo per ciascuna prova (LS -LI)  calcoli la lunghezza media  crei uno scatterplot con in ascissa i valori medi e in ordinata l’osservazione campionaria (i=1 → N)  aggiungi come barre di errore in x la lunghezza media dell’ IC

Esercizio fate la stessa operazione di verifica per la distribuzione t ossia nel caso in cui la varianza della popolazione non sia nota cosa vi aspettate?

Quanto deve essere grande il mio campione affinchè il margine di errore al 95% della proporzione/media sia un valore predefinito m? applicazione IC: quanto grande il campione? margine di errore, m invertendo per n si ottiene: varianza più in generale

Dal TLC sappiamo che la distribuzione campionaria si restringe al crescere di n fino a che, in corrispondenza del valore di n richiesto, il 95% della distribuzione si trova all'interno del margine di errore prescelto. per p= 0.5 e m= = 784

commento su CI e n  la grandezza del campione dipende dal livello di fiducia prescelto (maggiore il livello di confidenza maggiore deve essere n) e dalla variabilità della popolazione (maggiore variabilità maggiore n)  stimare n non è facile dato che (1) dipende da molti parametri; (2) risorse limitate nel reclutamento di partecipanti e si deve spesso ricorrere a compromessi

G-power

l’interfaccia Restituisce la grandezza del campione necessaria per osservare una differenza fra proporzioni g (effect size) dati  e 

l’interfaccia aumentando la potenza del test si riduce il numero di osservazioni necessarie

l’interfaccia  stessa cosa per il caso della differenza di una media da un valore atteso (t test)  H0:     H0:   Ipotizzo  = 2  Grandezza relativa attesa dell’effetto (effect size)

l’interfaccia Cliccando su X-Y plot: si può vedere come la grandezza del campione aumenta all’aumentare della potenza del test fino a che questa raggiungere il valore desiderato di 0.95 per n= 45

 Inferenza statistica: test di ipotesi, stima dei parametri, intervalli di confidenza confronto tra due gruppi  Agresti e Finlay: , 7.3, 7.4, , 9.2  Borazzo, Perchinunno: 1-2; 4; ;  Paganoni, Pontiggia: 1-6; 8-10; comunicazioni aggiornamento programma

 Prof. Corrado Cavallero  Giovedì 16/04, 14:00 -16:00, Aula 2B  Test non parametrici  circa 18 ore comunicazioni inizio modulo 2

 Solo appelli ordinari: Giugno e Luglio;  Due appelli parziali, uno per ciascun modulo: senza registrazione;  Un appello generale: registrazione solo nel momento in cui avrete inserito l’esito di entrambi i moduli;  Firma digitale direttamente alla scadenza dell’appello generale comunicazioni modalità d’esame

Buona Pasqua buona preparazione