“Teoria e metodi della ricerca sociale e organizzativa”

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
8) GLI INTERVALLI DI CONFIDENZA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
Intervalli di confidenza
Confronto tra 2 campioni Nella pratica è utilissimo confrontare se 2 campioni provengono da popolazioni con la stessa media: Confronti tra produzioni di.
Il chi quadro indica la misura in cui le
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Analisi dei dati per i disegni ad un fattore
Teorema del limite centrale …dimostra che la distribuzione campionaria delle medie si approssima alla distribuzione normale qualunque sia la forma delle.
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Inferenza statistica per un singolo campione
Valutazione delle ipotesi
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Analisi della varianza (a una via)
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 9: test di Student
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 7-2: Test di significatività
Corso di biomatematica lezione 7: Test di significatività
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a LA STATISTICA INFERENZIALE
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Lezione 8 Numerosità del campione
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Il test di ipotesi Cuore della statistica inferenziale!
Verifica delle ipotesi su due campioni di osservazioni
Le distribuzioni campionarie
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
La verifica d’ipotesi Docente Dott. Nappo Daniela
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
Il residuo nella predizione
“Teoria e metodi della ricerca sociale e organizzativa”
ANALISI STATISTICA DI DATI CAMPIONARI
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
Intervalli di confidenza
La distribuzione campionaria della media
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Elaborazione statistica di dati
Accenni di analisi monovariata e bivariata
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
Dalmine, 26 Maggio 2004 Esercitazioni di Statistica con Matlab Dott. Orietta Nicolis fttp:\ingegneria.unibg.it.
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
ANALISI DELLA VARIANZA (ANOVA)
Correlazione e regressione lineare
Accademia europea dei pazienti sull'innovazione terapeutica Lo scopo e i fondamenti della statistica negli studi clinici.
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Accenni di analisi monovariata e bivariata. ANALISI MONOVARIATA Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle.
Statistica di Base per le Scienze Pediatriche luigi greco D.C.H, M.D., M.Sc.M.C.H., Ph.D. Dipartimento di Pediatria UniFEDERICOII.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
1111 Università di Napoli Federico II, Dipartimento di Scienze Economiche e Statistiche S. BalbiI test non parametrici.
Corso di Laurea Magistrale in Economia e Professioni
INTRODUZIONE ALL’ANALISI DELLA VARIANZA
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Introduzione all’inferenza
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

“Teoria e metodi della ricerca sociale e organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università Milano-Bicocca 2009 Simone Sarti 21 maggio 2009

Test di significatività

Test di significatività Se testiamo un’ipotesi su un campione, quanto le conclusioni che traiamo sono “vere” anche nella popolazione?

Test di significatività VARIABILI CARDINALI Test di significatività zeta su una variabile

In un comune il sindaco ritiene di finanziare nuovamente un servizio pubblico se il giudizio di un campione di cittadini sarà superiore a 6 (in una scala da 1 a 10). Vengono intervistati, tramite selezione di un campione casuale semplice, 300 cittadini. Il campione ha come giudizio medio 6,5 e deviazione standard 3,8. CAMPIONE n=300

Hp di lavoro: Giudizio > 6 Hp nulla: Giudizio <= 6 Quindi testiamo l’ipotesi che il giudizio nella popolazione sia minore o uguale a 6.

Logica falsificazionista, Ipotesi Per corroborare H1 devo falsificare H0. Non verifico H1, ma ne falsifico l’ipotesi “opposta” attraverso un test empirico che mi porterà ad accettare o respingere H0. Se rifiuto H0, allora l’ipotesi di lavoro H1 viene corroborata. Se “accetto” H0, non possiamo escludere che la differenza non sia dovuta al caso, l’ipotesi di lavoro H1 viene falsificata. ATTENZIONE: Nella logica falsificazionista H0 non è un’ipotesi alternativa che sostituisce H1. Più correttamente occorrerebbe affermare che H0 non può essere rifiutata, non che H0 è accettata.

Logica falsificazionista, errori Realtà del fenomeno H0 vera H0 falsa H0 non rifiutata No errore Errore II tipo (β) H0 rifiutata I tipo (α) Esito del test

α è la probabilità teorica di rifiutare a priori l’H0 quando questa è vera. α viene fissata arbitrariamente, solitamente si utilizza una soglia del 5 %. α = 0,05

Errore di falso rifiuto L’errore di 1° tipo (o alfa) è la probabilità che stabiliamo a priori per rifiutare l’ipotesi nulla. Maggiore è alfa, maggiore è la possibilità di commettere un errore del primo tipo, cioè di rifiutare H0 quando questa è vera. Viceversa, minore è alfa, più siamo sicuri di non commettere questo errore.

Dal teorema del limite centrale sappiamo che la distribuzione delle medie campionarie tratta da una popolazione con media mu e dev.std. sigma, segue una distribuzione normale con media e deviazione standard pari a:

Non essendo conosciuta la varianza della popolazione, usiamo le deviazioni standard del campione per stimare l’errore standard (ossia la dev.std delle medie campionarie). Useremo la distribuzione t di Student

Ricapitolando ... Ipotesi nulla Ho Livello di significatività: 2,5%, ALFA uguale a 0,025 n = 300

Area Non Rifiuto Ho Area Rifiuto Ho 0,975 0,025 T Punti std In termini di punti standard il 97,5% di tutte le medie campionarie sono comprese nell’intervallo tra meno infinito e + 1,98: Area Non Rifiuto Ho Area Rifiuto Ho 0,975 0,025 T Punti std

CONFRONTO TRA FENOMENO OSSERVATO E IPOTESI Possiamo calcolare il punteggio tY in punti standard risultante dalla differenza del punteggio osservato sul campione con il punteggio che dovremmo trovare nel caso fosse “vera” l’ipotesi nulla, cioè =6. Campione osservato H0 Effetto del test Errore standard = Errore standard della distribuzione delle medie campionarie

0,975 Soglia +1,98 tY T +2,28 IPOTESI NULLA CAMPIONE Confrontiamo l’esito del test (tY = 2,28) con la soglia della zona di rifiuto (tα = 1,98). Rifiutiamo l’ipotesi nulla H0. Ci allontaniamo abbastanza dall’ipotesi nulla per essere “ragionevolmente certi” che nella popolazione il giudizio sia maggiore di 6, con un livello di significatività del 97,5%. Soglia +1,98 0,975 tY T +2,28 IPOTESI NULLA CAMPIONE

CONFRONTO TRA FENOMENO OSSERVATO E IPOTESI Possiamo anche effettuare il test utilizzando i valori osservati, ossia calcolando il giudizio corrispondente alla soglia di 1,98 punti standard. Per poi confrontarlo con la media campionaria 6,5. 6,5 0,975 Y 6 6,44 +1,98 T +2,28 IPOTESI NULLA CAMPIONE

I due modi di testare l’ipotesi sono equivalenti I due modi di testare l’ipotesi sono equivalenti. Nel primo testiamo l’ipotesi sui punteggi standardizzati, nell’altro sui valori assoluti. Il livello di significatività e gli esiti del test sono i medesimi. Valore tY associato alla differenza tra il punteggio campionario e l’ipotesi 2,28 Valore t Punteggio associato al valore tY 6,5 Giudizio

I due modi di testare l’ipotesi sono equivalenti I due modi di testare l’ipotesi sono equivalenti. Nel primo testiamo l’ipotesi sui punteggi standardizzati, nell’altro sui valori assoluti. Il livello di significatività e gli esiti del test sono i medesimi. Punteggio associato al limite superiore dell’I.C. 6,44 Giudizio Valore tα associato al limite superiore dell’I.C. 1,98 Valore t

Test di significatività VARIABILI CARDINALI Test di significatività zeta tra due gruppi

Poniamo che in una data popolazione (N=100000) misuriamo il reddito, che ha media 1375 e deviazione standard 852. Di questa popolazione sappiamo che una parte è laureata e l’altra non lo è.

Poniamo di voler testare l’ipotesi che il titolo di studio sia associato ad un reddito medio differente. Per fare questo estraiamo un campione casuale (semplice) di 150 individui (n=150).

CAMPIONE N=150

Hp di lavoro: Vi sono differenze nei livelli di reddito secondo il titolo di studio. Hp nulla: Non vi sono differenze

Logica falsificazionista, Ipotesi Per corroborare H1 devo falsificare H0. Non verifico H1, ma ne falsifico l’ipotesi “opposta” attraverso un test empirico che mi porterà ad accettare o respingere H0. Se rifiuto H0, allora l’ipotesi di lavoro H1 viene corroborata. Se “accetto” H0, non possiamo escludere che la differenza non sia dovuta al caso, l’ipotesi di lavoro H1 viene falsificata. ATTENZIONE: Nella logica falsificazionista H0 non è un’ipotesi alternativa che sostituisce H1. Più correttamente occorrerebbe affermare che H0 non può essere rifiutata, non che H0 è accettata.

Logica falsificazionista, errori Realtà del fenomeno H0 vera H0 falsa H0 non rifiutata No errore Errore II tipo (β) H0 rifiutata I tipo (α) Esito del test

α è la probabilità teorica di rifiutare a priori l’H0 quando questa è vera. α viene fissata arbitrariamente, solitamente si utilizza una soglia del 5 %. α = 0,05

Errore di falso rifiuto L’errore di 1° tipo (o alfa) è la probabilità che stabiliamo a priori per rifiutare l’ipotesi nulla. Maggiore è alfa, maggiore è la possibilità di commettere un errore del primo tipo, cioè di rifiutare H0 quando questa è vera. Viceversa, minore è alfa, più siamo sicuri di non commettere questo errore.

Dal teorema del limite centrale si deriva che: la distribuzione della differenza tra due medie campionarie tratte da due popolazioni con media muL e muNL, e dev.std. sigmaL e sigmaNL, segue una distribuzione normale con media e deviazione standard pari a:

Non essendo conosciute le varianze dei due gruppi, laureati e non laureati, usiamo le deviazioni standard dei campioni.

CAMPIONE N=150

Ricapitolando ... Ipotesi nulla Ho Livello di significatività: 5%, ALFA uguale a 0,05 NL= 84 NNL=66

Il 95% di tutte le medie campionarie sono comprese nell’intervallo: Area Rifiuto Ho Area Non Rifiuto Ho p(t) 0,95 0,025 0,025 T

CONFRONTO TRA FENOMENO OSSERVATO E IPOTESI Calcoliamo i punti standard t(L-NL) risultante dal confronto tra la differenza osservata fra i campioni ed il punteggio che dovremmo trovare nel caso fosse vera l’ipotesi nulla, cioè =0. H0 Campione osservato Errore standard della distribuzione delle medie campionarie

0,95 Soglia -1,98 Soglia +1,98 T +1,79 IPOTESI NULLA CAMPIONE Non rifiutiamo l’ipotesi nulla H0. La differenza tra i gruppi “laureati” e “non laureati” non diverge significativamente da zero. Non possiamo escludere che la differenza osservata nei campioni non sia dovuta a semplice effetto del caso. Non ci allontaniamo abbastanza dall’ipotesi nulla per essere “ragionevolmente certi” che nella popolazione vi sia differenza nel reddito dei due gruppi Soglia -1,98 Soglia +1,98 0,95 T +1,79 IPOTESI NULLA CAMPIONE

Se aumentiamo l’ampiezza del campione a 300 ... Ipotesi nulla Ho Differenza osservata: Livello di significatività: 5%, ALFA uguale a 0,05 nL= 181 nNL=120

Calcoliamo i punti standard t(L-NL) risultante dal confronto tra la differenza osservata fra i campioni ed il punteggio che dovremmo trovare nel caso fosse vera l’ipotesi nulla, cioè =0.

0,95 Soglia -1,96 Soglia +1,96 T +3,10 IPOTESI NULLA CAMPIONE Rifiutiamo l’ipotesi nulla H0. La differenza tra i gruppi “laureati” e “non laureati” diverge significativamente da zero. A livello di significatività del 5% possiamo affermare che nella popolazione laureati e non laureati hanno redditi differenti. Ci allontaniamo dall’ipotesi nulla a sufficienza per essere “ragionevolmente certi” che nella popolazione vi sia differenza nel reddito dei due gruppi. Soglia -1,96 Soglia +1,96 0,95 T +3,10 IPOTESI NULLA CAMPIONE

Test di significatività VARIABILI CATEGORIALI Test del Chi-quadrato (MONOVARIATA)

In un convegno internazionale una sessione è composta da scienziati delle seguenti nazionalità. % Italiani 75 31,3 Francesi 29 12,1 Inglesi 36 15,0 Tedeschi 19 7,9 Spagnoli 81 33,8 240 100,0

Test di significatività Poniamo l’ipotesi che la composizione dei membri del convegno non sia distribuita ugualmente secondo la nazionalità. Infatti, considerate cinque le nazioni che partecipano al convegno, avremmo dovuto avere che alla sessione partecipassero il 20 % di scienziati per nazione.

Hp di lavoro: Vi sono differenze nella partecipazione al convegno secondo la nazionalità. Hp0 nulla: Non vi sono differenze. 20% per nazione.

Calcoliamo le differenze per misurare quanto il fenomeno osservato si discosta dalla situazione ipotizzata: O E N % Hp0 N/5 (O-E)2 (O-E)2/E Italiani 75 31,3 48 729 15,2 Francesi 29 12,1 361 7,5 Inglesi 36 15,0 144 3 Tedeschi 19 7,9 841 17,5 Spagnoli 81 33,8 1089 22,7 240 100,0 Totale 65,9 Ipotesi nulla

Chi-Quadrato χ2 Maggiore è il valore di χ 2 , più siamo lontani dall’ipotesi di equidistribuzione. i=1…K Dove f*i è la frequenza attesa

Chi-Quadrato χ2 Il chi-quadrato che abbiamo osservato costituisce una misura della distanza dall’ipotesi nulla di equidistribuzione (20% di scienziati per nazione).

Distribuzione del Chi-Quadrato χ2 Il chi-quadrato ha una funzione di densità nota, ma variabile secondo i gradi di libertà. I gradi di libertà, nell’esempio proposto, sono k-1, dove k sono le modalità. I gradi di libertà rappresentano le frequenze di cella che possiamo “liberamente” inserire dato il totale. Oppure, costituiscono i vincoli minimi necessari a riempire tutte le celle.

Gradi di libertà = k – 1 gdl = 4 gdl = 3 gdl = 1 N Italiani Francesi Inglesi Tedeschi Spagnoli 100 N Molto Abbastanza Poco Per niente 100 N Maschi Femmine 100 gdl = 4 gdl = 3 gdl = 1

φ(χ2) Funzione di densità di χ2 χ2

Il χ2 E’ FUNZIONE DEI GRADI DI LIBERTA’ φ(χ2) g=1 g=4 g=10 g=20 χ2

χ2 Distribuzione nota della v.c. χ2 φ(χ2) Funzione di densità di χ2 con gl=10 AREA di NON Rifiuto di H0 AREA di Rifiuto di H0 0.80 0.20 χ2 13,44

Logica falsificazionista, errori Realtà del fenomenmo H0 vera H0 falsa H0 non rifiutata No errore Errore II tipo (β) H0 rifiutata I tipo (α) Esito del test

α è la probabilità teorica di rifiutare a priori l’H0 quando questa è vera. α viene fissata arbitrariamente, solitamente si utilizza una soglia del 5 %. α = 0,05

Livello di significatività α ; costituisce l’area di RIFIUTO di H0, ossia l’area di ACCETTAZIONE di H1 g = gradi di libertà α χ2 χ2α

Ricapitolando … Il chi-quadrato osservato è uguale a 65,9 Ricapitolando … Il chi-quadrato osservato è uguale a 65,9. I gradi di libertà sono 4. Hp nulla: Non vi sono differenze: 20% per nazione Livello di significatività alfa=0,05

Valore critico del Chi-quadro α

AREA di Rifiuto di H0 e accettazione di H1 Rifiutiamo H0. Respingiamo l’ipotesi nulla di equidistribuzione. Con una significatività statistica dello 0,05 accettiamo che gli scienziati non rappresentano allo stesso modo le nazioni che partecipano alla sessione. φ(χ2) Funzione di densità di χ2 con gl=4 AREA di Rifiuto di H0 e accettazione di H1 0.95 0.05 χ2 9,49 65,9 χα2