La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

1 “Teoria e metodi della ricerca sociale e organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università Milano-Bicocca.

Presentazioni simili


Presentazione sul tema: "1 “Teoria e metodi della ricerca sociale e organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università Milano-Bicocca."— Transcript della presentazione:

1 1 “Teoria e metodi della ricerca sociale e organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università Milano-Bicocca 2009 Simone Sarti 21 maggio 2009

2 2 Test di significatività

3 3 Se testiamo un’ipotesi su un campione, quanto le conclusioni che traiamo sono “vere” anche nella popolazione?

4 4 Test di significatività VARIABILI CARDINALI Test di significatività zeta su una variabile

5 5 In un comune il sindaco ritiene di finanziare nuovamente un servizio pubblico se il giudizio di un campione di cittadini sarà superiore a 6 (in una scala da 1 a 10). Vengono intervistati, tramite selezione di un campione casuale semplice, 300 cittadini. Il campione ha come giudizio medio 6,5 e deviazione standard 3,8. CAMPIONE n=300

6 6 Hp di lavoro: Giudizio > 6 Hp nulla: Giudizio <= 6 Quindi testiamo l’ipotesi che il giudizio nella popolazione sia minore o uguale a 6.

7 7 Logica falsificazionista, Ipotesi Per corroborare H 1 devo falsificare H 0. Non verifico H 1, ma ne falsifico l’ipotesi “opposta” attraverso un test empirico che mi porterà ad accettare o respingere H 0. Se rifiuto H 0, allora l’ipotesi di lavoro H 1 viene corroborata. Se “accetto” H 0, non possiamo escludere che la differenza non sia dovuta al caso, l’ipotesi di lavoro H 1 viene falsificata. ATTENZIONE: Nella logica falsificazionista H 0 non è un’ipotesi alternativa che sostituisce H 1. Più correttamente occorrerebbe affermare che H 0 non può essere rifiutata, non che H 0 è accettata.

8 8 Logica falsificazionista, errori H 0 veraH 0 falsa H 0 non rifiutata No errore Errore II tipo (β) H 0 rifiutata Errore I tipo (α) No errore Esito del test Realtà del fenomeno

9 9 α è la probabilità teorica di rifiutare a priori l’H 0 quando questa è vera. α viene fissata arbitrariamente, solitamente si utilizza una soglia del 5 %. α = 0,05

10 10 Errore di falso rifiuto L’errore di 1° tipo (o alfa) è la probabilità che stabiliamo a priori per rifiutare l’ipotesi nulla. Maggiore è alfa, maggiore è la possibilità di commettere un errore del primo tipo, cioè di rifiutare H 0 quando questa è vera. Viceversa, minore è alfa, più siamo sicuri di non commettere questo errore.

11 11 Dal teorema del limite centrale sappiamo che la distribuzione delle medie campionarie tratta da una popolazione con media mu e dev.std. sigma, segue una distribuzione normale con media e deviazione standard pari a:

12 12 Non essendo conosciuta la varianza della popolazione, usiamo le deviazioni standard del campione per stimare l’errore standard (ossia la dev.std delle medie campionarie). Useremo la distribuzione t di Student

13 13 Ipotesi nulla H o Livello di significatività: 2,5%, ALFA uguale a 0,025 n = 300 Ricapitolando...

14 T 0,975 0,025 In termini di punti standard il 97,5% di tutte le medie campionarie sono comprese nell’intervallo tra meno infinito e + 1,98: Area Rifiuto H o Area Non Rifiuto H o Punti std

15 15 Possiamo calcolare il punteggio t Y in punti standard risultante dalla differenza del punteggio osservato sul campione con il punteggio che dovremmo trovare nel caso fosse “vera” l’ipotesi nulla, cioè =6. CONFRONTO TRA FENOMENO OSSERVATO E IPOTESI Errore standard della distribuzione delle medie campionarie H0H0 Effetto del test Errore standard = Campione osservato

16 0 0,975 Confrontiamo l’esito del test (t Y = 2,28) con la soglia della zona di rifiuto (t α = 1,98). Rifiutiamo l’ipotesi nulla H 0. Ci allontaniamo abbastanza dall’ipotesi nulla per essere “ragionevolmente certi” che nella popolazione il giudizio sia maggiore di 6, con un livello di significatività del 97,5%. T Soglia +1,98 IPOTESI NULLACAMPIONE tYtY +2,28

17 6 0,975 Y IPOTESI NULLA CAMPIONE Possiamo anche effettuare il test utilizzando i valori osservati, ossia calcolando il giudizio corrispondente alla soglia di 1,98 punti standard. Per poi confrontarlo con la media campionaria 6,5. 6,44 CONFRONTO TRA FENOMENO OSSERVATO E IPOTESI T 0 +2,28 6,5 +1,98

18 18 I due modi di testare l’ipotesi sono equivalenti. Nel primo testiamo l’ipotesi sui punteggi standardizzati, nell’altro sui valori assoluti. Il livello di significatività e gli esiti del test sono i medesimi. Valore t Y associato alla differenza tra il punteggio campionario e l’ipotesi Punteggio associato al valore t Y 2,28 6,5 Valore t Giudizio

19 19 I due modi di testare l’ipotesi sono equivalenti. Nel primo testiamo l’ipotesi sui punteggi standardizzati, nell’altro sui valori assoluti. Il livello di significatività e gli esiti del test sono i medesimi. Valore t α associato al limite superiore dell’I.C. Punteggio associato al limite superiore dell’I.C. 1,98 6,44 Valore t Giudizio

20 20

21 21 Test di significatività VARIABILI CARDINALI Test di significatività zeta tra due gruppi

22 22 Poniamo che in una data popolazione (N=100000) misuriamo il reddito, che ha media 1375 e deviazione standard 852. Di questa popolazione sappiamo che una parte è laureata e l’altra non lo è.

23 23 Poniamo di voler testare l’ipotesi che il titolo di studio sia associato ad un reddito medio differente. Per fare questo estraiamo un campione casuale (semplice) di 150 individui (n=150).

24 24 CAMPIONE N=150

25 25

26 26 Hp di lavoro: Vi sono differenze nei livelli di reddito secondo il titolo di studio. Hp nulla: Non vi sono differenze

27 27 Logica falsificazionista, Ipotesi Per corroborare H 1 devo falsificare H 0. Non verifico H 1, ma ne falsifico l’ipotesi “opposta” attraverso un test empirico che mi porterà ad accettare o respingere H 0. Se rifiuto H 0, allora l’ipotesi di lavoro H 1 viene corroborata. Se “accetto” H 0, non possiamo escludere che la differenza non sia dovuta al caso, l’ipotesi di lavoro H 1 viene falsificata. ATTENZIONE: Nella logica falsificazionista H 0 non è un’ipotesi alternativa che sostituisce H 1. Più correttamente occorrerebbe affermare che H 0 non può essere rifiutata, non che H 0 è accettata.

28 28 Logica falsificazionista, errori H 0 veraH 0 falsa H 0 non rifiutata No errore Errore II tipo (β) H 0 rifiutata Errore I tipo (α) No errore Esito del test Realtà del fenomeno

29 29 α è la probabilità teorica di rifiutare a priori l’H 0 quando questa è vera. α viene fissata arbitrariamente, solitamente si utilizza una soglia del 5 %. α = 0,05

30 30 Errore di falso rifiuto L’errore di 1° tipo (o alfa) è la probabilità che stabiliamo a priori per rifiutare l’ipotesi nulla. Maggiore è alfa, maggiore è la possibilità di commettere un errore del primo tipo, cioè di rifiutare H 0 quando questa è vera. Viceversa, minore è alfa, più siamo sicuri di non commettere questo errore.

31 31 Dal teorema del limite centrale si deriva che: la distribuzione della differenza tra due medie campionarie tratte da due popolazioni con media mu L e mu NL, e dev.std. sigma L e sigma NL, segue una distribuzione normale con media e deviazione standard pari a:

32 32 Non essendo conosciute le varianze dei due gruppi, laureati e non laureati, usiamo le deviazioni standard dei campioni.

33 33 CAMPIONE N=150

34 34 Ipotesi nulla H o Livello di significatività: 5%, ALFA uguale a 0,05 N L = 84 N NL =66 Ricapitolando...

35 35 T 0,95 0,025 Il 95% di tutte le medie campionarie sono comprese nell’intervallo: p(t) Area Rifiuto H o Area Non Rifiuto H o

36 36 Calcoliamo i punti standard t (L-NL) risultante dal confronto tra la differenza osservata fra i campioni ed il punteggio che dovremmo trovare nel caso fosse vera l’ipotesi nulla, cioè =0. CONFRONTO TRA FENOMENO OSSERVATO E IPOTESI Errore standard della distribuzione delle medie campionarie H0H0 Campione osservato

37 0 0,95 Non rifiutiamo l’ipotesi nulla H 0. La differenza tra i gruppi “laureati” e “non laureati” non diverge significativamente da zero. Non possiamo escludere che la differenza osservata nei campioni non sia dovuta a semplice effetto del caso. Non ci allontaniamo abbastanza dall’ipotesi nulla per essere “ragionevolmente certi” che nella popolazione vi sia differenza nel reddito dei due gruppi T Soglia +1,98 +1,79 Soglia -1,98 IPOTESI NULLACAMPIONE

38 38 Ipotesi nulla H o Differenza osservata: Livello di significatività: 5%, ALFA uguale a 0,05 n L = 181 n NL =120 Se aumentiamo l’ampiezza del campione a

39 39 Calcoliamo i punti standard t (L-NL) risultante dal confronto tra la differenza osservata fra i campioni ed il punteggio che dovremmo trovare nel caso fosse vera l’ipotesi nulla, cioè =0.

40 0 0,95 Rifiutiamo l’ipotesi nulla H 0. La differenza tra i gruppi “laureati” e “non laureati” diverge significativamente da zero. A livello di significatività del 5% possiamo affermare che nella popolazione laureati e non laureati hanno redditi differenti. Ci allontaniamo dall’ipotesi nulla a sufficienza per essere “ragionevolmente certi” che nella popolazione vi sia differenza nel reddito dei due gruppi. T Soglia +1,96 +3,10 Soglia -1,96 IPOTESI NULLACAMPIONE

41 41

42 42 Test di significatività VARIABILI CATEGORIALI Test del Chi-quadrato (MONOVARIATA)

43 43 N% Italiani7531,3 Francesi2912,1 Inglesi3615,0 Tedeschi197,9 Spagnoli8133, ,0 In un convegno internazionale una sessione è composta da scienziati delle seguenti nazionalità.

44 44 Test di significatività Poniamo l’ipotesi che la composizione dei membri del convegno non sia distribuita ugualmente secondo la nazionalità. Infatti, considerate cinque le nazioni che partecipano al convegno, avremmo dovuto avere che alla sessione partecipassero il 20 % di scienziati per nazione.

45 45 Hp di lavoro: Vi sono differenze nella partecipazione al convegno secondo la nazionalità. Hp 0 nulla: Non vi sono differenze. 20% per nazione.

46 N%Hp 0 N/5(O-E) 2 (O-E) 2 /E Italiani7531, ,2 Francesi2912, ,5 Inglesi3615, Tedeschi197, ,5 Spagnoli8133, , ,0240 Calcoliamo le differenze per misurare quanto il fenomeno osservato si discosta dalla situazione ipotizzata: Totale 65,9 Ipotesi nulla OE

47 47 Chi-Quadrato χ 2 Maggiore è il valore di χ 2, più siamo lontani dall’ipotesi di equidistribuzione. i=1…K Dove f* i è la frequenza attesa

48 48 Chi-Quadrato χ 2 Il chi-quadrato che abbiamo osservato costituisce una misura della distanza dall’ipotesi nulla di equidistribuzione (20% di scienziati per nazione).

49 49 Distribuzione del Chi-Quadrato χ 2 Il chi-quadrato ha una funzione di densità nota, ma variabile secondo i gradi di libertà. I gradi di libertà, nell’esempio proposto, sono k-1, dove k sono le modalità. I gradi di libertà rappresentano le frequenze di cella che possiamo “liberamente” inserire dato il totale. Oppure, costituiscono i vincoli minimi necessari a riempire tutte le celle.

50 50 N Italiani Francesi Inglesi Tedeschi Spagnoli 100 N Molto Abbastanza Poco Per niente 100 Gradi di libertà = k – 1 N Maschi Femmine 100 gdl = 4gdl = 3gdl = 1

51 51 φ( χ 2 ) Funzione di densità di χ 2 0 φ(χ2)φ(χ2) χ2χ2

52 52 Il χ 2 E’ FUNZIONE DEI GRADI DI LIBERTA’ 0 φ(χ2)φ(χ2) χ2χ2 g=10 g=20 g=4 g=1

53 53 Distribuzione nota della v.c. χ 2 φ( χ 2 ) Funzione di densità di χ 2 con gl=10 χ2χ2 AREA di Rifiuto di H 0 13, AREA di NON Rifiuto di H 0

54 54 Logica falsificazionista, errori H 0 veraH 0 falsa H 0 non rifiutata No errore Errore II tipo (β) H 0 rifiutata Errore I tipo (α) No errore Esito del test Realtà del fenomenmo

55 55 α è la probabilità teorica di rifiutare a priori l’H 0 quando questa è vera. α viene fissata arbitrariamente, solitamente si utilizza una soglia del 5 %. α = 0,05

56 Livello di significatività α ; costituisce l’area di RIFIUTO di H 0, ossia l’area di ACCETTAZIONE di H 1 0 α χ2αχ2α χ2χ2 g = gradi di libertà

57 57 Ricapitolando … Il chi-quadrato osservato è uguale a 65,9. I gradi di libertà sono 4. Hp nulla: Non vi sono differenze: 20% per nazione Livello di significatività alfa=0,05

58 58 Valore critico del Chi-quadro 0 α

59 Rifiutiamo H 0. Respingiamo l’ipotesi nulla di equidistribuzione. Con una significatività statistica dello 0,05 accettiamo che gli scienziati non rappresentano allo stesso modo le nazioni che partecipano alla sessione. φ( χ 2 ) Funzione di densità di χ 2 con gl=4 χ2χ2 AREA di Rifiuto di H 0 e accettazione di H 1 9, ,9 χα2χα2


Scaricare ppt "1 “Teoria e metodi della ricerca sociale e organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università Milano-Bicocca."

Presentazioni simili


Annunci Google