Statistica inferenziale Obiettivo: trarre conclusioni sull’intera popolazione a partire dai risultati ottenuti sul campione, ossia serve a generalizzare i risultati. Descrivere un campione specifico, infatti, non è molto utile ai fini della comprensione della realtà e della ricerca psicologica. Rappresentatività: per poter fare delle inferenze il campione deve essere rappresentativo, ossia deve “rispecchiare” le caratteristiche della popolazione. A cosa serve la statistica inferenziale in psicologia? Confrontare campioni, testare l’efficacia di psicoterapie, interventi psicologici o corsi di formazione, studiare la relazione tra le variabili.
Possibili applicazioni Un campione di soggetti con disturbo ossessivo-compulsivo ha una media di Q.I. diversa rispetto alla popolazione di adulti? Gli individui con disturbo “bordeline” commettono più reati contro la persona rispetto agli individui con disturbo “paranoide”? La terapia cognitivo comportamentale è efficace per la cura di “pazienti bipolari”?
Verifica o falsificazione delle ipotesi? Popper: scienza ≠ verità assoluta. I risultati scientifici non sono mai certi e definitivi, poiché chiunque può metterli in discussione in qualsiasi momento. “una proposizione non può mai essere confermata empiricamente, ma solo falsificata”. Non possiamo VERIFICARE che un campione di soggetti con disturbo ossessivo compulsivo abbia una media di QI diversa dalla popolazione di adulti “normali”, ma possiamo FALSIFICARE che le due medie siano uguali.
Avanzamento della scienza La scienza avanza attraverso un processo di falsificazione dell’ipotesi nulla, che contiene lo stato dell’arte, contro l’ipotesi alternativa, che contiene la novità. H0: Ipotesi nulla, ciò che si intende rifiutare/falsificare. Soggetti con disturbo ossessivo e popolazione di adulti hanno la stessa media. H1: Ipotesi alternativa, ciò che non si intende rifiutare/falsificare. Soggetti con disturbo ossessivo e popolazione di adulti hanno una media diversa.
Cosa significa media diversa? Immaginiamo che: Il campione di soggetti con disturbo ossessivo compulsivo abbia media ( ) uguale a 104. La popolazione abbia media (µ) uguale a 100. Dunque le due medie sono diverse, poiché 104 ≠ 100? Troppo semplice!!! Le medie devono essere significativamente, ossia statisticamente, DIVERSE, cioè la loro differenza deve risultare anomala.
Media anomala e probabilità Media “anomala”: ha una bassa probabilità di risultare; pertanto se risulta si assume che il campione appartiene ad una popolazione differente. La soglia in psicologia è fissata con α = 0.05, ossia si considerano “anomali” i punteggi che hanno una probabilità di verificarsi inferiore al 5%.
Probabilità e distribuzione normale Dove dovrà cadere la media del nostro campione per essere considerata anomala?
Probabilità e distribuzione normale β = 1 - α α = 1 - β
Errori di I e II tipo I risultati dei test inferenziali potrebbero non essere corretti rispetto alla realtà, a causa di caratteristiche specifiche del campione (ad esempio tutti i soggetti presentano alto QI o basso QI, o più in generale il campione non è rappresentativo). Inoltre, la verifica delle ipotesi utilizza la probabilità: è dunque possibile commettere degli errori. In particolare si possono commettere 2 errori: α o errore di I tipo: quando si rifiuta H0, mentre nella realtà è vera. β o errore di II tipo: quando si accetta H0, mentre nella realtà è falsa.
Esiti dei test inferenziali Situazione della realtà Risultati di una ricerca H0 è vera H0 è falsa Accetto H0 Decisione corretta Errore di II Tipo: β Rifiuto H0 Errore I Tipo: α
Esempio: Testare che i soggetti con disturbo ossessivo compulsivo presentano una media diversa rispetto alla popolazione di adulti. H0: Soggetti con disturbo ossessivo e popolazione di adulti hanno la stessa media. H1: Soggetti con disturbo ossessivo e popolazione di adulti hanno una media diversa. Qual è l’errore peggiore?
Qual è l’errore peggiore? È peggio commettere un errore α poiché non si possono apportare modifiche a teorie o modelli esistenti, se non si è QUASI certi. Dunque, è necessario minimizzare la probabilità di errore α. Come si può ridurre α? Aumentando β: Poiché α + β = 1, α = 1 – β La scienza dunque utilizza un’ottica conservativa.
Esercizio e obiettivo Un campione di soggetti (N=49) con disturbo ossessivo compulsivo ha ottenuto una media nel test sul Q.I. pari a 104; la popolazione di adulti presenta una media uguale a 100 e una deviazione standard uguale a 16. Si ipotizza che la media del campione è diversa dalla media della popolazione, con α=0,05. L’obiettivo quindi è quello di confrontare la media di un campione con la media della popolazione
Test di ipotesi Per testare le ipotesi è necessario trovare il punto z calcolato (associato al campione) e confrontarlo con il punto z critico. È sufficiente conoscere: La media della popolazione (µ) La deviazione standard della media ( ) La media del campione ( ) La numerosità del campione (N) α (dipende dalle ipotesi)
1 La media della popolazione La media della popolazione o distribuzione campionaria della media (µ), equivale alla forma della distribuzione della popolazione. Essa è una distribuzione teorica, derivante dalla media delle medie di tutti campioni (con N uguale) estratti casualmente, un numero infinito di volte, dalla popolazione stessa.
Esempio Se si vuole calcolare la distribuzione campionaria della media relativa al Q. I. degli adulti la procedura è: Estrarre infiniti campioni, con N uguale Calcolare la media per ciascun campione Rappresentare graficamente le medie dei campioni (come fossero punteggi) su un poligono di frequenza. La media, calcolata su tutte le medie, equivale alla media della popolazione: µ
Esempio pratico: calcolo µ Immaginiamo di aver somministrato il test del Q. I. su 70 campioni, aventi le seguenti medie: Medie (Ẍ) F F c 52 1 68 4 5 84 10 15 100 40 55 116 65 132 69 148 70 Ẍ (F) 52 272 840 4000 1160 528 148 Σ=7000 /70= 100
Poligono di frequenza semplice
Teorema del limite centrale All’aumentare dell’ampiezza dei campioni, la distribuzione campionaria della media si avvicinerà sempre più a una D.N., indipendentemente dalla forma distributiva delle misure individuali nella popolazione originaria. Affinché una distribuzione campionaria assomigli ad un D.N., N (di ciascun campione) deve essere > 30 unità: più N è grande più il campione sarà rappresentativo della popolazione.
2 Deviazione standard della media La Deviazione standard della media indica la variazione delle medie dei campioni dalla media della popolazione. È chiamata anche Errore standard della media poiché indica quanto le medie dei campioni si discostano dalla media della popolazione. Se risulta piccola, indica che le medie dei campioni sono vicine tra loro e quindi la misura è accurata (ossia l’errore è piccolo). Per calcolare la Deviazione standard della media, si calcola prima la deviazione standard della popolazione e poi si divide per la radice di N.
Esempio pratico: calcolo σ della popolazione Medie (Ẍ) F 52 1 68 4 84 10 100 40 116 132 148 Ẍ-µ (Ẍ-µ)2 F(Ẍ-µ)2 -48 2304 -32 1024 4096 -16 256 2560 16 32 48 ∑=17920 /70=256 √=16
2 Calcolo della D. S. delle medie Dove σ è la D. S. nota della popolazione (e non del campione). N è la numerosità del campione. NB: è molto raro poter calcolare σ noto della popolazione poiché risulta molto difficile poter estrarre un gran numero di campioni con N grande ed uguale.
3 Media del campione, 4) N e 5) alpha 3) La media del campione è la media aritmetica calcolata sul campione oggetto di studio. Nell’esempio del Q.I. Ẍ = 104. 4) Numerosità del campione indica il numero di casi appartenenti al campione. Ad esempio N = 49. 5) α è il livello di significatività (o probabilità di errore) fissato a 0,05.
Esercizio Un campione di soggetti (N=49) con disturbo ossessivo compulsivo ha ottenuto una media nel test sul Q.I. pari a 104; la popolazione di adulti presenta una media uguale a 100 e una deviazione standard uguale a 16. Si ipotizza che la media del campione è diversa dalla media della popolazione, con α=0,05.
Svolgimento esercizio Copio i dati della traccia Stabilisco le ipotesi H0 e H1 Disegno il grafico con le relative ipotesi Trovo il valore Zcri Trovo il valore Zcal Confronto il valore Zcal con il valore Zcri . Prendo una decisione Commento il risultato
a) Copio i dati della traccia Ẍ=104 N=49 µ=100 σ=16 α=.05
b) Stabilisco le ipotesi H0 e H1 H0: Soggetti con disturbo ossessivo e popolazione di adulti hanno la stessa media: che equivale a H1: Soggetti con disturbo ossessivo e popolazione di adulti hanno una media diversa:
c) Disegno il grafico Rifiuto H0 Accetto H0 Rifiuto H0
d) Calcolo dello z critico Le ipotesi che un ricercatore può condurre possono essere di due tipi: Bidirezionali: se ipotizza una diversità, senza direzionalità Monodirezionali: se ipotizza la direzione della differenza oppure
d) Tipi di ipotesi e code Nel caso di ipotesi bidirezionale, il valore di α è relativo ad entrambe le code della distribuzione. Per ogni coda, dunque, sarà fissato il valore di α/2. Se α=0,05, il valore soglia fissato ad ogni coda è relativo a 0,025, cioè il 2,5%. Nel caso di ipotesi monodirezionale, invece, il valore soglia di α è relativo soltanto ad una delle due code. Se α=0,05 bisogna cercare sulle tavole il valore che si lascia a destra (>) o a sinistra (<) il 5%.
d) Calcolo dello z critico Qual è il punto Zcri associato ad una ipotesi bidirezionale? Con α=0,05 e ipotesi bidirezionale il punto Z critico è quello associato alla percentuale ricavata da 50-(α/2), ossia 50-2,5 = 47,5. Zcri = ± 1,96; siccome è bidirezionale devo considerarlo sia col segno positivo, sia col segno negativo. Riportare sempre il valore critico sul grafico!
d) Calcolo dello z critico Qual è il punto Zcri associato ad una ipotesi monodirezionale? Con α=0,05 e ipotesi monodirezionale il punto Z critico è quello associato alla percentuale ricavata da 50-(α), ossia 50-5 = 45. Zcri = +1,645 oppure -1,645. Con ipotesi monodirezionale si deve considerare soltanto a sinistra (se in H1 si ipotizza che ) oppure a destra (se in H1 si ipotizza che ) Riportare sempre il valore critico sul grafico!
d) Zcri e grafico -1,96 +1,96 Rifiuto H0 Accetto H0 Rifiuto H0
e) Calcolo di Zcal A parità di differenza delle medie e della deviazione standard nota della popolazione, Zcal dipende da N. In particolare all’aumentare di N (se gli altri valori sono costanti) aumenta il valore di Zcal. Dunque al crescere di N aumentano le probabilità di rifiutare H0.
e) Zcri, Zcal e ipotesi esplicite Riscrivendo le ipotesi esplicitamente: Accetto H0 se –Zcri < Zcalc < Zcri, ossia se: Rifiuto H0 |Zcal|>|Zcri| ossia se: Sul grafico riportare zona di accettazione e di rifiuto di H0! oppure
e) Calcolo di Zcal Decisione: riporto Zcal sul grafico e vedo se cade nella regione di accettazione o di rifiuto di H0. Siccome -1,96 < 1,75 <1,96 accetto H0. Commento: non c’è differenza significativa tra il campione e la popolazione, ovvero i soggetti con disturbo ossessivo compulsivo non presentano una media diversa dalla popolazione rispetto al Q.I.
Condizioni di applicabilità del test z Il test z può essere utilizzato solo se sono presenti entrambe le seguenti condizioni: Deviazione standard della popolazione è nota Popolazione normale oppure N > 30