Associazione tra variabili qualitative È possibile verificare l’associazione anche tra variabili qualitative (nominali o ordinali) attraverso un apposito test. Esempio: Verificare l’associazione tra genere e scelta della facoltà universitaria. Ossia ci si sta chiedendo: la scelta della facoltà universitaria dipende dal genere o è indipendente al genere? Dunque bisogna verificare la dipendenza tra le due variabili.
Costruire la tabella di frequenza doppia Soggetti Genere Facoltà 1 Maschio Psicologia 2 Femmina 3 4 5 Ingegneria 6 7 8 9 10
Tabella di frequenza doppia Psicologia Ingegneria Totale riga Maschi 1 3 4 Femmine 5 6 Tot colonna 10 Informazioni della Tabella di frequenza doppia: Esprime la relazione tra le modalità (o livelli) di 2 variabili qualitative. I numeri all’interno di ciascuna cella indicano le frequenze osservate (fo) sul campione, ossia derivanti dalla rilevazione.
Frequenze attese Per verificare l’eventuale dipendenza è necessario calcolare la frequenza attesa (fe; expected frequencies) per ciascuna cella (frequenza osservata). Ossia in questo caso: sapendo che i maschi sono 4 e che gli iscritti a psicologia sono 6, quanti maschi “mi aspetto” che si iscrivano a psicologia?
Tabella doppia con fo ed fe Psicologia Ingegneria Totale riga Maschi 1 (fe=2,4) 3 (fe=1,6) 4 Femmine 5 (fe=3,6) 6 Tot colonna 10 La somma delle frequenze attese per riga deve al totale di riga. La somma delle frequenze attese per colonna deve al totale di colonna. La somma di tutte le frequenze attese deve essere uguale a N.
Indice di dipendenza χ2 Dopo aver calcolato le fe si calcola il χ2: Se tutte le fo e le fe sono uguali il valore del χ2 sarà uguale a 0, dunque le due variabili non sono dipendenti. Di conseguenza, maggiore è la differenza tra fo ed fe, maggiore sarà il valore del χ2.
Calcolo del χ2 Psicologia Ingegneria Totale riga Maschi 1 fe=2,4 3 Femmine 5 fe=3,6 6 Tot colonna 10
Indipendenza tra le variabili Dipendenza tra le variabili Caratteristiche del χ2 L’indice χ2 è sempre positivo Può assumere valori che variano tra 0 (massima indipendenza) ed N (massima dipendenza) Il χ2 risulta dunque difficilmente interpretabile e pertanto è necessario calcolare il χ2 relativo (φ) ossia χ2/N φ varia tra 0 ed 1 e si interpreta come segue: 0 e 0,5 0,5 e 1 Indipendenza tra le variabili Dipendenza tra le variabili
Calcolo del χ2 relativo: interpretazione φ= 3,41/10=0,34 Interpretazione Le due variabili non risultano associate, ossia genere e scelta della facoltà universitaria sono indipendenti (o più precisamente, la scelta universitaria non dipende dal genere).
Esercizio 1 Verificare l’associazione tre le variabili “genere” ed “esito dell’esame di psicometria”. Soggetti Genere Esito 1 Maschio Bocciato 2 3 Promosso 4 Femmina 5 6 7 8 9 10 11 12
Tabella di massima indipendenza Promozione Bocciatura Totale riga Maschi 1 fe=1 2 fe=2 3 Femmine fe=3 6 fe=6 9 Tot colonna 4 8 12
Esercizio 2 Verificare l’associazione tre le variabili “genere” e “professione”. Soggetti Genere Professione 1 Maschio Meccanico 2 3 4 5 6 7 Estetista 8 Femmina 9 10 11 12
Tabella di frequenza doppia Estetista Meccanico Totale riga Maschi 1 fe=3,5 6 7 Femmine 5 fe=2,5 Tot colonna 12 φ=0,72 quindi? Le due variabili sono dipendenti: in particolare i maschi scelgono di fare il meccanico, mentre le femmine di fare l’estetista.
Esercizio 3 Verificare l’efficacia della psicoterapia rispetto a tre diversi disturbi. Soggetti Disturbo Esito dopo 2 mesi 1 Depressione Migliorato 2 Ansia 3 Bipolare Stabile 4 5 6 Peggiorato 7 8 9 10
Risultati χ2=9,11; φ=0,91; c’è dipendenza tra le variabili. Peggiorato Stabile Migliorato Totale riga Ansia fe=0,6 fe=0,9 3 fe=1,5 Bipolare 2 1 Depressione fe=0,8 fe=1,2 fe=2 4 Tot colonna 5 10 χ2=9,11; φ=0,91; c’è dipendenza tra le variabili. In particolare: le persone con disturbo di ansia hanno avuto un miglioramento; le persone con disturbo bipolare hanno avuto un peggioramento; le persone con disturbo di depressione sono rimaste stabili.