Come analizzare una tabella di contingenza quando il valore del chi quadrato è significativo Analisi dei residui con un esempio reale: Studenti universitari suddivisi per sesso e liceo di provenienza (sono state escluse le altre scuole superiori)
Scuola superiore di provenienza sesso Totale 1 maschio 2 femmina 1 liceo classico Freq 24 53 77 Freq attesa 32,4 44,6 Residuo -8,4 8,4 Residuo stand -1,5 1,3 2 liceo scientifico 135 137 272 114,5 157,5 20,5 -20,5 1,9 -1,6 3 liceo linguistico 3 33 36 15,1 20,9 -12,1 12,1 -3,1 2,7 162 223 385
Calcoli solo per la prima cella (il chi quadrato totale è significativo χ2 = 26,948 con 2 g.l.) Frequenza attesa= (77 x 162 ): 385 =32,4 Chi 2=
Da notare (1) la somma delle frequenze attese per riga è uguale al totale di riga (32,4 + 44,6 = 77) (2) la somma dei residui per riga e per colonna è pari a zero (3) L’ultimo residuo di ogni riga o di ogni colonna è uguale al negativo della somma dei precedenti (come per i gradi di libertà)
La somma dei quadrati delle discrepanze dà il chi quadrato, da esaminare in base al numero dei gradi di libertà ( in questo caso sono 2. Se il chi quadrato risulta significativo, si guarda il valore dei residui standardizzati, ottenuti in modo simile al chi quadrato
Residuo standardizzato: Il quadrato del residuo standardizzato è uguale al chi quadrato di ogni cella -1,54757 2= 2,18
Il residuo standardizzato può essere interpretato come un punto zeta: se superiore a |2| indica una discrepanza significativa dal modello di indipendenza, che (1) contribuisce a rendere significativo il chi quadrato totale (2) può essere interpretato come accumulo o rarefazione dei due caratteri congiunti (in questo caso sesso e tipo di scuola.
Conclusione per la tabella C’è una relazione fra genere e scuola di provenienza ( chi quadrato significativo) Dall’esame dei residui, si può concludere che ci sono molte più femmine che maschi che provengono dal liceo linguistico