Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili, ossia per capire il grado di associazione tra due variabili. Variabili quantitative: si parla di correlazione tra variabili e si utilizza il grafico di dispersione Variabili qualitative: si parla di dipendenza tra variabili e si usa la tabella di frequenza doppia
Variabili quantitative SOGGETTI ANSIA DEPRESSIONE 1 5 7 2 3 4 9 6 8 La relazione tra due variabili quantitative si rappresenta sul “grafico di dispersione”, utilizzando i punteggi di ciascun soggetto in X e in Y come coordinate. Per interpretare il grafico si usano le medie delle due variabili, che vanno a formare 4 quadranti.
Grafico crescente: ansia e depressione
Grafico decrescente: ansia e voto
Punteggi sparsi: ansia e intelligenza
Il grafico di dispersione Quando la nuvola di punti è inclinata verso l’alto, da sinistra a destra, vi è una relazione crescente : le variabili sono direttamente proporzionali. Quando la nuvola di punti è inclinata verso il basso, da sinistra a destra, vi è una relazione decrescente : le variabili sono inversamente proporzionali. Quando la nuvola di punti è sparsa, ossia vi sono dei punti in tutti i quadranti, vi è assenza di correlazione.
La correlazione La correlazione è un “valore” che esprime la relazione lineare tra due variabili quantitative, ossia indica se e quanto due variabili “variano” insieme. È necessario pertanto calcolare la “covarianza” e poi, per standardizzare, ossia dividere per il prodotto delle due deviazioni standard. Essendo un coefficiente standardizzato varia tra -1 e 1. -1<r<-0,5 -0,5<r<0,5 0,5<r<1 Correlazione alta e negativa Assenza di correlazione Correlazione alta e positiva
Calcolo della varianza La varianza indica quanto variano i punteggi di una variabile e consiste nel calcolare la somma degli scarti quadratici, diviso N Per calcolare la covarianza, invece, bisogna considerare due variabili contemporaneamente. Per calcolare la correlazione, la covarianza deve essere standardizzata per il prodotto delle due deviazioni standard.
Calcolo del coefficiente r rxy= Coefficiente di correlazione di Pearson Numeratore = covarianza (σ2XY) Denominatore = prodotto delle deviazioni standard
Calcolo del coefficiente r Sog X Y 1 5 7 2 3 4 9 6 8 (X-4) (Y-6) 1 -2 -1 -3 -4 3 2 (X-4) (Y-6) 1 2 12 9 4 (X-4)2 (Y-6)2 1 4 9 16 Σ28/6 Σ32/6 σ=√4,67 σ=√5,33 Σ29 Cov=29/6 Cov=4,83 Ẍ 4 Ȳ 6 σx 2,16 σy 2,31 σxσy 4,99
Coefficiente r rxy=0,97 Essendo r compreso tra 0,5 e 1, e come anticipato dal grafico la correlazione è alta e positiva.
Formule alternative: punti z (da non usare) Procedura: 1) Calcolare i punti z per X e Y; 2) Moltiplicare i punti z relativi allo stesso soggetto; 3) Sommare tutti i prodotti 4) Dividere per N
Calcolo del coefficiente r: Punti z Sog X Y 1 5 7 2 3 4 9 6 8 Zx Zy Zx Zy 0,46 0,43 0,2 -0,93 -0,43 0,4 -1,39 -1,73 2,4 -0,46 1,39 1,30 1,8 0,93 0,87 0,8 Σ5,8 Ẍ 4 Ȳ 6 σx 2,16 σy 2,31 σxσy 4,99
Formula alternativa “semplificata” (da non usare) Procedura: Moltiplicare ciascun punteggio di X per il relativo punteggio di Y Sommare tali prodotti Dividere per N Sottrarre per il prodotto delle medie di X e Y Dividere il numeratore per il prodotto delle DS
Calcolo del coefficiente r: f. sempl. X Y 1 5 7 2 3 4 9 6 8 X*Y 35 10 2 15 63 48 Σ173 Mx 4 My 6 MxMy 24 σx 2,16 σy 2,31 σxσy 4,99
Interpretazione di r Il coefficiente r di Pearson è sempre compreso tra -1 ed 1. In particolare: -1<r<-0,5 -0,5<r<0,5 0,5<r<1 Correlazione alta e negativa: grafico decrescente Assenza di correlazione: assenza di linearità Correlazione alta e positiva: grafico crescente
Esercitazione: Costruire il grafico di dispersione e calcolare la correlazione Soggetti Ansia Intelligenza 1 2 5 3 4
Grafico di dispersione Possiamo supporre che vi sia assenza di correlazione, poiché i punti sono sparsi
Calcolo del coefficiente r Sog X Y 1 2 5 3 4 (X-3) (Y-4) -1 1 -2 (X-3) (Y-4) -1 (X-3)2 (Y-4)2 1 4 Σ2/4 Σ6/4 σ=√0,5 σ=√1,5 Σ-1 Cov=-1/4 Cov=-0,25 Ẍ 3 Ȳ 4 σx 0,71 σy 1,22 σxσy 0,87 Assenza di correlazione