Introduzione alla Regressione Lineare e alla Correlazione
esempio 1 Supponiamo di avere misurato la statura di 10 bambini di età compresa tra 6 e 12 anni e di riportare i dati su una tabella:
diagrammi di dispersione un diagramma di dispersione è una rappresentazione grafica in cui si rappresentano i valori di due variabili i valori della variabile indipen-dente (X) vengono rappresentati sull’asse orizzontale (asse delle ascisse) i valori della variabile dipendente (Y) vengono rappresentati sull’asse verticale (asse delle ordinate) ciascuna coppia di valori (X,Y) viene rappresentata sul grafico con un punto
esempio 1(2) Riportando i valori su un diagramma di dispersione otterremo il seguente grafico:
esempio 1(3) Si evidenzia una netta tendenza, tale per cui al crescere dell’età, si registra un aumento dell’altezza:
esempio 2 Fonte: www.venganza.org
tipi di relazioni
coefficiente di correlazione il coefficiente di correlazione (li-neare) misura l’intensità della rela-zione (lineare) tra due variabili X e Y; i valori che esso assume sono compresi tra –1 e +1; quando vale +1 significa perfetta correlazione positiva: i valori della Y si dispongono esattamente su una retta con pendenza positiva; quando vale –1 significa perfetta correlazione negativa: i valori della Y si dispongono esattamente su una retta con pendenza negativa
coefficiente di correlazione da un punto di vista matematico, il coefficiente di correlazione (Bravais-Pearson) è definito come in cui: è la covarianza tra X e Y; è la deviazione standard di X è la deviazione standard di Y
covarianza la covarianza esprime l’intensità con cui due variabili “variano insieme” matematicamente si esprime con in cui: è la media di X; è la media di Y; è la numerosità del campione
covarianza la covarianza si può calcolare più comodamente con la formula semplificata: in cui: è la somma dei prodotti XY; è la somma dei valori di X; è la somma dei valori di Y
esempio 1(3) Dalla tabella dell’esempio 1 ricaviamo i seguenti valori: Con questi possiamo calcolare la covarianza:
esempio 1(4) Ora calcoliamo le deviazioni standard:
esempio 1(5) A questo punto possiamo calcolare il coefficiente di correlazione: abbiamo ottenuto un’alta correlazione positiva.
esempio 2 10 soggetti di età superiore ai 60 anni sono stati sottoposti ad un test di abilità motorie con i seguenti risultati:
Si calcoli la correlazione tra età e punteggio di abilità motorie. esempio 2 Si calcoli la correlazione tra età e punteggio di abilità motorie.
esempio 2 prima calcoliamo le somme: poi, da questi valori possiamo ricavare le deviazioni standard e la covarianza: infine otteniamo la correlazione:
esempio 2 Riportando i valori su un diagramma di dispersione otteniamo:
esercizio Si calcoli il coefficiente di correlazione tra le due variabili riportate in tabella.
esercizio prima calcoliamo le somme: poi, le deviazioni standard e la covarianza: infine otteniamo la correlazione:
ATTENZIONE Il coefficiente r misura l’intensità della relazione lineare; se r è basso (vicino a zero) vuol dire che non c’è relazione lineare ma potrebbe esserci una relazione di altro genere.
esempio 3 In questo caso, anche se r = -0,2, risulta evidente che esista una relazione tra le due variabili.