La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

COVARIANZA e CORRELAZIONE. REGRESSIONE LINEARE Consideriamo due variabili casuali X e Y e supponiamo di avere fatto una regressione lineare con il metodo.

Presentazioni simili


Presentazione sul tema: "COVARIANZA e CORRELAZIONE. REGRESSIONE LINEARE Consideriamo due variabili casuali X e Y e supponiamo di avere fatto una regressione lineare con il metodo."— Transcript della presentazione:

1 COVARIANZA e CORRELAZIONE

2 REGRESSIONE LINEARE Consideriamo due variabili casuali X e Y e supponiamo di avere fatto una regressione lineare con il metodo dei minimi quadrati.

3 REGRESSIONE LINEARE

4 Primo metodo:

5 REGRESSIONE LINEARE Se la dipendenza fra le due variabili non è lineare (ad esempio quadratica, esponenziale, logaritmica, etc.), il grafico dei residui rispetto ai valori predetti enfatizzerà questa dipendenza non lineare. Vediamo questo fatto con un esempio.

6 REGRESSIONE LINEARE

7

8

9 In statistica la covarianza è un indice che misura la "contemporaneità" della variazione (in termini lineari) di due variabili casuali. Essa può assumere sia valori positivi che negativi. Nel caso di valori positivi indica che al crescere di una variabile statisticamente cresce anche l'altra, nel caso di valori negativi accade il contrario. Quando due variabili sono tra di loro indipendenti, allora la loro covarianza è nulla (l'inverso non è necessariamente verificato). Si utilizza spesso la notazione: cov(x,y) = xy, dove essendo x e y rispettivamente la media aritmetica di x e y. Secondo metodo: Covarianza

10 È un operatore simmetrico, cioè A volte la covarianza viene citata mnemonicamente come la media del prodotto degli scarti dalla media. La covarianza può essere scomposta in due termini, diventando: ovvero la media dei prodotti meno il prodotto delle medie. Dividendo la covarianza per il prodotto delle deviazioni standard delle due variabili, si ottiene lindice di correlazione di Bravais-Pearson, di utilizzo più comune per misurare la dipendenza lineare tra due variabili: Covarianza

11 Il coefficiente di correlazione lineare o coefficiente di correlazione tra due variabili aleatorie o due variabili statistiche X e Y è definito come la loro covarianza divisa per il prodotto delle deviazioni standard delle due variabili: dove xy, è la covarianza tra X e Y x, y sono le due deviazioni standard. Il coefficiente di correlazione è un indice di quanto bene i punti (x i, y i ) si adattano ad una retta. Coefficiente di correlazione lineare

12 Il coefficiente assume valori compresi tra -1 e +1. Se è vicino a 1, allora i punti giacciono vicino a qualche linea retta (se è vicino a +1 si parla di correlazione positiva, se è vicino a -1 si parla di correlazione negativa); se è vicino a 0, allora i punti non sono correlati (linearmente), con poca o nessuna tendenza a giacere su una linea retta. Nel caso di indipendenza il coefficiente assume valore zero, mentre non vale la conclusione opposta, ovvero dal coefficiente nullo non si può desumere l'indipendenza, cioè la condizione è necessaria, ma non sufficiente per l'indipendenza delle due variabili. Coefficiente di correlazione lineare

13 Come possiamo decidere oggettivamente se il coefficiente di correlazione ricavato è ragionevolmente vicino a 1 ? Possiamo rispondere a questa domanda con il seguente ragionamento. Supponiamo che due variabili x ed y siano in realtà non correlate; al limite per un numero di misure tendente allinfinito il coefficiente di correlazione dovrebbe essere 0. Dopo un numero finito di misure, è molto improbabile che sia esattamente 0. Si può calcolare la probabilità che sia più grande di un qualche valore specifico. Il calcolo di questa probabilità è piuttosto complesso, ma i risultati per alcuni valori rappresentativi dei parametri sono riportati nella tabella seguente. Coefficiente di correlazione lineare

14 Una misura più quantitativa delladattamento si può trovare usando la tabella sottostante, che riporta, in funzione di N e o, la probabilità percentuale che N misure di due variabili non correlate diano un coefficiente di correlazione con valore assoluto > o (gli spazi bianchi indicano probabilità minori dello 0.05%). o N

15 Più piccola è la probabilità che ricaviamo dalla tabella mostrata in precedenza, migliore è levidenza che le due variabili x ed y sono realmente correlate. Se la probabilità è minore del 5% diciamo che la correlazione è significativa; se è minore dell1% che la correlazione è altamente significativa. Coefficiente di correlazione lineare


Scaricare ppt "COVARIANZA e CORRELAZIONE. REGRESSIONE LINEARE Consideriamo due variabili casuali X e Y e supponiamo di avere fatto una regressione lineare con il metodo."

Presentazioni simili


Annunci Google