La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE

Presentazioni simili


Presentazione sul tema: "STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE"— Transcript della presentazione:

1 STATISTICA a.a. 2002-2003 METODO DEI MINIMI QUADRATI REGRESSIONE
CORRELAZIONE

2 RELAZIONE FRA VARIABILI
Spesso si vuole trovare la relazione che lega due o più variabili (es. la pressione di un gas dipende da temperatura e volume) Vogliamo esprimere questa relazione in forma matematica

3 INTERPOLAZIONE Dobbiamo raccogliere dati che mostrino valori corrispondenti delle variabili Riportiamo i punti (Xi,Yi) delle due variabili su un sistema di coordinate Vogliamo individuare una curva (relazione non lineare) o una retta interpolante

4 INTERPOLAZIONE Il tipo più semplice è la retta Y = a0 + a1 X
Dati due punti qualsiasi (X1 Y1) e (X2 Y2) , vogliamo determinare a0 e a1 .

5 INTERPOLAZIONE

6 INTERPOLAZIONE coefficiente angolare
e’ Y per X=0 (ordinata all’origine).

7 METODO DEI MINIMI QUADRATI

8 METODO DEI MINIMI QUADRATI
Chiamiamo Dn la deviazione (o errore) fra il valore Yn e il corrispondente valore della curva (positiva o negativa) Una misura della “bontà dell’interpolazione” è la somma D12 + D22 …..+ Dn2

9 METODO DEI MINIMI QUADRATI
La curva avente la proprietà che D12 + D22 …..+ Dn2 è minima è detta migliore interpolante o retta/curva dei minimi quadrati.

10 METODO DEI MINIMI QUADRATI
La retta dei minimi quadrati può essere espressa nella forma Y = a0 + a1 X dove a0 e a1 si trovano risolvendo il sistema SY = a0 N+ a1 SX SXY = a0 S X+ a1 SX2 equazioni normali della retta dei minimi quadrati.

11 METODO DEI MINIMI QUADRATI
Si ottiene

12 METODO DEI MINIMI QUADRATI
La prima delle due equazioni si ottiene dalla sommatoria di entrambi i membri di Y = a0 + a1 X , la seconda moltiplicando i membri per X e poi facendo la sommatoria. Per derivare le equazioni si minimizzano le derivate della retta

13 METODO DEI MINIMI QUADRATI
Y1 = a0 + a1 X1 Y2= a0 + a1 X2 …. S=(a0 + a1 X2 -Y1)2 +(a0 + a1 X2 – Y2)2 +…. + (a0 + a1 Xn - Yn)2

14 LA REGRESSIONE Vogliamo stimare il valore di una variabile Y corrispondente a un dato valore di una variabile X. Si può ottenere questo stimando il valore di Y per mezzo di una curva dei minimi quadrati che interpoli i dati campionari. Questa è detta CURVA DI REGRESSIONE di X su Y. Se X è il tempo (variabile indipendente) i dati indicano i valori di Y in diversi tempi e vengono detti SERIE TEMPORALE. La retta/curva di regressione è detta retta/curva del trend e viene usata per scopi di previsione.

15 CORRELAZIONE E REGRESSIONE
La correlazione indica il grado di relazione fra le variabili. Cercheremo di determinare quanto bene un’equazione spiega tale relazione Se tutti i valori delle variabili soddisfano esattamente un’equazione diciamo che le variabili sono perfettamente correlate (esempio: raggio e circonferenza; altezza e peso saranno in parte correlate).

16 CORRELAZIONE E REGRESSIONE
Date due variabili X e Y costruiamo un diagramma di dispersione con i loro valori. Se tutti i punti giacciono più o meno su una retta, la correlazione è detta lineare e la relazione fra le variabili sarà retta da un’equazione lineare.

17 CORRELAZIONE E REGRESSIONE
Se Y cresce al crescere di X la correlazione è positiva o diretta:

18 CORRELAZIONE E REGRESSIONE
Se Y decresce al crescere di X, la correlazione è detta negativa o inversa: Se i punti stanno su una curva, la correlazione è non lineare.

19 CORRELAZIONE E REGRESSIONE
Se non c’è relazione fra le variabili diciamo che sono incorrelate:

20 CORRELAZIONE E REGRESSIONE
(1) Y = a0 + a1 X Può essere riscritta come dove

21 CORRELAZIONE E REGRESSIONE
Chiamiamo Ystim i valori di Y per dati valori di X secondo una stima compiuta per mezzo della (1). Una misura della dispersione intorno alla retta di regressione di Y su X è oppure errore standard della stima

22 CORRELAZIONE E REGRESSIONE
Il denominatore può anche essere posto a N-2 . L’errore standard della stima ha proprietà analoghe a quelle dello scarto quadratico medio.

23 COEFFICIENTE DI CORRELAZIONE
Chiamiamo devianza totale di Y la somma dei quadrati degli scarti dei valori di Y dalla media Y¯. Si può anche scrivere devianza totale devianza residua devianza spiegata

24 COEFFICIENTE DI DETERMINAZIONE
Se la devianza spiegata è zero (ossia la devianza totale equivale alla residua), r2=0 Se la devianza residua è uguale a zero, cioè devianza totale = devianza spiegata , r2=1 Dunque r2 è sempre positiva e varia fra 0 e 1.

25 COEFFICIENTE DI CORRELAZIONE
Allora definiamo r coefficiente di correlazione

26 COEFFICIENTE DI CORRELAZIONE
r varia fra +1 e –1 (+ o – a seconda di correlazione positiva o negativa). Poiché allora

27 COEFFICIENTE DI CORRELAZIONE
Si dimostra che dove

28 COEFFICIENTE DI CORRELAZIONE
che dà automaticamente il segno di r. Si può riscriverla come


Scaricare ppt "STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE"

Presentazioni simili


Annunci Google