Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
1
RELAZIONI TRA 2 FENOMENI QUANTITATIVI
2
Es: 6 famiglie, ammontare della spesa annua (in euro) per l’acquisto di due generi di largo consumo: latte fresco e biscotti. Famiglia Spesa annua per l’acquisto di latte fresco (€) Spesa annua per l’acquisto di biscotti (€) A 105 65 B 190 130 C 80 160 D 120 90 E 240 220 F 60 50 M(x)= 132.5 M(y)=119.2 (i) rxy? (ii) commento (iii) diagramma di dispersione (iv) concordanza tra rxy e diagramma di dispersione (v) Perché rxy invece della retta di regressione?
3
Soluzione 16187.5 23787.5 20520.8 Tot. Famiglia (xi – Mx) (yi – My)
( ) ( ) ( )2 ( )2 B ( ) ( ) ( ) ( ) ( )2 ( )2 C D E F Tot.
4
Diagramma di dispersione
5
Diagramma di dispersione in termini di scostamenti dalla media
6
Analisi del diagramma di dispersione
Il punto C è un valore anomalo bivariato Se cancelliamo il punto C ci attendiamo che il valore di rxy aumenti rxy senza il punto C è uguale a 0.963
7
CORRELAZIONE FRA DUE S.S.
Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount Calcolare e commentare rXY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile Anni X Y 1993 72.644 600 1994 85.993 1.300 1995 96.287 1.930 1996 2.328 1997 2.523
8
CORRELAZIONE FRA DUE S.S.
Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount Calcolare e rXY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile Anni X Y 1993 72.644 600 1994 85.993 1.300 1995 96.287 1.930 1996 2.328 1997 2.523 Correlazione spuria relazione tra i livelli
9
Esempio di correlazione spuria
Numero di discount (Y) Numero di extracomunitari iscritti al collocamento (X)
10
Esempio di correlazione spuria
Numero di discount (Y) Numero di extracomunitari iscritti al collocamento (X) Correlazione tra le variazioni annue?
11
Esempio di correlazione spuria
Numero di extracomunitari iscritti al collocamento (X) Numero di discount (Y) Correlazione tra le variazioni annue?
12
NI base mobile X (numero di extracomunitari) e Y (numero di discount
Anni n. i. base mobile Var % X Var % Y Scost media X Scost media Y 1993 - 1994 118,38 216,67 18,38 116,67 -0,34 68,14 1995 111,97 148,46 11,97 48,46 -6,75 -0,07 1996 142,22 120,62 42,22 20,62 23,50 -27,91 1997 102,31 108,38 2,31 8,38 -16,41 -40,16 Media 118,72 148,53 18,72 48,53 0,00 Var 0,0217 0,1758 Cov(Nix,NIy)=-0,000496 rxy(tra n. i. a base mobile) =-0,000496/(0,0217*0,1758)½ = -0,008
13
Scatter sugli scostamenti NI base mobile o var. percentuali
II I III IV
14
Osservazioni finali Non esiste relazione lineare tra le variazioni annue di X e Y Si ottiene rxy = -0,008 anche effettuando il calcolo sulle variazioni % rispetto all’anno precedente (proprietà di invarianza per trasformazioni lineari crescenti)
15
Cenni alle analisi multivariate
p fenomeni quantitativi Possiamo calcolare il coefficiente di correlazione lineare e/o la covarianza per ogni coppia di fenomeni
16
MATRICE DI COVARIANZA (p.169)
p variabili: X1, X2, X3,…, Xs, …, Xp
17
MATRICE DI CORRELAZIONE
18
ESEMPIO MATRICE DI COVARIANZA
X = età Y = anzianità di servizio Z = stipendio mensile (in euro)
19
MATRICE DI CORRELAZIONE
20
La diapositiva che segue contiene un esercizio da risolvere
21
Es. X= tasso di indebitamento delle famiglie, in percentuale, (X) e del fabbisogno di energia elettrica, in migliaia di megawatt, (Y) in Italia nel periodo 1998– 2002 anni X Y 1998 27,8 279 1999 31,1 286 2000 32,6 299 2001 305 2002 35,1 311
22
LA REGRESSIONE LINEARE
23
LA REGRESSIONE LINEARE
Esiste una relazione (lineare) tra X e Y? In caso affermativo: Come varia una variabile (dipendente) in funzione dell’altra (esplicativa)? Per convenzione: Y = variabile dipendente X = variabile esplicativa
24
Esempi Relazione tra comportamenti di acquisto e caratteristiche dei consumatori Relazione tra numero di esami sostenuti nei primi due anni di corso e voto alla maturità Relazione tra prezzo di vendita e quantità venduta di un bene
25
Motivi che spingono ad adottare modelli di regressione lineare
Semplicità facilità di interpretazione dei parametri yi = a + bxi + ei i = 1, …, n dove: a + bxi rappresenta una retta: a = ordinata all’origine intercetta b = coeff. angolare coeff. di regressione ei è un termine di errore (accidentale)
26
Motivi che spingono ad adottare modelli di regressione lineare
Effettiva linearità molte relazioni sono molto vicine alla linearità Trasformazioni la relazione è lineare dopo aver trasformato opportunamente la dipendente e/o l’esplicativa Es. y = a bx log y = log a + (log b) x y’ = a’ + b’ x
27
Motivi che spingono ad adottare modelli di regressione lineare
Limitatezza dell’intervallo
28
Motivi che spingono ad adottare modelli di regressione lineare
Ragioni di teoria statistica: lo studio delle funzioni lineari nei parametri ha una trattazione più agevole
29
Diagramma di dispersione
Come variano le vendite in funzione del numero di dipendenti?
30
MODELLO DI REGRESSIONE
yi = a + bxi + ei i = 1, …, n dove: a + bxi rappresenta una retta: a = ordinata all’origine intercetta b = coeff. angolare coeff. di regressione ei è un termine di errore (accidentale)
31
= valore teorico (valore stimato) di yi funzione lineare di
RETTA DI REGRESSIONE i = 1, …, n = valore teorico (valore stimato) di yi funzione lineare di i = 1, …, n Residui
32
Come si calcolano i parametri a e b?
33
Come si calcolano i parametri a e b?
METODO DEI MINIMI QUADRATI Le incognite sono i parametri della retta
34
Visualizzazione grafica dei residui (ei)
35
Come si calcolano i parametri a e b?
METODO DEI MINIMI QUADRATI
36
Come si calcolano i parametri a e b?
METODO DEI MINIMI QUADRATI
37
Come si calcolano i parametri a e b?
METODO DEI MINIMI QUADRATI
38
Sistema di equazioni normali
2 equazioni e 2 incognite (a e b)
39
Dalla prima equazione
40
Sostituendo il valore trovato di a nella seconda equazione
41
Espressioni alternative per a e b
42
ESEMPIO (7 supermercati) rxy=0,96
N. dipendenti (X) Fatturato in milioni di € (Y) A 10 1,9 B 18 3,1 C 20 3,2 D 8 1,5 E 30 6,2 F 12 2,8 G 14 2,3 Medie 16 3
43
Calcolo di a e b xi yi xi2 yi2 xiyi A 10 1,9 100 3,61 19 B 18 3,1 324
9,61 55,8 C 20 3,2 400 10,24 64 D 8 1,5 E 30 6,2 F 12 2,8 G 14 2,3 Tot. 112 21 2128 77,28 402,6
44
Calcolo di a e b xi yi xi2 yi2 xiyi A 10 1,9 100 3,61 19 B 18 3,1 324
9,61 55,8 C 20 3,2 400 10,24 64 D 8 1,5 E 30 6,2 F 12 2,8 G 14 2,3 Tot. 112 21 2128 77,28 402,6
45
Scatter con retta di regressione
46
Interpretazione dei parametri ESEMPIO (7 supermercati)
a = –0,17 fatturato teorico quando N. di dipendenti = 0 b = 0,198 incremento medio nel fatturato quando il numero di dipendenti aumenta di 1 unità
47
Interpretazione di b b= indica l’entità della variazione teorica della variabile dipendente in corrispondenza di un incremento unitario della variabile esplicativa
48
Interpretazione di b a+bx a+b(x+1)
Qual è la differenza tra i due precedenti valori teorici(prima e dopo l’incremento unitario)? a+b(x+1)-(a+bx)=b
49
Sistema di equazioni normali
Analizziamo le implicazioni dei due precedenti vincoli
50
Proprietà delle stime dei minimi quadrati
La retta di regressione passa sempre per il punto di coordinate
51
Proprietà delle stime dei minimi quadrati
52
Calcolo dei valori teorici e dei residui
yi=-0,17+0,198xi xi yi Valori teorici Residui xi ×residuoi A 10 1,9 -0,17+0,198*10=1,81 0,09 0,89 B 18 3,1 -0,17+0,198*18=3,40 -0,30 -5,34 C 20 3,2 -0,17+0,198*20= 3,79 -0,59 -11,86 D 8 1,5 1,41 0,69 E 30 6,2 5,78 0,43 12,75 F 12 2,8 2,21 0,59 7,11 G 14 2,3 2,60 -4,25 Tot. 112 21
53
Regressione in termini di scostamenti
Dato che la sommatoria degli scostamenti dalla media è zero Si ottiene che a=0
54
Modi alternativi di esprimere b
Dato che Si ricava
55
ESEMPIO (7 supermercati):
56
Es. n. 5. 7 famiglie Spesa per manifestazioni culturali (Z) A 200 1,9
Costruire il diagramma di dispersione Calcolare e commentare rYZ Sulla base dei risultati ottenuti si dica se è ragionevole adattare una retta di regressione; in questo caso quale sarebbe la dipendente e quale sarebbe l’esplicativa? Spesa per manifestazioni culturali (Z) Reddito mensile del capofamiglia (x 1000 Euro) (Y) A 200 1,9 B 420 4,0 C 250 2,5 D 70 1,6 E 180 2,2 F 300 2,8 G 100 1,5
57
Diagramma di dispersione
rxy=0,97; il grafico mostra la forte relazione lineare diretta tra le 2 variabili. Il reddito mensile è utile per prevedere la spesa per manifestazioni culturali
58
Diagramma di dispersione con retta di regressione
59
Scomposizione di yi
60
BONTA’ DI ADATTAMENTO Occorre analizzare i residui DEVIANZA RESIDUA
L’adattamento è buono quando DEV(E) è “piccola” Problemi: DEV(E) cresce all’aumentare del numero di osservazioni (n) DEV(E) dipende dall’unità di misura e dall’ordine di grandezza di Y
61
In qualsiasi modello di regressione con o senza intercetta è valida la relazione che segue
Questa relazione sfrutta la terza proprietà delle stime dei minimi quadrati (vincolo della derivata parziale rispetto a b posta uguale a 0)
62
Dimostrazione L’ultimo termine è zero dato che
63
Esempio supermercati (continua)
yi=-0,17+0,198xi xi yi Valori teorici Residui Xi ×residuoi yi2 (Valori teorici)2 residui2 A 10 1,9 1,81 0,09 0,89 3.61 3.279 0.008 B 18 3,1 3,40 -0,30 -5,34 9.61 11.536 0.088 C 20 3,2 3,79 -0,59 -11,86 10.24 14.386 0.351 D 8 1,5 1,41 0,69 2.25 2.000 0.007 E 30 6,2 5,78 0,43 12,75 38.44 33.351 0.181 F 12 2,8 2,21 0,59 7,11 7.84 4.871 G 14 2,3 2,60 -4,25 5.29 6.779 0.092 Tot. 112 21 77.28 76.201 1.079 77.28=
64
Varia nell’intervallo [0 1]
Indice di bontà di adattamento nei modelli di regressione senza intercetta Varia nell’intervallo [0 1]
65
BONTA’ DI ADATTAMENTO Retta di regressione: DEVIANZA TOTALE
DEVIANZA DI REGRESSIONE DEVIANZA RESIDUA
66
Scomposizione della devianza di Y (modelli di regressione con intercetta)
Questa relazione sfrutta le Proprietà 1 e 3 delle stime dei minimi quadrati Proprietà 1 Proprietà 3
67
Dimostrazione
68
Indice di determinazione lineare (R2)
=1 se =0 se
69
Esempio 7 supermercati (continua)
Calcolo di R2 (δ) xi yi A 10 1,9 1,81 0.008 1,416 B 18 3,1 3,394 0.088 0,155 C 20 3,2 3,79 0.351 0,624 D 8 1,5 1,414 0.007 E 30 6,2 5,77 0.181 F 12 2,8 2,206 G 14 2,3 2,602 0.092 Tot. 112 21 1,079 13,201 DEV(Y) = 7(1,428)2 =14,28 My = 3 DevTOT=DevREGR+DevRES 14,28 = 13, ,079
70
Nell’esempio precedente
Relazione tra indice di determinazione δ e coefficiente di correlazione lineare rxy δ = rxy2 Nell’esempio precedente = (0,9615)2 = 0,924
71
Relazione tra δ e rxy
72
Esempio 7 supermercati (continua). Diagnostiche sui residui
xi Residui A 10 0,09 B 18 -0,30 C 20 -0,59 D 8 E 30 0,43 F 12 0,59 G 14 Tot. 112 Modello soddisfacente: distribuzione casuale dei residui → componente erratica
73
ESTRAPOLAZIONE Si tenta di valutare in maniera attendibile il valore che assumerà la variabile dipendente in corrispondenza di un valore noto della variabile esplicativa. CONDIZIONI Validità della retta di regressione ( prossimo ad 1) valore noto della variabile esplicativa non lontano dai valori utilizzati nel calcolo della retta
74
ESEMPIO (Es. 4.14 Eserciziario)
Y = contenuto nell’aria di un inquinante (microgrammi per m3) X = numero di imprese manifatturiere con più di 20 addetti Città Y X A 13 91 B 12 453 C 17 254 D 56 412 E 29 334 F 35 428 G 49 341 H 27 125 Retta di regressione di Y in funzione di X Bontà di adattamento Diagramma di dispersione
75
Dalle formule (o calcolatrice o Excel)
b = 0,0474 Interpretazione oppure Adattamento scadente
76
Scatter (x,y) con retta di regressione
77
Punti segnati in attacco
Esercizio: giocatori titolari d’una squadra di pallavolo: la seguente tabella riporta il numero di punti segnati in attacco ed il numero di punti segnati a muro in una partita. Giocatore Punti segnati in attacco Punti segnati a muro A 14 4 B 10 3 C 1 D 15 E 18 2 F 9 5 Calcolare rxy e commentarlo Diagramma di dispersione. Si confrontino le informazioni traibili dal diagr. di dispersione con il valore prima calcolato di rxy. C’è accordo tra le due analisi? A quale causa possono essere imputate le differenze riscontrate?
78
L’INTERPOLAZIONE DI UNA SERIE STORICA
79
% di persone il cui pasto principale è il pranzo
ESEMPIO Anni t % di persone il cui pasto principale è il pranzo 1993 1 69,3 1994 2 69,4 1995 3 66,9 1996 4 65,6 1997 5 64,1 1998 6 63,3 1999 7 61,6 2000 8 59,2
80
Esempio: Percentuale di persone il cui pasto principale è il pranzo
Obiettivo: stima del trend con una funzione (retta)
81
Regressione in cui: Variabile dipendente: fenomeno di cui si stima il trend (Y) Variabile esplicativa: tempo successione convenzionale: t = 1; t = 2; … t = T Tempi Valori di Y 1 y1 … t yt T yT
82
Funzione interpolante lineare:
Stima parametri: metodo dei minimi quadrati Interpretazione parametri
83
Stima parametri: metodo dei minimi quadrati
84
Stima parametri: metodo dei minimi quadrati
85
Interpretazione parametri
a = valore teorico del fenomeno per t=0 (tempo precedente al primo considerato) l’intercetta ha sempre un significato operativo b = variazione teorica media da un tempo al successivo
86
% di persone il cui pasto principale è il pranzo
ESEMPIO Anni t % di persone il cui pasto principale è il pranzo 1993 1 69,3 1994 2 69,4 1995 3 66,9 1996 4 65,6 1997 5 64,1 1998 6 63,3 1999 7 61,6 2000 8 59,2 a = 71,46 b = –1,45 Funzione interpolante: Interpretazione
87
Bontà di adattamento: Previsione di valori futuri
Esempio: % stimata di persone il cui pasto principale è il pranzo nel 2001 (t=9):
88
Condizioni per la validità della proiezione
elevato Mantenimento nel futuro delle condizioni che hanno determinato l’andamento passato funz. interpolante lineare: variazioni di ammontare costante b
89
Significato della proiezione
I valori futuri stimati per estrapolazione dovranno essere correttamente intesi come valutazioni non di ciò che accadrà, ma di ciò che dovrebbe accadere, qualora si manifestassero anche in futuro le condizioni che hanno determinato la precedente evoluzione del fenomeno.
90
Esempio (Es. 4.24 eserciziario)
Y = concentrazione di anidride carbonica nell'aria, in parti per milione, al Polo Sud dal 1981 al 1995: anni Y 1981 325 1983 327 1985 329 1987 332 1989 335 1991 338 1993 340 1995 343 Grafico della serie storica. Calcolo dei parametri della funzione interpolante lineare Bontà di adattamento Valore previsto della concentrazione di anidride carbonica nel 2005
91
Grafico della serie storica.
92
Scelta della scala anni Y 1981 325 1983 327 1985 329 1987 332 1989 335
biennale annuale Y 1981 1 325 1983 2 3 327 1985 5 329 1987 4 7 332 1989 9 335 1991 6 11 338 1993 13 340 1995 8 15 343
93
Calcolo dei parametri della funzione interpolante lineare
Scala dei tempi biennale t = 1, 2, 3, 4, 5, 6, 7, 8 Scala dei tempi annuale t = 1, 3, 5, 7, 9, 11, 13, 15 Interpretazione
94
Relazione tra le due intercette
Scala biennale 321,786 = valore teorico al 1979 anni 1981 1983 1985 1987 1989 1991 1993 1995 Scala annuale 323,101 = valore teorico al tempo t = 1980
95
Relazione tra le due intercette
321,786= valore teorico1979= valore teorico1980- variazione teorica da un anno al successivo variazione teorica da un anno al successivo = coeff. angolare della regressione su scala annuale 321,786=323,101-1,3155
96
Bontà di adattamento In entrambi i casi: = 0,996
Adattamento quasi perfetto
97
Previsione al 2005 Scala biennale (t = 13) Scala annuale (t = 25)
anni biennale annuale 1981 1 1983 2 3 1985 5 1987 4 7 1989 9 1991 6 11 1993 13 1995 8 15 … 2005 25 Scala biennale (t = 13) Scala annuale (t = 25) Significato e limiti della previsione
98
Esercizio: idrocarburi estratti (in milioni di tonnellate)
n. 13 (integrativi)
99
Serie storica delle quantità estratte di idrocarburi dal 1986 al 1998
Anno Idrocarburi estratti 1986 15,4 1988 18,3 1990 1992 18,6 1994 19,8 1996 19,7 1998 19,1 Adottando un’opportuna scala dei tempi si calcolino i parametri della funzione interpolante lineare della quantità di idrocarburi in funzione del tempo Significato e bontà di adattamento Si stimino gli idrocarburi estratti nel 2004 e si dica se tale stima può ritenersi attendibile
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.