La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

RELAZIONI TRA 2 FENOMENI QUANTITATIVI

Presentazioni simili


Presentazione sul tema: "RELAZIONI TRA 2 FENOMENI QUANTITATIVI"— Transcript della presentazione:

1 RELAZIONI TRA 2 FENOMENI QUANTITATIVI

2 Es: 6 famiglie, ammontare della spesa annua (in euro) per l’acquisto di due generi di largo consumo: latte fresco e biscotti. Famiglia Spesa annua per l’acquisto di latte fresco (€) Spesa annua per l’acquisto di biscotti (€) A 105 65 B 190 130 C 80 160 D 120 90 E 240 220 F 60 50 M(x)= 132.5 M(y)=119.2 (i) rxy? (ii) commento (iii) diagramma di dispersione (iv) concordanza tra rxy e diagramma di dispersione (v) Perché rxy invece della retta di regressione?

3 Soluzione 16187.5 23787.5 20520.8 Tot. Famiglia (xi – Mx) (yi – My)
( ) ( ) ( )2 ( )2 B ( ) ( ) ( ) ( ) ( )2 ( )2 C D E F Tot.

4 Diagramma di dispersione

5 Diagramma di dispersione in termini di scostamenti dalla media

6 Analisi del diagramma di dispersione
Il punto C è un valore anomalo bivariato Se cancelliamo il punto C ci attendiamo che il valore di rxy aumenti rxy senza il punto C è uguale a 0.963

7 CORRELAZIONE FRA DUE S.S.
Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount Calcolare e commentare rXY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile Anni X Y 1993 72.644 600 1994 85.993 1.300 1995 96.287 1.930 1996 2.328 1997 2.523

8 CORRELAZIONE FRA DUE S.S.
Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount Calcolare e rXY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile Anni X Y 1993 72.644 600 1994 85.993 1.300 1995 96.287 1.930 1996 2.328 1997 2.523 Correlazione spuria  relazione tra i livelli

9 Esempio di correlazione spuria
Numero di discount (Y) Numero di extracomunitari iscritti al collocamento (X)

10 Esempio di correlazione spuria
Numero di discount (Y) Numero di extracomunitari iscritti al collocamento (X) Correlazione tra le variazioni annue?

11 Esempio di correlazione spuria
Numero di extracomunitari iscritti al collocamento (X) Numero di discount (Y) Correlazione tra le variazioni annue?

12 NI base mobile X (numero di extracomunitari) e Y (numero di discount
Anni n. i. base mobile Var % X Var % Y Scost media X Scost media Y 1993 - 1994 118,38 216,67 18,38 116,67 -0,34 68,14 1995 111,97 148,46 11,97 48,46 -6,75 -0,07 1996 142,22 120,62 42,22 20,62 23,50 -27,91 1997 102,31 108,38 2,31 8,38 -16,41 -40,16 Media 118,72 148,53 18,72 48,53 0,00 Var 0,0217 0,1758 Cov(Nix,NIy)=-0,000496 rxy(tra n. i. a base mobile) =-0,000496/(0,0217*0,1758)½ = -0,008

13 Scatter sugli scostamenti NI base mobile o var. percentuali
II I III IV

14 Osservazioni finali Non esiste relazione lineare tra le variazioni annue di X e Y Si ottiene rxy = -0,008 anche effettuando il calcolo sulle variazioni % rispetto all’anno precedente (proprietà di invarianza per trasformazioni lineari crescenti)

15 Cenni alle analisi multivariate
p fenomeni quantitativi Possiamo calcolare il coefficiente di correlazione lineare e/o la covarianza per ogni coppia di fenomeni

16 MATRICE DI COVARIANZA (p.169)
p variabili: X1, X2, X3,…, Xs, …, Xp

17 MATRICE DI CORRELAZIONE

18 ESEMPIO MATRICE DI COVARIANZA
X = età Y = anzianità di servizio Z = stipendio mensile (in euro)

19 MATRICE DI CORRELAZIONE

20 La diapositiva che segue contiene un esercizio da risolvere

21 Es. X= tasso di indebitamento delle famiglie, in percentuale, (X) e del fabbisogno di energia elettrica, in migliaia di megawatt, (Y) in Italia nel periodo 1998– 2002 anni X Y 1998 27,8 279 1999 31,1 286 2000 32,6 299 2001 305 2002 35,1 311

22 LA REGRESSIONE LINEARE

23 LA REGRESSIONE LINEARE
Esiste una relazione (lineare) tra X e Y? In caso affermativo: Come varia una variabile (dipendente) in funzione dell’altra (esplicativa)? Per convenzione: Y = variabile dipendente X = variabile esplicativa

24 Esempi Relazione tra comportamenti di acquisto e caratteristiche dei consumatori Relazione tra numero di esami sostenuti nei primi due anni di corso e voto alla maturità Relazione tra prezzo di vendita e quantità venduta di un bene

25 Motivi che spingono ad adottare modelli di regressione lineare
Semplicità  facilità di interpretazione dei parametri yi = a + bxi + ei i = 1, …, n dove: a + bxi rappresenta una retta: a = ordinata all’origine  intercetta b = coeff. angolare  coeff. di regressione ei è un termine di errore (accidentale)

26 Motivi che spingono ad adottare modelli di regressione lineare
Effettiva linearità  molte relazioni sono molto vicine alla linearità Trasformazioni  la relazione è lineare dopo aver trasformato opportunamente la dipendente e/o l’esplicativa Es. y = a bx log y = log a + (log b) x y’ = a’ + b’ x

27 Motivi che spingono ad adottare modelli di regressione lineare
Limitatezza dell’intervallo

28 Motivi che spingono ad adottare modelli di regressione lineare
Ragioni di teoria statistica: lo studio delle funzioni lineari nei parametri ha una trattazione più agevole

29 Diagramma di dispersione
Come variano le vendite in funzione del numero di dipendenti?

30 MODELLO DI REGRESSIONE
yi = a + bxi + ei i = 1, …, n dove: a + bxi rappresenta una retta: a = ordinata all’origine  intercetta b = coeff. angolare  coeff. di regressione ei è un termine di errore (accidentale)

31 = valore teorico (valore stimato) di yi  funzione lineare di
RETTA DI REGRESSIONE i = 1, …, n = valore teorico (valore stimato) di yi  funzione lineare di i = 1, …, n Residui

32 Come si calcolano i parametri a e b?

33 Come si calcolano i parametri a e b?
METODO DEI MINIMI QUADRATI Le incognite sono i parametri della retta

34 Visualizzazione grafica dei residui (ei)

35 Come si calcolano i parametri a e b?
METODO DEI MINIMI QUADRATI

36 Come si calcolano i parametri a e b?
METODO DEI MINIMI QUADRATI

37 Come si calcolano i parametri a e b?
METODO DEI MINIMI QUADRATI

38 Sistema di equazioni normali
2 equazioni e 2 incognite (a e b)

39 Dalla prima equazione

40 Sostituendo il valore trovato di a nella seconda equazione

41 Espressioni alternative per a e b

42 ESEMPIO (7 supermercati) rxy=0,96
N. dipendenti (X) Fatturato in milioni di € (Y) A 10 1,9 B 18 3,1 C 20 3,2 D 8 1,5 E 30 6,2 F 12 2,8 G 14 2,3 Medie 16 3

43 Calcolo di a e b xi yi xi2 yi2 xiyi A 10 1,9 100 3,61 19 B 18 3,1 324
9,61 55,8 C 20 3,2 400 10,24 64 D 8 1,5 E 30 6,2 F 12 2,8 G 14 2,3 Tot. 112 21 2128 77,28 402,6

44 Calcolo di a e b xi yi xi2 yi2 xiyi A 10 1,9 100 3,61 19 B 18 3,1 324
9,61 55,8 C 20 3,2 400 10,24 64 D 8 1,5 E 30 6,2 F 12 2,8 G 14 2,3 Tot. 112 21 2128 77,28 402,6

45 Scatter con retta di regressione

46 Interpretazione dei parametri ESEMPIO (7 supermercati)
a = –0,17  fatturato teorico quando N. di dipendenti = 0 b = 0,198  incremento medio nel fatturato quando il numero di dipendenti aumenta di 1 unità

47 Interpretazione di b b= indica l’entità della variazione teorica della variabile dipendente in corrispondenza di un incremento unitario della variabile esplicativa

48 Interpretazione di b a+bx a+b(x+1)
Qual è la differenza tra i due precedenti valori teorici(prima e dopo l’incremento unitario)? a+b(x+1)-(a+bx)=b

49 Sistema di equazioni normali
Analizziamo le implicazioni dei due precedenti vincoli

50 Proprietà delle stime dei minimi quadrati
La retta di regressione passa sempre per il punto di coordinate

51 Proprietà delle stime dei minimi quadrati

52 Calcolo dei valori teorici e dei residui
yi=-0,17+0,198xi xi yi Valori teorici Residui xi ×residuoi A 10 1,9 -0,17+0,198*10=1,81 0,09 0,89 B 18 3,1 -0,17+0,198*18=3,40 -0,30 -5,34 C 20 3,2 -0,17+0,198*20= 3,79 -0,59 -11,86 D 8 1,5 1,41 0,69 E 30 6,2 5,78 0,43 12,75 F 12 2,8 2,21 0,59 7,11 G 14 2,3 2,60 -4,25 Tot. 112 21

53 Regressione in termini di scostamenti
Dato che la sommatoria degli scostamenti dalla media è zero Si ottiene che a=0

54 Modi alternativi di esprimere b
Dato che Si ricava

55 ESEMPIO (7 supermercati):

56 Es. n. 5. 7 famiglie Spesa per manifestazioni culturali (Z) A 200 1,9
Costruire il diagramma di dispersione Calcolare e commentare rYZ Sulla base dei risultati ottenuti si dica se è ragionevole adattare una retta di regressione; in questo caso quale sarebbe la dipendente e quale sarebbe l’esplicativa? Spesa per manifestazioni culturali (Z) Reddito mensile del capofamiglia (x 1000 Euro) (Y) A 200 1,9 B 420 4,0 C 250 2,5 D 70 1,6 E 180 2,2 F 300 2,8 G 100 1,5

57 Diagramma di dispersione
rxy=0,97; il grafico mostra la forte relazione lineare diretta tra le 2 variabili. Il reddito mensile è utile per prevedere la spesa per manifestazioni culturali

58 Diagramma di dispersione con retta di regressione

59 Scomposizione di yi

60 BONTA’ DI ADATTAMENTO Occorre analizzare i residui DEVIANZA RESIDUA
L’adattamento è buono quando DEV(E) è “piccola” Problemi: DEV(E) cresce all’aumentare del numero di osservazioni (n) DEV(E) dipende dall’unità di misura e dall’ordine di grandezza di Y

61 In qualsiasi modello di regressione con o senza intercetta è valida la relazione che segue
Questa relazione sfrutta la terza proprietà delle stime dei minimi quadrati (vincolo della derivata parziale rispetto a b posta uguale a 0)

62 Dimostrazione L’ultimo termine è zero dato che

63 Esempio supermercati (continua)
yi=-0,17+0,198xi xi yi Valori teorici Residui Xi ×residuoi yi2 (Valori teorici)2 residui2 A 10 1,9 1,81 0,09 0,89 3.61 3.279 0.008 B 18 3,1 3,40 -0,30 -5,34 9.61 11.536 0.088 C 20 3,2 3,79 -0,59 -11,86 10.24 14.386 0.351 D 8 1,5 1,41 0,69 2.25 2.000 0.007 E 30 6,2 5,78 0,43 12,75 38.44 33.351 0.181 F 12 2,8 2,21 0,59 7,11 7.84 4.871 G 14 2,3 2,60 -4,25 5.29 6.779 0.092 Tot. 112 21 77.28 76.201 1.079 77.28=

64 Varia nell’intervallo [0 1]
Indice di bontà di adattamento nei modelli di regressione senza intercetta Varia nell’intervallo [0 1]

65 BONTA’ DI ADATTAMENTO Retta di regressione: DEVIANZA TOTALE
DEVIANZA DI REGRESSIONE DEVIANZA RESIDUA

66 Scomposizione della devianza di Y (modelli di regressione con intercetta)
Questa relazione sfrutta le Proprietà 1 e 3 delle stime dei minimi quadrati Proprietà 1 Proprietà 3

67 Dimostrazione

68 Indice di determinazione lineare (R2)
 =1 se  =0 se

69 Esempio 7 supermercati (continua)
Calcolo di R2 (δ) xi yi A 10 1,9 1,81 0.008 1,416 B 18 3,1 3,394 0.088 0,155 C 20 3,2 3,79 0.351 0,624 D 8 1,5 1,414 0.007 E 30 6,2 5,77 0.181 F 12 2,8 2,206 G 14 2,3 2,602 0.092 Tot. 112 21 1,079 13,201 DEV(Y) = 7(1,428)2 =14,28 My = 3 DevTOT=DevREGR+DevRES 14,28 = 13, ,079

70 Nell’esempio precedente
Relazione tra indice di determinazione δ e coefficiente di correlazione lineare rxy δ = rxy2 Nell’esempio precedente  = (0,9615)2 = 0,924

71 Relazione tra δ e rxy

72 Esempio 7 supermercati (continua). Diagnostiche sui residui
xi Residui A 10 0,09 B 18 -0,30 C 20 -0,59 D 8 E 30 0,43 F 12 0,59 G 14 Tot. 112 Modello soddisfacente: distribuzione casuale dei residui → componente erratica

73 ESTRAPOLAZIONE Si tenta di valutare in maniera attendibile il valore che assumerà la variabile dipendente in corrispondenza di un valore noto della variabile esplicativa. CONDIZIONI Validità della retta di regressione ( prossimo ad 1) valore noto della variabile esplicativa non lontano dai valori utilizzati nel calcolo della retta

74 ESEMPIO (Es. 4.14 Eserciziario)
Y = contenuto nell’aria di un inquinante (microgrammi per m3) X = numero di imprese manifatturiere con più di 20 addetti Città Y X A 13 91 B 12 453 C 17 254 D 56 412 E 29 334 F 35 428 G 49 341 H 27 125 Retta di regressione di Y in funzione di X Bontà di adattamento Diagramma di dispersione

75 Dalle formule (o calcolatrice o Excel)
b = 0,0474 Interpretazione oppure Adattamento scadente

76 Scatter (x,y) con retta di regressione

77 Punti segnati in attacco
Esercizio: giocatori titolari d’una squadra di pallavolo: la seguente tabella riporta il numero di punti segnati in attacco ed il numero di punti segnati a muro in una partita. Giocatore Punti segnati in attacco Punti segnati a muro A 14 4 B 10 3 C 1 D 15 E 18 2 F 9 5 Calcolare rxy e commentarlo Diagramma di dispersione. Si confrontino le informazioni traibili dal diagr. di dispersione con il valore prima calcolato di rxy. C’è accordo tra le due analisi? A quale causa possono essere imputate le differenze riscontrate?

78 L’INTERPOLAZIONE DI UNA SERIE STORICA

79 % di persone il cui pasto principale è il pranzo
ESEMPIO Anni t % di persone il cui pasto principale è il pranzo 1993 1 69,3 1994 2 69,4 1995 3 66,9 1996 4 65,6 1997 5 64,1 1998 6 63,3 1999 7 61,6 2000 8 59,2

80 Esempio: Percentuale di persone il cui pasto principale è il pranzo
Obiettivo: stima del trend con una funzione (retta)

81 Regressione in cui: Variabile dipendente: fenomeno di cui si stima il trend (Y) Variabile esplicativa: tempo  successione convenzionale: t = 1; t = 2; … t = T Tempi Valori di Y 1 y1 t yt T yT

82 Funzione interpolante lineare:
Stima parametri: metodo dei minimi quadrati Interpretazione parametri

83 Stima parametri: metodo dei minimi quadrati

84 Stima parametri: metodo dei minimi quadrati

85 Interpretazione parametri
a = valore teorico del fenomeno per t=0 (tempo precedente al primo considerato)  l’intercetta ha sempre un significato operativo b = variazione teorica media da un tempo al successivo

86 % di persone il cui pasto principale è il pranzo
ESEMPIO Anni t % di persone il cui pasto principale è il pranzo 1993 1 69,3 1994 2 69,4 1995 3 66,9 1996 4 65,6 1997 5 64,1 1998 6 63,3 1999 7 61,6 2000 8 59,2 a = 71,46 b = –1,45 Funzione interpolante: Interpretazione

87 Bontà di adattamento: Previsione di valori futuri
Esempio: % stimata di persone il cui pasto principale è il pranzo nel 2001 (t=9):

88 Condizioni per la validità della proiezione
 elevato Mantenimento nel futuro delle condizioni che hanno determinato l’andamento passato  funz. interpolante lineare: variazioni di ammontare costante b

89 Significato della proiezione
I valori futuri stimati per estrapolazione dovranno essere correttamente intesi come valutazioni non di ciò che accadrà, ma di ciò che dovrebbe accadere, qualora si manifestassero anche in futuro le condizioni che hanno determinato la precedente evoluzione del fenomeno.

90 Esempio (Es. 4.24 eserciziario)
Y = concentrazione di anidride carbonica nell'aria, in parti per milione, al Polo Sud dal 1981 al 1995: anni Y 1981 325 1983 327 1985 329 1987 332 1989 335 1991 338 1993 340 1995 343 Grafico della serie storica. Calcolo dei parametri della funzione interpolante lineare Bontà di adattamento Valore previsto della concentrazione di anidride carbonica nel 2005

91 Grafico della serie storica.

92 Scelta della scala anni Y 1981 325 1983 327 1985 329 1987 332 1989 335
biennale annuale Y 1981 1 325 1983 2 3 327 1985 5 329 1987 4 7 332 1989 9 335 1991 6 11 338 1993 13 340 1995 8 15 343

93 Calcolo dei parametri della funzione interpolante lineare
Scala dei tempi biennale  t = 1, 2, 3, 4, 5, 6, 7, 8 Scala dei tempi annuale  t = 1, 3, 5, 7, 9, 11, 13, 15 Interpretazione

94 Relazione tra le due intercette
Scala biennale  321,786 = valore teorico al 1979 anni 1981 1983 1985 1987 1989 1991 1993 1995 Scala annuale  323,101 = valore teorico al tempo t = 1980

95 Relazione tra le due intercette
321,786= valore teorico1979= valore teorico1980- variazione teorica da un anno al successivo variazione teorica da un anno al successivo = coeff. angolare della regressione su scala annuale 321,786=323,101-1,3155

96 Bontà di adattamento In entrambi i casi: = 0,996
 Adattamento quasi perfetto

97 Previsione al 2005 Scala biennale (t = 13) Scala annuale (t = 25)
anni biennale annuale 1981 1 1983 2 3 1985 5 1987 4 7 1989 9 1991 6 11 1993 13 1995 8 15 2005 25 Scala biennale (t = 13) Scala annuale (t = 25) Significato e limiti della previsione

98 Esercizio: idrocarburi estratti (in milioni di tonnellate)
n. 13 (integrativi)

99 Serie storica delle quantità estratte di idrocarburi dal 1986 al 1998
Anno Idrocarburi estratti 1986 15,4 1988 18,3 1990 1992 18,6 1994 19,8 1996 19,7 1998 19,1 Adottando un’opportuna scala dei tempi si calcolino i parametri della funzione interpolante lineare della quantità di idrocarburi in funzione del tempo Significato e bontà di adattamento Si stimino gli idrocarburi estratti nel 2004 e si dica se tale stima può ritenersi attendibile


Scaricare ppt "RELAZIONI TRA 2 FENOMENI QUANTITATIVI"

Presentazioni simili


Annunci Google