La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

RELAZIONI TRA 2 FENOMENI QUANTITATIVI. Es: 6 famiglie, ammontare della spesa annua (in euro) per lacquisto di due generi di largo consumo: latte fresco.

Presentazioni simili


Presentazione sul tema: "RELAZIONI TRA 2 FENOMENI QUANTITATIVI. Es: 6 famiglie, ammontare della spesa annua (in euro) per lacquisto di due generi di largo consumo: latte fresco."— Transcript della presentazione:

1 RELAZIONI TRA 2 FENOMENI QUANTITATIVI

2 Es: 6 famiglie, ammontare della spesa annua (in euro) per lacquisto di due generi di largo consumo: latte fresco e biscotti. (i) r xy ? (ii) commento (iii) diagramma di dispersione (iv) concordanza tra r xy e diagramma di dispersione (v) Perché r xy invece della retta di regressione? Famiglia Spesa annua per lacquisto di latte fresco () Spesa annua per lacquisto di biscotti () A B C D E F M(x)= M(y)= 119.2

3 Soluzione Fami glia (x i – M x )(y i – M y )(x i -M x )× (y i -M y ) (x i -M x ) 2 (y i -M y ) 2 A ( )( )( ) ( ) ( ) 2 ( ) 2 B ( )( )( ) ( ) ( ) 2 ( ) 2 C D E F Tot

4 Diagramma di dispersione

5 Diagramma di dispersione in termini di scostamenti dalla media

6 Analisi del diagramma di dispersione Il punto C è un valore anomalo bivariato Se cancelliamo il punto C ci attendiamo che il valore di r xy aumenti r xy senza il punto C è uguale a 0.963

7 CORRELAZIONE FRA DUE S.S. Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount Calcolare e commentare r XY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile AnniXY

8 CORRELAZIONE FRA DUE S.S. Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount Calcolare e r XY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile AnniXY Correlazione spuria relazione tra i livelli

9 Esempio di correlazione spuria Numero di discount (Y) Numero di extracomunitari iscritti al collocamento (X)

10 Esempio di correlazione spuria Numero di discount (Y) Correlazione tra le variazioni annue? Numero di extracomunitari iscritti al collocamento (X)

11 Esempio di correlazione spuria Numero di extracomunitari iscritti al collocamento (X) Numero di discount (Y) Correlazione tra le variazioni annue?

12 NI base mobile X (numero di extracomunitari) e Y (numero di discount Annin. i. base mobile Var % X Var % YScost media X Scost media Y ,38216,6718,38116,67-0,3468, ,97148,4611,9748,46-6,75-0, ,22120,6242,2220,6223,50-27, ,31108,382,318,38-16,41-40,16 Media118,72148,5318,7248,530,00 Var0,02170,17580,02170,1758Cov(Nix,NIy)=- 0, r xy (tra n. i. a base mobile) =-0,000496/(0,0217*0,1758) ½ = -0,008

13 Scatter sugli scostamenti NI base mobile o var. percentuali III IIIIV

14 Osservazioni finali Non esiste relazione lineare tra le variazioni annue di X e Y Si ottiene r xy = -0,008 anche effettuando il calcolo sulle variazioni % rispetto allanno precedente (proprietà di invarianza per trasformazioni lineari crescenti)

15 Cenni alle analisi multivariate p fenomeni quantitativi Possiamo calcolare il coefficiente di correlazione lineare e/o la covarianza per ogni coppia di fenomeni

16 MATRICE DI COVARIANZA (p.169) p variabili: X 1, X 2, X 3,…, X s, …, X p

17 MATRICE DI CORRELAZIONE

18 ESEMPIO MATRICE DI COVARIANZA X = età Y = anzianità di servizio Z = stipendio mensile (in euro)

19 MATRICE DI CORRELAZIONE

20 La diapositiva che segue contiene un esercizio da risolvere

21 Es. X= Es. X= tasso di indebitamento delle famiglie, in percentuale, (X) e del fabbisogno di energia elettrica, in migliaia di megawatt, (Y) in Italia nel periodo 1998– 2002 anniXY , , , , ,1311

22 LA REGRESSIONE LINEARE

23 Esiste una relazione (lineare) tra X e Y? In caso affermativo: Come varia una variabile (dipendente) in funzione dellaltra (esplicativa)? Per convenzione: Y = variabile dipendente X = variabile esplicativa

24 Esempi Relazione tra comportamenti di acquisto e caratteristiche dei consumatori Relazione tra numero di esami sostenuti nei primi due anni di corso e voto alla maturità Relazione tra prezzo di vendita e quantità venduta di un bene

25 Motivi che spingono ad adottare modelli di regressione lineare Semplicità facilità di interpretazione dei parametri y i = a + bx i + e i i = 1, …, n dove: a + bx i rappresenta una retta: a = ordinata allorigine intercetta b = coeff. angolare coeff. di regressione e i è un termine di errore (accidentale)

26 Motivi che spingono ad adottare modelli di regressione lineare Effettiva linearità molte relazioni sono molto vicine alla linearità Trasformazioni la relazione è lineare dopo aver trasformato opportunamente la dipendente e/o lesplicativa Es. y = a b x log y = log a + (log b) x y = a + b x

27 Motivi che spingono ad adottare modelli di regressione lineare Limitatezza dellintervallo

28 Motivi che spingono ad adottare modelli di regressione lineare Ragioni di teoria statistica: lo studio delle funzioni lineari nei parametri ha una trattazione più agevole

29 Diagramma di dispersione Come variano le vendite in funzione del numero di dipendenti?

30 MODELLO DI REGRESSIONE y i = a + bx i + e i i = 1, …, n dove: a + bx i rappresenta una retta: a = ordinata allorigine intercetta b = coeff. angolare coeff. di regressione e i è un termine di errore (accidentale)

31 RETTA DI REGRESSIONE i = 1, …, n = valore teorico (valore stimato) di y i funzione lineare di i = 1, …, n Residui

32 Come si calcolano i parametri a e b?

33 METODO DEI MINIMI QUADRATI Le incognite sono i parametri della retta

34 Visualizzazione grafica dei residui ( e i )

35 Come si calcolano i parametri a e b? METODO DEI MINIMI QUADRATI

36 Come si calcolano i parametri a e b? METODO DEI MINIMI QUADRATI

37 Come si calcolano i parametri a e b? METODO DEI MINIMI QUADRATI

38 Sistema di equazioni normali 2 equazioni e 2 incognite ( a e b )

39 Dalla prima equazione

40 Sostituendo il valore trovato di a nella seconda equazione

41 Espressioni alternative per a e b

42 ESEMPIO (7 supermercati) r xy =0,96 N. dipendenti (X) Fatturato in milioni di (Y) A101,9 B183,1 C203,2 D81,5 E306,2 F122,8 G142,3 Me die 163

43 Calcolo di a e b xixi yiyi xi2xi2 yi2yi2 xiyixiyi A101,91003,6119 B183,13249,6155,8 C203,240010,2464 D81,5 E306,2 F122,8 G142,3 Tot ,28402,6

44 Calcolo di a e b xixi yiyi xi2xi2 yi2yi2 xiyixiyi A101,91003,6119 B183,13249,6155,8 C203,240010,2464 D81,5 E306,2 F122,8 G142,3 Tot ,28402,6

45 Scatter con retta di regressione

46 Interpretazione dei parametri ESEMPIO (7 supermercati) a = –0,17 fatturato teorico quando N. di dipendenti = 0 b = 0,198 incremento medio nel fatturato quando il numero di dipendenti aumenta di 1 unità

47 Interpretazione di b b= indica lentità della variazione teorica della variabile dipendente in corrispondenza di un incremento unitario della variabile esplicativa

48 Interpretazione di b a+bx a+b(x+1) Qual è la differenza tra i due precedenti valori teorici(prima e dopo lincremento unitario)? a+b(x+1)-(a+bx)=b

49 Sistema di equazioni normali Analizziamo le implicazioni dei due precedenti vincoli

50 Proprietà delle stime dei minimi quadrati Proprietà 1: Proprietà 2 La retta di regressione passa sempre per il punto di coordinate

51 Proprietà delle stime dei minimi quadrati Proprietà 3:

52 Calcolo dei valori teorici e dei residui xixi yiyi Valori teoriciResi dui x i ×residuo i A101,9-0,17+0,198*10=1,81 0,090,89 B183,1-0,17+0,198*18=3,40 -0,30-5,34 C203,2-0,17+0,198*20= 3,79 -0,59-11,86 D81,51,41 0,090,69 E306,25,78 0,4312,75 F122,82,21 0,597,11 G142,32,60 -0,30-4,25 To t y i =-0,17+0,198x i

53 Regressione in termini di scostamenti Dato che la sommatoria degli scostamenti dalla media è zero Si ottiene che a =0

54 Modi alternativi di esprimere b Dato che Si ricava

55 ESEMPIO (7 supermercati):

56 Es. n famiglie Spesa per manifestazio ni culturali (Z) Reddito mensile del capofamiglia (x 1000 Euro) (Y) A2001,9 B4204,0 C2502,5 D701,6 E1802,2 F3002,8 G1001,5 Costruire il diagramma di dispersione Calcolare e commentare r YZ Sulla base dei risultati ottenuti si dica se è ragionevole adattare una retta di regressione; in questo caso quale sarebbe la dipendente e quale sarebbe lesplicativa?

57 Diagramma di dispersione r xy =0,97; il grafico mostra la forte relazione lineare diretta tra le 2 variabili. Il reddito mensile è utile per prevedere la spesa per manifestazioni culturali

58 Diagramma di dispersione con retta di regressione

59 Scomposizione di y i

60 BONTA DI ADATTAMENTO Occorre analizzare i residui DEVIANZA RESIDUA Ladattamento è buono quando DEV(E) è piccola Problemi: DEV(E) cresce allaumentare del numero di osservazioni (n) DEV(E) dipende dallunità di misura e dallordine di grandezza di Y

61 In qualsiasi modello di regressione con o senza intercetta è valida la relazione che segue Questa relazione sfrutta la terza proprietà delle stime dei minimi quadrati (vincolo della derivata parziale rispetto a b posta uguale a 0)

62 Dimostrazione Lultimo termine è zero dato che

63 Esempio supermercati (continua) xixi yiyi Valori teorici Resid ui X i ×residuo i yi2yi2 (Valori teorici) 2 residui 2 A101,91,81 0,090, B183,13,40 -0,30-5, C203,23,79 -0,59-11, D81,51,41 0,090, E306,25,78 0,4312, F122,82,21 0,597, G142,32,60 -0,30-4, Tot y i =-0,17+0,198x i 77.28=

64 Indice di bontà di adattamento nei modelli di regressione senza intercetta Varia nellintervallo [0 1]

65 BONTA DI ADATTAMENTO Retta di regressione: DEVIANZA TOTALE DEVIANZA DI REGRESSIONE DEVIANZA RESIDUA

66 Scomposizione della devianza di Y (modelli di regressione con intercetta) Proprietà 1 Questa relazione sfrutta le Proprietà 1 e 3 delle stime dei minimi quadrati Proprietà 3

67 Dimostrazione

68 Indice di determinazione lineare (R 2 ) =1 se =0 se

69 Calcolo di R 2 (δ) DEV(Y) = 7 (1,428) 2 =14,28 M y = 3 xixi yiyi A101,9 1, ,416 B183,1 3, ,155 C203,2 3, ,624 D81,5 1, E306,2 5, F122,8 2, G142,3 2, Tot ,07913,201 Dev TOT =Dev REGR +Dev RES 14,28 = 13, ,079 Esempio 7 supermercati (continua)

70 Relazione tra indice di determinazione δ e coefficiente di correlazione lineare r xy δ = r xy 2 Nellesempio precedente = (0,9615) 2 = 0,924

71 Relazione tra δ e r xy Relazione tra δ e r xy

72 xixi Residui A10 0,09 B18 -0,30 C20 -0,59 D8 0,09 E30 0,43 F12 0,59 G14 -0,30 Tot.1120 Esempio 7 supermercati (continua). Diagnostiche sui residui Modello soddisfacente: distribuzione casuale dei residui componente erratica

73 ESTRAPOLAZIONE Si tenta di valutare in maniera attendibile il valore che assumerà la variabile dipendente in corrispondenza di un valore noto della variabile esplicativa. CONDIZIONI – Validità della retta di regressione ( prossimo ad 1) – valore noto della variabile esplicativa non lontano dai valori utilizzati nel calcolo della retta

74 ESEMPIO (Es Eserciziario) Y = contenuto nellaria di un inquinante (microgrammi per m 3 ) X = numero di imprese manifatturiere con più di 20 addetti CittàYX A1391 B12453 C17254 D56412 E29334 F35428 G49341 H27125 Retta di regressione di Y in funzione di X Bontà di adattamento Diagramma di dispersione

75 Dalle formule (o calcolatrice o Excel) a = 15,31 b = 0,0474 Interpretazione oppure Adattamento scadente

76 Scatter (x,y) con retta di regressione

77 Esercizio: giocatori titolari duna squadra di pallavolo: la seguente tabella riporta il numero di punti segnati in attacco ed il numero di punti segnati a muro in una partita. GiocatorePunti segnati in attaccoPunti segnati a muro A144 B103 C41 D151 E182 F95 Calcolare r xy e commentarlo Diagramma di dispersione. Si confrontino le informazioni traibili dal diagr. di dispersione con il valore prima calcolato di r xy. Cè accordo tra le due analisi? A quale causa possono essere imputate le differenze riscontrate?

78 LINTERPOLAZIONE DI UNA SERIE STORICA

79 ESEMPIO Annit % di persone il cui pasto principale è il pranzo , , , , , , , ,2

80 Esempio: Percentuale di persone il cui pasto principale è il pranzo Obiettivo: stima del trend con una funzione (retta)

81 Regressione in cui: Variabile dipendente: fenomeno di cui si stima il trend (Y) Variabile esplicativa: tempo successione convenzionale: t = 1;t = 2; …t = T TempiValori di Y 1y1y1 …… tytyt …… TyTyT

82 Funzione interpolante lineare: Stima parametri: metodo dei minimi quadrati Interpretazione parametri

83 Stima parametri: metodo dei minimi quadrati

84

85 Interpretazione parametri a = valore teorico del fenomeno per t=0 (tempo precedente al primo considerato) lintercetta ha sempre un significato operativo b = variazione teorica media da un tempo al successivo

86 ESEMPIO a = 71,46b = –1,45 Funzione interpolante: Annit % di persone il cui pasto principale è il pranzo , , , , , , , ,2 Interpretazione

87 Bontà di adattamento: Previsione di valori futuri Esempio: % stimata di persone il cui pasto principale è il pranzo nel 2001 (t=9):

88 Condizioni per la validità della proiezione elevato Mantenimento nel futuro delle condizioni che hanno determinato landamento passato funz. interpolante lineare: variazioni di ammontare costante b

89 Significato della proiezione I valori futuri stimati per estrapolazione dovranno essere correttamente intesi come valutazioni non di ciò che accadrà, ma di ciò che dovrebbe accadere, qualora si manifestassero anche in futuro le condizioni che hanno determinato la precedente evoluzione del fenomeno.

90 Esempio (Es eserciziario) Y = concentrazione di anidride carbonica nell'aria, in parti per milione, al Polo Sud dal 1981 al 1995: anniY Grafico della serie storica. Calcolo dei parametri della funzione interpolante lineare Bontà di adattamento Valore previsto della concentrazione di anidride carbonica nel 2005

91 Grafico della serie storica.

92 Scelta della scala anni biennaleannuale Y

93 Calcolo dei parametri della funzione interpolante lineare Scala dei tempi annuale t = 1, 3, 5, 7, 9, 11, 13, 15 Interpretazione Scala dei tempi biennale t = 1, 2, 3, 4, 5, 6, 7, 8

94 Relazione tra le due intercette Scala annuale 323,101 = valore teorico al tempo t = 1980 Scala biennale 321,786 = valore teorico al 1979 anni

95 Relazione tra le due intercette 321,786= valore teorico 1979 = valore teorico variazione teorica da un anno al successivo variazione teorica da un anno al successivo = coeff. angolare della regressione su scala annuale 321,786=323,101-1,3155

96 Bontà di adattamento In entrambi i casi: = 0,996 Adattamento quasi perfetto

97 Previsione al 2005 Scala biennale (t = 13) Scala annuale (t = 25) Significato e limiti della previsione anni biennaleannuale ………

98 Esercizio: idrocarburi estratti (in milioni di tonnellate) n. 13 (integrativi)

99 Serie storica delle quantità estratte di idrocarburi dal 1986 al 1998 Adottando unopportuna scala dei tempi si calcolino i parametri della funzione interpolante lineare della quantità di idrocarburi in funzione del tempo Significato e bontà di adattamento Si stimino gli idrocarburi estratti nel 2004 e si dica se tale stima può ritenersi attendibile AnnoIdrocarburi estratti , , , , , , ,1


Scaricare ppt "RELAZIONI TRA 2 FENOMENI QUANTITATIVI. Es: 6 famiglie, ammontare della spesa annua (in euro) per lacquisto di due generi di largo consumo: latte fresco."

Presentazioni simili


Annunci Google