Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
1
STATISTICA PER LE DECISIONI DI MARKETING
Andrea Cerioli Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA Maggiore flessibilità per applicazioni aziendali (Capitoli 4 – 5 del libro) 1
2
Regressione con variabili esplicative qualitative (categoriali)
caratteristiche socio-demografiche dei consumatori (sesso, professione, …) tipologia e area geografica dei punti vendita categoria merceologica dei prodotti brand … in generale: gruppi diversi di osservazioni
3
Es.: consumo e reddito USA (miliardi di $): §4.1
Negli anni il modello sembra diverso: c’è una variabile importante esclusa dal modello
4
Aggiunta di una variabile dummy (variabile indicatrice con valori 0-1)
Il modello di regressione diventa multiplo: Consumo = f(Reddito, dummy)
5
Risultati del modello di regr. lineare multiplo
𝒚 =−𝟏𝟎.𝟏+𝟎.𝟗𝟔 𝑿 𝟏 −𝟓𝟓.𝟒𝟔 𝑿 𝟐 X1 = Reddito X2 = Dummy Interpretazione coefficienti?
6
𝒚 =−𝟏𝟎.𝟏+𝟎.𝟗𝟔 𝑿 𝟏 se X2 = 0 (pace) 𝒚 =−𝟏𝟎.𝟏−𝟓𝟓.𝟒𝟔+𝟎.𝟗𝟔 𝑿 𝟏
Ricordando la definizione di X2 (dummy): a parità di reddito (X1), la stima dell’ammontare dei consumi (y cappello) diminuisce di un ammontare pari a (miliardi di $) negli anni in cui dummy=1 (cioè passando da un periodo di pace a uno di guerra) 𝒚 =−𝟏𝟎.𝟏+𝟎.𝟗𝟔 𝑿 𝟏 se X2 = 0 (pace) 𝒚 =−𝟏𝟎.𝟏−𝟓𝟓.𝟒𝟔+𝟎.𝟗𝟔 𝑿 𝟏 =−𝟔𝟓.𝟓𝟔+𝟎.𝟗𝟔 𝑿 𝟏 se X2 = 1 (guerra)
7
L’adattamento migliora sensibilmente con la variabile dummy: v. p. 114
Rappresentazione grafica dell’effetto della variabile dummy (β2=-55.46): v. p. 113 Consumo Reddito L’adattamento migliora sensibilmente con la variabile dummy: v. p. 114
8
Esempio: destagionalizzazione di una serie storica
Generalizzazione al caso di variabili qualitative con più di due modalità Esempio: destagionalizzazione di una serie storica
9
Serie storica delle vendite di un bene (§4.2)
v. file: Esempio dati vendite stagionali
10
Modello: vendite stimate = f(trend + stagionalità + componente erratica)
In questo esempio è presente solo la serie storica Y: le uniche variabili esplicative sono definite in funzione del tempo (trend, stagionalità e eventualmente ciclo) Il modello può essere generalizzato includendo anche altre variabili esplicative (variabili esogene) se disponibili
11
Come possiamo rappresentare X?
La prima osservazione fa riferimento al primo trimestre (primavera); La seconda osservazione fa riferimento al secondo trimestre (estate); Ecc. Perché manca la dummy per l’inverno? formulazione alternativa (4 dummy; no intercetta): p. 117 La scelta della dummy da eliminare (o della formulazione del modello) non cambia l’adattamento né le previsioni
12
Stima dei parametri I coefficienti delle dummy stagionali rappresentano l’effetto della stagione considerata relativo alla stagione esclusa, a parità di trend Su tali stime si possono applicare tutte le procedure della regressione multipla (intervalli, test …): v. libro
13
Destagionalizzazione (p. 119-120)
La serie destagionalizzata non risente più delle ciclicità stagionali
14
Detrendizzazione (p. 119-120)
La serie detrendizzata non mostra più un andamento di lungo periodo (è stazionaria)
15
La serie detrendizzata e destagionalizzata non risente più né delle ciclicità stagionali né dell’andamento di lungo periodo: dovrebbe essere assimilabile alla componente erratica (in realtà ciò è vero solo in parte: perché?)
16
Esercitazioni con variabili dummy
Seminar sulla previsione delle vendite per il budgeting Previsione del consumo di gas (Esercizio 5.1, pp )
17
Var(i) = Var(yi) = 2 costante (omoschedasticità)
Eteroschedasticità Assunzione del modello: Var(i) = Var(yi) = 2 costante (omoschedasticità) In pratica, l’ipotesi è spesso violata tipicamente: Var(yi) varia in funzione del livello di una o più esplicative 17
18
Esempio: dati trade La variabilità della spesa aumenta con il numero di visite Implicazioni di marketing 18
19
Esempio: dati trade Anche la variabilità dei residui aumenta con il numero di visite 19
20
Trasformazioni di Y Trasformare Y può aiutare a rendere Var(yi) approx costante (cioè a eliminare l’eteroschedasticità) Trasformazioni più comuni: log(yi) se i E(yi) (yi)1/2 se yi è un conteggio Classe generale: Box-Cox (v. Zani-Cerioli, pp ) Le trasformazioni dei dati possono aiutare anche a rendere migliore l’approx della distribuzione di Y a una Normale rendere migliore l’approx di una funzione lineare
21
Esempio dati trade – log(Y)
La trasformazione logaritmica non sembra del tutto soddisfacente 21
22
Esempio dati trade – sqrt(Y)
22
23
Esempio dati trade – normalità Y
Sqrt(Y) log(Y): la trasformazione logaritmica può essere preferibile dal punto di vista dell’approx della distribuzione di Y con una Normale 23
24
Esempio dati trade – log(Y) – log(X)
Interpretazione coefficienti Analisi per esercizio 24
25
Autocorrelazione Assunzione del modello:
I disturbi i, e quindi le osservazioni yi, sono tra loro incorrelati (indipendenti) In pratica, l’ipotesi è spesso violata quando Y è una serie storica tipicamente il valore di Y al tempo t è influenzato dai valori di Y ai tempi precedenti: autocorrelazione (correlazione seriale) Dettagli: §4.4 25
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.