Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoElena Di giacomo Modificato 11 anni fa
1
MODELLO DI REGRESSIONE LINEARE MULTIPLA: USO DELLE VARIABILI DUMMY (parte 2)
In alcune circostanze è opportuno inserire, come variabili esplicative, delle variabili qualitative. Nella spiegazione del prezzo di un’automobile in funzione delle caratteristiche è opportuno considerare il tipo di alimentazione (benzina o diesel) e la presenza o assenza dei vari optional. Al fine di inserire nel modello le variabili esplicative qualitative, esse sono preliminarmente codificate medianti variabili dicotomiche (sono dette dicotomiche o dummy le variabili che assumono valore 0 o 1). Quando la variabile assume due sole modalità si utilizza una sola variabile dicotomica, che assume valore 1 per una modalità e 0 per l’altra.
2
Ad esempio per rappresentare il genere è sufficiente una variabile che assuma valore 1 se l’individuo è maschio e 0 se l’individuo è femmina. Se invece la variabile assume k modalità si introducono (k -1) variabili dicotomiche. Ad esempio se il titolo di studio assume le modalità “licenza media”, “diploma di maturità” e “laurea”, si possono introdurre due variabili dicotomiche: Z1= Z2= In questo modo la combinazione delle due variabili copre le tre modalità della variabile titolo di studio (vedi tabella) 1 se l’individuo è laureato 0 altrimenti 1 se l’individuo è diplomato 0 altrimenti
3
Titolo di studio Z1 Z2 licenza media diploma di maturità 1 laurea
diploma di maturità 1 laurea La modalità in corrispondenza della quale le variabili dicotomiche sono tutte nulle costituisce la modalità di riferimento (nell’esempio ) licenza media). Si consideri un modello di regressione per spiegare il prezzo al quale un’impresa edile vende villette in una località di mare. Le variabili esplicative del prezzo sono: i metri quadrati (X2), il numero di bagni (X3), la presenza del giardino (Z) Z= . 1 se c’è il giardino 0 altrimenti
4
Per spiegare il prezzo delle villette, si specifica quindi un modello del tipo:
Per interpretare i parametri si considera il valore atteso della Y condizionato al valore della variabile dicotomica: L’effetto della variabile dicotomica è quello di modificare l’intercetta. Il parametro γ fornisce la variazione nel prezzo medio delle villette dovuta alla presenza del giardino.
5
Si supponga ora di voler introdurre come ulteriore fattore esplicativo del prezzo delle villette un’informazione legata al posto auto, in particolare si hanno tre diverse situazioni: box auto, garage 1 posto auto, garage 2 posti auto. Per codificare questa informazione si utilizzano due variabili dicotomiche W1 che assume valore 1 se il garage ha 1 posto auto, W2 che assume valore 1 se il garage ha 2 posti auto, in dettaglio: W1= W2= Di conseguenza la coppia (W1,W2)=0,0 indica la villetta con box auto (W1,W2)=1,0 indica la villetta con garage a 1 posto (W1,W2)=0,1 indica la villetta con garage a 2 posti 1 garage con 1 posto auto 0 altrimenti 1 garage con 2 posti auto 0 altrimenti
6
La nuova specificazione del modello è la seguente:
Considerando il valore atteso della Y condizionato ai valori delle variabili dicotomiche si ha: γ fornisce la variazione nel prezzo medio delle villette dovuta alla presenza del giardino; la variazione nel prezzo medio delle villette dovuta alla presenza di garage con 1 posto auto rispetto a quella con solo box auto
7
la variazione nel prezzo medio delle villette dovuta alla presenza di garage con 2 posti auto, rispetto a quella con solo box auto. Se non vi fosse differenza di prezzo tra garage con 1 posto auto e garage a 2 posti, si avrebbe Per verificare se tra il prezzo di una villetta con solo box auto e quello di una villetta con garage a 1 posto c’è differenza si deve verificare l’ipotesi Per verificare se tra il prezzo di una villetta con solo box auto e quello di una villetta con garage a 2 posti c’è differenza si deve verificare l’ipotesi Per modificare anche i coefficienti angolari in relazione alle diverse modalità delle variabili dummy si può considerare il prodotto tra le variabili dummy e le variabili esplicative. Per spiegare l’argomento consideriamo un esempio classico.
8
C rappresenta il Consumo
Y rappresenta il reddito D è una variabile dummy che assume valore 1 nel periodo di guerra Il modello che specifica la funzione del consumo è: Il valore atteso del Consumo condizionato ai valori delle variabili dicotomiche risulta: Il modello così specificato assume che in tempo di guerra ci sia una variazione della propensione marginale al consumo. Per verificare se tale variazione risulti significativa si deve verificare l’ipotesi
9
Se invece che una variazione nel solo coefficiente angolare si suppone che a variare sia anche l’intercetta, il modello si specifica in questa forma: * Il valore atteso del Consumo condizionato ai valori delle variabili dicotomiche risulta: La stima del modello * determina gli stessi parametri che si otterrebbero specificando e stimando due modelli separati, uno per il periodo di guerra e l’altro per il periodo di pace; la scelta tra la stima di un modello unico o di due modelli separati dipende dall’ipotesi che si può fare sulla varianza dell’errore. Se si ritiene varianza costante è opportuno specificare un solo modello se si ritiene che la varianza dell’errore del tempo di pace sia diversa da quella in tempo di guerra si specificano due modelli.
10
OSSERVAZIONI Si è detto che per rappresentare una variabile che assume k modalità si introducono (k -1) variabili dicotomiche, e non k variabili dicotomiche. Perché? Introducendo k variabili, la k-esima sarebbe combinazione lineare esatta delle k-1 e si perderebbe l’ipotesi di assenza di legame lineare tra le variabili. Esempio per rappresentare le tre modalità : box auto, garage 1 posto auto, garage 2 posti auto si sono specificate due variabili dicotomiche W1 che assume valore 1 se il garage ha 1 posto auto, W2 che assume valore 1 se il garage ha 2 posti auto; introducendo W0 che assume valore 1 se la villetta possiede box auto si avrebbe W0=1- W1- W2. Perché non rappresentare le tre modalità con una sola variabile Z che assume valore 0 se la villetta possiede box auto, 1 se il garage ha 1 posto auto, 2 se il garage ha 2 posti auto? Questa specificazione sarebbe equivalente a quella con le due dummy se la differenza di prezzo delle villette con box auto e
11
garage a 1 posto fosse identica alla differenza tra garage con 1 posto e garage con due posti. E’ evidente la forzatura di tale ipotesi.
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.