MODELLO DI REGRESSIONE LINEARE MULTIPLA: USO DELLE VARIABILI DUMMY (parte 2) In alcune circostanze è opportuno inserire, come variabili esplicative, delle.

Slides:



Advertisements
Presentazioni simili
Capitolo 8: Reddito e spesa. C I C + I C + I + G AD = Y Y* AD.
Advertisements

2. Introduzione alla probabilità
Come organizzare i dati per un'analisi statistica al computer?
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Analisi dei dati per i disegni ad un fattore
La regressione lineare trivariata
ANALISI DELLA COVARIANZA
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 10.
Regressione logistica
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
ALCUNI METODI STATISTICI PER LA SELEZIONE DELLE VARIABILI NELL’ANALISI DISCRIMINANTE Eliminazione di variabili con contributo discriminatorio statisticamente.
STATISTICA 6.0: REGRESSIONE LINEARE
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
MODELLO DI REGRESSIONE LINEARE MULTIPLA
Analisi della varianza (a una via)
La logica della regressione
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Corso di biomatematica lezione 6: la funzione c2
BIOINGEGNERIA S. Salinari Lezione 4.
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Modello di regressione lineare semplice
STATISTICA PER LE DECISIONI DI MARKETING
Regressione Logistica
Capitolo 9 Equilibrio macroeconomico con prezzi flessibili.
“Analisi delle serie storiche e applicazioni”
STATISTICA PER LE DECISIONI DI MARKETING
STATISTICA PER LE DECISIONI DI MARKETING
Statistica economica (6 CFU)
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
La regressione come strumento di sintesi delle relazioni tra variabili
DATA MINING PER IL MARKETING
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9 Regressione lineare multipla: la stima del modello e la sua valutazione, metodi automatici.
La regressione II Cristina Zogmaister.
Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. SIGNIFICATIVITÀ.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
IL CAMPIONE.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°10 Regressione lineare multipla: la valutazione del modello, metodi automatici di selezione.
Analisi Multivariata dei Dati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9.
Analisi discriminante lineare - contesto
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°7.
REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta.
LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
“Teoria e metodi della ricerca sociale e organizzativa”
1 “Teoria e metodi della ricerca sociale e organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università Milano-Bicocca.
Regressione logistica Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Correlazione e regressione lineare
La regressione statistica IL CASO UNIVARIATO Consideriamo due variabili continue proponendoci di INDAGARE se esiste una relazione tra loro. Normalmente.
TEST STATISTICI PER SCALE NOMINALI, TASSI E PROPORZIONI Non sempre la variabile aleatoria (risultato sperimentale) è un numero ma è spesso un esito dicotomico.
PRIMA SETTIMANA (8-10 febbraio 2015). Il corso è diviso in due parti. Nella prima sono presentate alcune teorie finanziarie con la loro applicazioni a.
DEFINIRE I REQUISITI DEL CLIENTE SVILUPPARE E VALUTARE IL QUESTIONARIO IMPIEGARE IL QUESTIONARIO Dimensioni della qualità 1.Perfomance 2.Optionals 3.Affidabilità.
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
L’analisidei dati L’analisi dei dati Analisi mutlidimensionali: Analisi delle corrispondenze multiple Cluster Analysis.
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
MODELLO DI REGRESSIONE LINEARE MULTIPLA
Transcript della presentazione:

MODELLO DI REGRESSIONE LINEARE MULTIPLA: USO DELLE VARIABILI DUMMY (parte 2) In alcune circostanze è opportuno inserire, come variabili esplicative, delle variabili qualitative. Nella spiegazione del prezzo di un’automobile in funzione delle caratteristiche è opportuno considerare il tipo di alimentazione (benzina o diesel) e la presenza o assenza dei vari optional. Al fine di inserire nel modello le variabili esplicative qualitative, esse sono preliminarmente codificate medianti variabili dicotomiche (sono dette dicotomiche o dummy le variabili che assumono valore 0 o 1). Quando la variabile assume due sole modalità si utilizza una sola variabile dicotomica, che assume valore 1 per una modalità e 0 per l’altra.

Ad esempio per rappresentare il genere è sufficiente una variabile che assuma valore 1 se l’individuo è maschio e 0 se l’individuo è femmina. Se invece la variabile assume k modalità si introducono (k -1) variabili dicotomiche. Ad esempio se il titolo di studio assume le modalità “licenza media”, “diploma di maturità” e “laurea”, si possono introdurre due variabili dicotomiche: Z1= Z2= In questo modo la combinazione delle due variabili copre le tre modalità della variabile titolo di studio (vedi tabella) 1 se l’individuo è laureato 0 altrimenti 1 se l’individuo è diplomato 0 altrimenti

Titolo di studio Z1 Z2 licenza media diploma di maturità 1 laurea diploma di maturità 1 laurea La modalità in corrispondenza della quale le variabili dicotomiche sono tutte nulle costituisce la modalità di riferimento (nell’esempio ) licenza media). Si consideri un modello di regressione per spiegare il prezzo al quale un’impresa edile vende villette in una località di mare. Le variabili esplicative del prezzo sono: i metri quadrati (X2), il numero di bagni (X3), la presenza del giardino (Z) Z= . 1 se c’è il giardino 0 altrimenti

Per spiegare il prezzo delle villette, si specifica quindi un modello del tipo: Per interpretare i parametri si considera il valore atteso della Y condizionato al valore della variabile dicotomica: L’effetto della variabile dicotomica è quello di modificare l’intercetta. Il parametro γ fornisce la variazione nel prezzo medio delle villette dovuta alla presenza del giardino.

Si supponga ora di voler introdurre come ulteriore fattore esplicativo del prezzo delle villette un’informazione legata al posto auto, in particolare si hanno tre diverse situazioni: box auto, garage 1 posto auto, garage 2 posti auto. Per codificare questa informazione si utilizzano due variabili dicotomiche W1 che assume valore 1 se il garage ha 1 posto auto, W2 che assume valore 1 se il garage ha 2 posti auto, in dettaglio: W1= W2= Di conseguenza la coppia (W1,W2)=0,0 indica la villetta con box auto (W1,W2)=1,0 indica la villetta con garage a 1 posto (W1,W2)=0,1 indica la villetta con garage a 2 posti 1 garage con 1 posto auto 0 altrimenti 1 garage con 2 posti auto 0 altrimenti

La nuova specificazione del modello è la seguente: Considerando il valore atteso della Y condizionato ai valori delle variabili dicotomiche si ha: γ fornisce la variazione nel prezzo medio delle villette dovuta alla presenza del giardino; la variazione nel prezzo medio delle villette dovuta alla presenza di garage con 1 posto auto rispetto a quella con solo box auto

la variazione nel prezzo medio delle villette dovuta alla presenza di garage con 2 posti auto, rispetto a quella con solo box auto. Se non vi fosse differenza di prezzo tra garage con 1 posto auto e garage a 2 posti, si avrebbe Per verificare se tra il prezzo di una villetta con solo box auto e quello di una villetta con garage a 1 posto c’è differenza si deve verificare l’ipotesi Per verificare se tra il prezzo di una villetta con solo box auto e quello di una villetta con garage a 2 posti c’è differenza si deve verificare l’ipotesi Per modificare anche i coefficienti angolari in relazione alle diverse modalità delle variabili dummy si può considerare il prodotto tra le variabili dummy e le variabili esplicative. Per spiegare l’argomento consideriamo un esempio classico.

C rappresenta il Consumo Y rappresenta il reddito D è una variabile dummy che assume valore 1 nel periodo di guerra Il modello che specifica la funzione del consumo è: Il valore atteso del Consumo condizionato ai valori delle variabili dicotomiche risulta: Il modello così specificato assume che in tempo di guerra ci sia una variazione della propensione marginale al consumo. Per verificare se tale variazione risulti significativa si deve verificare l’ipotesi

Se invece che una variazione nel solo coefficiente angolare si suppone che a variare sia anche l’intercetta, il modello si specifica in questa forma: * Il valore atteso del Consumo condizionato ai valori delle variabili dicotomiche risulta: La stima del modello * determina gli stessi parametri che si otterrebbero specificando e stimando due modelli separati, uno per il periodo di guerra e l’altro per il periodo di pace; la scelta tra la stima di un modello unico o di due modelli separati dipende dall’ipotesi che si può fare sulla varianza dell’errore. Se si ritiene varianza costante è opportuno specificare un solo modello se si ritiene che la varianza dell’errore del tempo di pace sia diversa da quella in tempo di guerra si specificano due modelli.

OSSERVAZIONI Si è detto che per rappresentare una variabile che assume k modalità si introducono (k -1) variabili dicotomiche, e non k variabili dicotomiche. Perché? Introducendo k variabili, la k-esima sarebbe combinazione lineare esatta delle k-1 e si perderebbe l’ipotesi di assenza di legame lineare tra le variabili. Esempio per rappresentare le tre modalità : box auto, garage 1 posto auto, garage 2 posti auto si sono specificate due variabili dicotomiche W1 che assume valore 1 se il garage ha 1 posto auto, W2 che assume valore 1 se il garage ha 2 posti auto; introducendo W0 che assume valore 1 se la villetta possiede box auto si avrebbe W0=1- W1- W2. Perché non rappresentare le tre modalità con una sola variabile Z che assume valore 0 se la villetta possiede box auto, 1 se il garage ha 1 posto auto, 2 se il garage ha 2 posti auto? Questa specificazione sarebbe equivalente a quella con le due dummy se la differenza di prezzo delle villette con box auto e

garage a 1 posto fosse identica alla differenza tra garage con 1 posto e garage con due posti. E’ evidente la forzatura di tale ipotesi.