La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.

Presentazioni simili


Presentazione sul tema: "Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10."— Transcript della presentazione:

1 Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10

2 Regressione lineare - Modello Modello di regressione lineare si vuole modellare una relazione di tipo lineare tra una variabile dipendente e un insieme di regressori che si ritiene influenzino la variabile dipendente si vuole approssimare la nuvola dei punti osservati (ogni punto rappresenta un intervistato) con una retta tra tutte le infinite rette possibili si stima la retta che fornisce linterpolazione migliore stimare la migliore retta di regressione significa calcolare una stima dei coefficienti associati ai regressori che entrano nel modello (tutto ciò con il vincolo di minimizzare gli errori di approssimazione)

3 Regressione lineare – Selezione regressori Nella scelta dei regressori bisogna cercare di mediare tra due esigenze: 1)maggior numero di variabili per migliorare il fit 2)parsimonia per rendere il modello più robusto e interpretabile Scelta dei regressori che entrano nel modello metodo di selezione automatica (PROC REG con opzione STEPWISE)

4 Regressione lineare – Regressione stepwise Procedura sequenziale che valuta lingresso/uscita dal modello dei singoli regressori (in base a indicatori legati allR-quadro) Step 0 si considerano tutti i potenziali regressori Step 1 entra il primo regressore. Ossia, viene stimato un modello contenente un unico regressore tra quelli proposti (il regressore che spiega meglio la variabilità della variabile dipendente) Step 2 si valutano tutti i possibili modelli contenenti il regressore individuato allo step 1 e uno dei rimanenti regressori, e si tiene il modello con il fit migliore (ossia entra il regressore che dà il contributo maggiore alla spiegazione della variabilità) Step 3 come nello step 2, entra il regressore che dà il contributo maggiore alla spiegazione della variabilità Step 4 si valuta luscita di ognuno dei regressori presenti (in base alla minor perdita di capacità esplicativa del modello) e lingresso di un nuovo regressore (in base al maggior incremento nella capacità esplicativa del modello) La procedura continua con lingresso/uscita dei regressori fino a quando non si può più migliorare la capacità esplicativa del modello.

5 proc reg data=dataset; model variabile_dipendente= regressore_1... regressore_p /option(s); run; Modello di regressione lineare – selezione automatica dei regressori (a partire da p regressori) PROC REG – Sintassi OPTIONS: stb calcola i coefficienti standardizzati selection=stepwise applica la procedura stepwise per la selezione dei regressori slentry=… livello di significatività richiesto per il test F parziale affinchè il singolo regressore possa entrare nel modello slstay=… livello di significatività richiesto per il test F parziale affinchè il singolo regressore non sia rimosso dal modello

6 PROC REG – Esempio Variabile dipendente e regressori

7 PROC REG – Esempio proc reg data= corso.telefonia; model soddisfazione_globale= CambioTariffa_2 ChiarezzaTariffe_2 … /stb selection=stepwise slentry=0.05 slstay=0.05; run; Modello di regressione lineare variabile dipendente= SODDISFAZIONE_GLOBALE, regressori= 21 variabili di soddisfazione (livello di soddisfazione relativo a tariffe, promozioni, ecc.) REGRESSORI opzione per ottenere i coefficienti standardizzati VARIABILE DIPENDENTE criterio di selezione automatica dei regressori soglia di significatività scelta per il test F affinchè un regressore possa entrare nel modello (valore di default=0.15) soglia di significatività scelta per il test F affinchè un regressore non sia rimosso dal modello (valore di default=0.15)

8 Regressione lineare – Valutazione modello Valutazione della bontà del modello (output della PROC REG) Test t per valutare la significatività dei singoli coefficienti (se p-value del test piccolo allora si rifiuta lipotesi di coefficiente nullo il regressore corrispondente è rilevante per la spiegazione della variabile dipendente) Test F per valutare la significatività congiunta dei coefficienti (se p-value piccolo rifiuto lipotesi che i coefficienti siano tutti nulli il modello ha buona capacità esplicativa) Coefficiente di determinazione R-quadro per valutare la capacità esplicativa del modello capacità di rappresentare la relazione tra la variabile dipendente e i regressori (varia tra 0 e 1, quanto più si avvicina ad 1 tanto migliore è il modello)

9 PROC REG – Output attenzione!! per stimare il modello SAS non utilizza i record con valori mancanti il modello è abbastanza buono (spiega il 60% della variabilità della variabile dipendente)

10 PROC REG – Output il modello ha buona capacità esplicativa, il p-value associato al test F è < 0.05 (livello di significatività)

11 PROC REG – Output tutti i regressori sono rilevanti per la spiegazione della variabile dipendente; il p-value associato al test t è < 0.05 (livello di significatività)

12 Regressione lineare – Interpretazione coefficienti Il coefficiente beta (output della PROC REG) associato ad uno specifico regressore X ha il seguente significato se X aumenta/diminuisce di una unità (e tutti gli altri regressori rimangono invariati) allora 1) se il coefficiente è positivo Y aumenta/diminuisce di una percentuale pari al valore del coefficiente 2) se il coefficiente è negativo Y diminuisce/aumenta di una percentuale pari al valore del coefficiente in genere si considerano i coefficienti standardizzati (opzione STB della PROC REG) che non sono influenzati dallunità di misura delle variabili

13 PROC REG – Output se la variabile CambioTariffa_2 aumenta (diminuisce) di una unità allora la soddisfazione globale aumenta (diminuisce) del 19% N.B.:attenzione al segno!!

14 Regressione lineare – Variabili qualitative nominali Considerazioni da fare prima di stimare il modello Non si possono inserire variabili qualitative nominali tra i regressori Per considerare questo tipo di variabili allinterno del modello bisogna costruire delle variabili dummy (dicotomiche (0-1)) che identificano le modalità della variabile nominale originaria; Le variabili dummy saranno utilizzate come regressori)

15 Costruzione variabili dummy - esempio Es. Si vuole considerare tra i regressori la variabile qualitativa nominale Area che identifica larea di residenza degli intervistati La variabile Area assume tre modalità (nord-centro-sud) si costruiscono due variabili dummy

16 Costruzione variabili dummy - esempio Le variabili dummy da costruire sono due (la terza sarebbe ridondante può essere ottenuta come combinazione delle altre due) Area_nord vale 1 se lintervistato è residente al nord e 0 in tutti gli altri casi Area_centro vale 1 se lintervistato è residente al centro e 0 in tutti gli altri casi

17 Costruzione variabili dummy - esempio VARIABILE ORIGINARIA (non entra nel modello) VARIABILI DUMMY (entrano nel modello)

18 Costruzione variabili dummy - esempio Nella PROC REG si inseriscono le due variabili dummy (ma non la variabile originaria!) nella lista dei regressori i relativi coefficienti rappresentano leffetto della singola modalità (nord/centro) della variabile Area. proc reg data= … ; model Y= X1 X2 … area_nord area_centro /stb selection= stepwise; run;

19 PROC REG – Riepilogo Per stimare un modello di regressione lineare 1.individuare la variabile dipendente (=il fenomeno da analizzare) 2.individuare linsieme dei potenziali regressori (eventualmente tutte le variabili nel dataset) 3.se tra i regressori sono presenti variabili qualitative nominali costruire variabili dummy 4.far girare la PROC REG con il metodo stepwise e verificare la bontà del modello (R-quadro, TEST F e significatività dei coefficienti (test t)) 5.Interpretare i coefficienti

20 Lunedì 11 gennaio dalle alle Lunedì 25 gennaio dalle alle Lunedì 8 febbraio dalle alle Orari di ricevimento Gennaio-Febbraio 2010


Scaricare ppt "Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10."

Presentazioni simili


Annunci Google