Regressione lineare - Esercizi Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°9
Regressione lineare - Modello Modello di regressione lineare si vuole modellare una relazione di tipo lineare tra una variabile dipendente e un insieme di regressori che si ritiene influenzino la variabile dipendente si vuole approssimare la nuvola dei punti osservati (ogni punto rappresenta un intervistato) con una retta tra tutte le infinite rette possibili si stima la retta che fornisce l’interpolazione migliore stimare la migliore retta di regressione significa calcolare una stima dei coefficienti associati ai regressori che entrano nel modello (tutto ciò con il vincolo di minimizzare gli errori di approssimazione)
Regressione lineare – Analisi preliminari Prima di stimare il modello costruire variabili dummy se necessario (ossia se si vogliono utilizzare variabili qualitative nominali come regressori) valutare il coefficiente di correlazione lineare (PROC CORR) tra la variabile dipendente e tutti i potenziali regressori valutare la presenza di multicollinearità tra i regressori (PROC CORR per analizzare la matrice di correlazione tra i regressori che entrano nel modello)
Regressione lineare – Selezione regressori Scelta dei regressori che entrano nel modello selezione a priori di un sottoinsieme di regressori (ad es. si scelgono le variabili con valori alti del coefficiente di correlazione lineare con la variabile dipendente. PROC REG senza opzioni di selezione variabili) metodo di selezione automatica (PROC REG con opzione STEPWISE)
proc reg data= dataset; model variabile dipendente= regressore_1. regressore_k /option(s); run; Modello di regressione lineare – k regressori specificati a priori PROC REG – Sintassi OPTIONS: /stb calcola i coefficienti standardizzati /selection=stepwise applica la procedura stepwise per la selezione dei regressori
Esercizi 1.Modello di regressione lineare sul dataset TELEFONIA – variabile dipendente= livello di soddisfazione globale sull’utilizzo del telefono cellulare (SODDISFAZIONE_GLOBALE) 2.Modello di regressione lineare sul dataset DENTI – variabile dipendente= consumo totale di dentifricio (CONSTOT)
Variabili esercizio 1 Variabile dipendente e 21 regressori
Variabili esercizio 2 Variabile dipendente e 15 regressori