Dall’analisi Fattoriale alla regressione lineare

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE L’analisi Fattoriale.
Advertisements

L’Analisi Fattoriale (PCA) con SPSS
Analisi Fattoriale Tecnica utilizzata per studiare, riassumere e semplificare le relazioni in un insieme di variabili.
Primi passi con Easy Reg 1
Analisi Bivariata e Test Statistici
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Analisi Bivariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°4.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n° 8.
Analisi fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 10.
Regressione logistica
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Analisi Bivariata & Esercizi Analisi Univariata
Test Statistici Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°7.
Analisi Bivariata & Esercizi Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°4.
Esercizi Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8.
Analisi Bivariata e Test Statistici
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Test di associazione - Analisi fattoriale
Analisi fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Regressione lineare - Esercizi
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n° 8.
Ripasso (dallanalisi univariata allanalisi fattoriale) Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°10.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Ll Questionario Introduzione al software SAS (Parte 2) Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°2.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°6.
Regressione logistica
Analisi Univariata e bivariata Esercizi
ANALISI FATTORIALE. Cosè lanalisi fattoriale? Statistica descrittiva Rappresentazione delle variabili in studio. Statistica confermativa vs Confermare,
Esercizi riepilogativi Analisi Univariata e Bivariata Analisi Fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°5.
STATISTICA PER LE DECISIONI DI MARKETING
STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LINEARE MULTIPLA Selezione.
LABORATORIO DI ANALISI AVANZATA DEI DATI Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LINEARE MULTIPLA Esempio (d)istruttivo.
SAS® OnDemand for Academics SAS Studio
Distribuzioni di Frequenza & Esercizi Distribuzioni di Frequenza & Esercizi Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°2.
Analisi Bivariata: Test Statistici
Esercizi Analisi Fattoriale + Regressione lineare Regressione logistica Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°13.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°11 Regressione lineare multipla: Analisi di influenza. Case Study.
Analisi Fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Dall’Analisi Fattoriale alla Regressione Lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n° 11.
Esercizi riepilogativi Analisi Univariata e Bivariata
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9 Regressione lineare multipla: la stima del modello e la sua valutazione, metodi automatici.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Analisi Bivariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°4.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°13 Regressione Logistica: La stima e l’interpretazione del del modello.
Regressione logistica
La regressione II Cristina Zogmaister.
Esame di Analisi Multivariata dei Dati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°10 Regressione lineare multipla: la valutazione del modello, metodi automatici di selezione.
Analisi fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°7.
Esercizi riepilogativi Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°6.
Analisi fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezioni n°7-8.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°7.
Regressione lineare - Esercizi
Regressione logistica Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Regressione lineare - Esercizi Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°9.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Analisi fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°9.
Altri concetti sulla regressione. Multicollinearità Varianza comune fra le VI: se è molto elevata produce stime instabili. Ci sono degli indici per indicare.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°13.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Transcript della presentazione:

Dall’analisi Fattoriale alla regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n° 7

Step di analisi Numero di fattori Confronto soluzioni scelte Regola Autovalori >1 Lettura SCREEPLOT 1/3 variabili originali Variabilità spiegata 60%-75% Confronto soluzioni scelte Comunalità finali Analisi soluzione Rotazione fattori Interpretazione fattori Produzione dataset con fattori

PROC FACTOR – Opzioni Analisi fattoriale con il metodo delle componenti principali. PROC FACTOR DATA=CORSO.TELEFONIA N=8 FUZZ=0.35 SCREE OUT=CORSO.FACTORS ROTATE=VARIMAX REORDER; VAR elenco variabili; RUN; OPZIONE DESCRIZIONE OUT =dataset Produce in output un data set che contiene le variabili originali e i fattori non ruotati N=num Consente di specificare il numero di fattori che si vuole estrarre ROTATE=metodo Specifica che il criterio per la rotazione dei fattori (VARIMAX, …) SCREE Produce scree plot REORDER Ordina le variabili in modo da facilitare la lettura dei loadings FUZZ=valore Stampa solo |loadings| > valore indicato.

PROC REG – Riepilogo Individuazione variabili dipendente e regressori Trasformazione di eventuali variabili qualitative in dummy Stimare un modello di regressione lineare utilizzando la procedura automatica di selezione delle variabili (stepwise) Controllare la bontà del modello (R-square, Test F) Controllare la significatività dei singoli coefficienti (Test t) Analisi di influenza con i soli regressori scelti nella stepwise. Se si è in presenza di osservazioni influenti: eliminarle e ripetere i punti 3, 4, 5 In assenza di osservazioni influenti: passare al punto 7

PROC REG – Riepilogo Verificare la presenza di multicollinearità (se i regressori del modello sono i fattori di un’analisi fattoriale non è necessario perchè risultano non correlati per costruzione  tutti i VIFj =1) Se si è in presenza di multicollinearità: azioni per eliminarla e ripetere i punti 3, 4, 5, 6 In assenza di multicollinearità: passare al punto 8 Verificare l’impatto dei regressori nella spiegazione del fenomeno (ordinarli usando il valore assoluto dei coefficienti standardizzati e controllare il segno dei coefficienti) Interpretazione del coefficienti standardizzati

PROC REG – Sintassi proc reg data=dataset; model variabile_dipendente= Modello di regressione lineare proc reg data=dataset; model variabile_dipendente= regressore_1 ... regressore_p /option(s); run; OPTIONS: STB calcola i coefficienti standardizzati selection=stepwise applica la procedura stepwise per la selezione dei regressori slentry=… livello di significatività richiesto per il test F parziale affinchè il singolo regressore possa entrare nel modello slstay=… livello di significatività richiesto per il test F parziale affinchè il singolo regressore non sia rimosso dal modello VIF per verificare presenza di multicollinearietà

Statistiche di influenza Sintassi La PROC REG fornisce nell’output i valori della distanza di Cook e del levarage H per ogni osservazione del dataset: proc reg data=dataset noprint; model variabile_dipendente= regressore_1 ... regressore_p / influence; output out=dataset_output cookd=cook H=leverage; run; OPTIONS: Influence e r forniscono una serie di indicatori di influenza tra cui D e H Cookd= crea nel dataset di output una variabile con i valori della Distanza di Cook per ogni osservazione H= crea nel dataset di output una variabile con i valori del Leverage per ogni osservazione Noprint = utile soprattutto per dataset con molte informazioni, permette di non stampare l’output

Esercizio Il dataset ct_telefonia.sas7bdat contiene i dati di 126,761 clienti di una compagnia telefonica e 25 variabili quantitative

Esercizio Allocare una libreria che punti alla cartella in cui si è salvato il dataset. Accertarsi che le opzioni per l’output HTML siano correttamente impostate Effettuare un’analisi fattoriale utilizzando tutte le variabili elencate escludendo la variabile ARPU. Scegliere il numero di fattori ottimali Salvare i fattori interpretati in un nuovo dataset

Esercizio Variabili da utilizzare per l’analisi fattoriale: CONTATTI_INBOUND CONTATTI_OUTBOUND REC_CONT_INBOUND REC_CONT_OUTBOUND MINUTI_VOCE_FREE MINUTI_VOCE_ITZ MINUTI_VOCE_OFFNET MINUTI_VOCE_ONNET RECENZA_CAMBIO_PIANO AMMONT_RICARICA_BONUS AMMONT_RICARICA_PAG AMMONT_RICARICA_PAG_LOTTO_SISAL AMMONT_RICARICA_RICORRENTE NUMERO_RICARCIHE_BONUS NUMERO_RICARICHE_RICORRENTI D_OPZ_ESTERO D_OP_NUM_PREF D_RIC_RICORRENTE FLAG_OPZ_COUNTRY

Esercizio Stimare un modello di regressione lineare utilizzando come variabile dipendente il valore dell’Arpu  come potenziali regressori oltre ai fattori individuati al punto precedente, anche le variabili età del cliente, anzianità della sim e numero di sim attive per cliente: Utilizzare l’opzione di stepwise (ed i relativi livelli di significatività) Effettuare tutti i passaggi presenti nelle slide di riepilogo (slide 4 e 5) rispondendo anche alle seguenti domande: a. Il valore dell’R-quadro è soddisfacente? b. Cosa possiamo affermare osservando i dati relativi al test F e ai test t? c. Quale regressore influenza maggiormente la variabile dipendente.