La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Analisi fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°9.

Presentazioni simili


Presentazione sul tema: "Analisi fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°9."— Transcript della presentazione:

1 Analisi fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°9

2 Le date d’esame relative alla sessione invernale sono: –lunedì 14 gennaio 2013 ore 14.30 –lunedì 4 febbraio 2013 ore 14.30 Le date di ricevimento sono (previa prenotazione via mail entro le ore 12 del venerdì precedente agli indirizzi epallini@liuc,.it e fcalabretti@liuc.it ): epallini@liuc,.itfcalabretti@liuc.it –martedì 8 gennaio 2013 dalle ore 14.30 alle ore 15.30 –martedì 29 gennaio 2013 dalle ore 14.30 alle ore 15.30 Consegna lavoro di gruppo, appelli e ricevimento

3 Analisi Fattoriale E’ una tecnica descrittiva/esplorativa per l’analisi delle relazioni lineari (correlazioni) esistenti tra variabili quantitative. Nelle applicazioni è usata anche con variabili qualitative ordinali che esprimono scale di preferenza numeriche (punteggi). A partire da una matrice di dati nxp con p variabili originarie, consente di sintetizzare l’informazione in un set ridotto di variabili trasformate (le componenti/i fattori latenti). Perché sintetizzare? -se l’informazione è condivisa tra più variabili correlate tra loro, è ridondante utilizzarle tutte; -la sintesi comporta una perdita di informazione non rilevante e semplifica le analisi successive.

4 Analisi Fattoriale: Introduzione Metodo delle Componenti Principali Per estrarre i fattori e quindi stimare dei coefficienti (i LOADINGS), uno dei metodi possibili è il Metodo delle Componenti Principali. Alla matrice dei dati X (nxp) possono essere associate p nuove variabili (componenti principali), ottenute come combinazioni lineari della variabili originali. PROPRIETA’ delle COMPONENTI hanno media nulla hanno varianza pari al proprio autovalore sono tra loro ortogonali (non correlate) Per la stima dei loadings si ricorre agli autovalori e agli autovettori della matrice di correlazione R: di fatto i loadings coincidono con le correlazioni tra le variabili manifeste e le componenti principali.

5 PROC FACTOR – Sintassi generale proc factor data= dataset option(s); var variabile1 … variabile2 variabilen; run; Analisi fattoriale con il metodo delle componenti principali.

6 Analisi Fattoriale - Esempio Gli intervistati hanno espresso, per ciascuna delle 21 caratteristiche del servizio “tariffa telefonica”, un giudizio sull’importanza utilizzando una scala da 1 a 9. VARIABILEDESCRIZIONE immagine_1l'immagine dell'operatore diffusione_1la diffusione dell'operatore copertura_1la copertura della rete dell'operatore assistenza_1il servizio di assistenza dell'operatore NoScattoRisp_1l'assenza di scatto alla risposta CostoSMS_1il costo degli SMS CostoMMS_1il costo degli MMS AccessoWeb_1il costo di accesso a internet NavigazioneWeb_1il costo di navigazione in internet ChiamateTuoOperatore_1la possibilità di effettuare chiamate a costi inferiori verso numeri dello stesso operatore SMSTuoOperatore_1la possibilità inviare SMS a costi inferiori verso numeri dello stesso operatore MMSTuoOperatore_1la possibilità inviare MMS a costi inferiori verso numeri dello stesso operatore vsPochiNumeri_1le agevolazioni verso uno o più numeri di telefono NumeriFissi_1le agevolazioni verso numeri fissi AltriOperatori_1i costi verso altri operatori Autoricarica_1la possibilità di autoricarica Promozioni_1la possibilità di attivare promozioni sulle tariffe ChiarezzaTariffe_1la chiarezza espositiva delle tariffe ComodatoUso_1la possibilità di rivecere un cellulare in comodato d'uso DurataMinContratto_1la presenza di una durata minima del contratto CambioTariffa_1la facilità di cambiamento della tariffa

7 Esempio variabili

8 PROC FACTOR - Esempio Analisi fattoriale con il metodo delle componenti principali. PROC FACTOR DATA=CORSO.TELEFONIA SCREE FUZZ=0.3; VAR immagine_1 diffusione_1 copertura_1 assistenza_1 NoScattoRisp_1 CostoSMS_1 CostoMMS_1 AccessoWeb_1 NavigazioneWeb_1 ChiamateTuoOperatore_1 SMSTuoOperatore_1 MMSTuoOperatore_1 vsPochiNumeri_1 NumeriFissi_1 AltriOperatori_1 Autoricarica_1 Promozioni_1 ChiarezzaTariffe_1 ComodatoUso_1 DurataMinContratto_1 CambioTariffa_1; RUN; Scree Plot: grafico di autovalore vs il numero di fattori Stampa solo |loadings| > valore indicato.

9 Quanti fattori considerare?  la regola autovalori > 1 Prendiamo in considerazione tutte le componenti principali con varianza maggiore di 1 (autovalori maggiori di 1) tenendo sotto controllo la % cumulata di varianza spiegata dalle componenti.  lettura dello SCREE PLOT (grafico di autovalore vs il numero di fattori) Se il grafico mostra un “gomito” è plausibile ipotizzare l’esistenza di una struttura latente, se la forma è quasi rettilinea significa che i fattori sono solo una trasformazione delle variabili manifeste. I fattori rilevanti sono quelli al di sopra del gomito (a discrezione anche quello in corrispondenza del gomito). Se non ci sono fattori predominanti il criterio è inadatto.  rapporto tra numero di componenti e variabili numero di fattori scelti dovrebbe essere circa 1/3 delle variabili originarie  percentuale di varianza spiegata >60%

10 Output PROC FACTOR Eigenvalues of the Correlation Matrix: Total = 21 Average = 1 EigenvalueDifferenceProportionCumulative 15.5173.1020.263 22.4140.9000.1150.378 31.5140.2120.0720.450 41.3020.2460.0620.512 51.0560.0630.0500.562 60.9940.0480.0470.609 70.9460.0400.0450.655 80.9050.0170.0430.698 90.8880.1210.0420.740 100.7670.0600.0370.776 110.7070.0310.0340.810 120.6760.0890.0320.842 130.5870.0660.0280.870 140.5210.0470.0250.895 150.4740.0350.0230.918 160.4390.0340.0210.939 170.4040.0610.0190.958 180.3430.0500.0160.974 190.2940.1010.0140.988 200.1930.1350.0090.997 210.058 0.0031.000 La regola degli autovalori > 1 suggerisce di prendere in considerazione 5 fattori, che spiegano insieme il 56% della varianza totale. %varianza spiegata >60%  GOOD

11 Output PROC FACTOR Lo scree plot mostra un gomito netto in corrispondenza di 5 fattori e uno in corrispondenza di 8 fattori. % DI VARIANZA SPIEGATA: soluzione a 5 fattori: 56% soluzione a 8 fattori: 70% numero fattori scelti circa 1/3 delle variabili originarie

12 PROC FACTOR - Esempio Confrontiamo la soluzione a 5 e a 8 fattori. PROC FACTOR DATA=CORSO.TELEFONIA SCREE FUZZ=0.3 N=8; VAR elenco variabili; RUN; N.B. Quando nella PROC FACTOR non viene indicato il numero di fattori con l’opzione “N = “ SAS adotta la regola degli autovalori >1 per scegliere il numero di fattori. Consente di specificare il numero di fattori che si vuole estrarre

13 Output PROC FACTOR Factor Pattern F1F2F3F4F5F6F7F8 immagine_10.33.0.46....0.30 diffusione_10.31.0.70.0.33... copertura_1.0.360.430.41-0.33..-0.30 assistenza_10.440.310.33.-0.42... NoScattoRisp_10.53.....-0.45. CostoSMS_10.460.34.....0.57 CostoMMS_10.66-0.35...-0.31.. AccessoWeb_10.58-0.63...... NavigazioneWeb_10.58-0.64...... ChiamateTuoOperatore_10.590.43.0.34.... SMSTuoOperatore_10.540.37.0.31... MMSTuoOperatore_10.66...-0.31... vsPochiNumeri_10.43....0.48. NumeriFissi_10.51....... AltriOperatori_10.600.37...... Autoricarica_10.58....-0.41.. Promozioni_10.58....-0.32.. ChiarezzaTariffe_10.49..-0.30.-0.32.. ComodatoUso_10.51-0.36.-0.35.... DurataMinContratto_10.37-0.420.36..0.34.. CambioTariffa_10.53....... Values less than 0.3 are not printed. Analisi delle correlazioni tra fattori non ruotati e variabili (loadings)

14 Output PROC FACTOR COMUNALITA' FINALI Variabilen=5n=8 immagine_10.550.69 diffusione_10.750.79 copertura_10.620.73 assistenza_10.620.71 NoScattoRisp_10.370.59 CostoSMS_10.350.70 CostoMMS_10.690.79 AccessoWeb_10.780.83 NavigazioneWeb_10.770.82 ChiamateTuoOperatore_10.690.75 SMSTuoOperatore_10.620.74 MMSTuoOperatore_10.720.82 vsPochiNumeri_10.510.80 NumeriFissi_10.420.54 AltriOperatori_10.580.65 Autoricarica_10.410.62 Promozioni_10.450.59 ChiarezzaTariffe_10.460.60 ComodatoUso_10.550.68 DurataMinContratto_10.490.70 CambioTariffa_10.410.51 Totale11.8014.65 Analisi della % di varianza spiegata dai fattori (comunalità finali) Per ogni variabile si evidenziano le celle in corrispondenza delle quali la comunalità aumenta in maniera sostanziale per effetto dell’estrazione di un ulteriori fattori (dalla soluzione a 5 fattori alla soluzione a 8 fattori).

15 Interpretazione Una volta estratti, i fattori vanno interpretati. Una rotazione ortogonale nello spazio dei fattori non influenza la validità del modello: sfruttiamo questa caratteristica per ottenere dei fattori più facilmente interpretabili! Dobbiamo fare in modo che ognuna delle variabili originali sia molto correlata con al massimo un fattore e poco correlata con gli altri.

16 Metodi di rotazione La rotazione opera sulla matrice dei loadings. Esistono diversi metodi, tra cui: 1. METODO VARIMAX: minimizza il numero di variabili che hanno correlazioni alte con un fattore 2. METODO QUARTIMAX: minimizza il numero di fattori che hanno correlazioni alte con una variabile 3. METODO EQUIMAX: è una combinazione dei due metodi precedenti IMPORTANTE: la % di varianza complessiva dei fattori ruotati rimane inalterata, mentre si modifica la % di varianza spiegata da ciascun fattore

17 PROC FACTOR - Esempio Operiamo una rotazione dei fattori con il metodo Varimax. PROC FACTOR DATA=CORSO.TELEFONIA N=8 FUZZ=0.35 OUT=CORSO.FACTORS ROTATE=VARIMAX REORDER; VAR elenco variabili; RUN; Specifica che il criterio per la rotazione dei fattori Produce in output un data set che contiene le variabili originali e i fattori non ruotati Ordina le variabili in modo da facilitare la lettura dei loadings

18 Output PROC FACTOR Rotated Factor Pattern Factor1Factor2Factor3Factor4Factor5Factor6Factor7Factor8 CostoMMS_10.82....... MMSTuoOperatore_10.81....... AccessoWeb_10.77....... NavigazioneWeb_10.72....... ChiarezzaTariffe_1.0.69...... Promozioni_1.0.68...... Autoricarica_1.0.64...... NoScattoRisp_1..0.66..... AltriOperatori_1..0.620.35.... NumeriFissi_1..0.55..... ChiamateTuoOperatore_1..0.49.... CostoSMS_1...0.78.... SMSTuoOperatore_1...0.77.... DurataMinContratto_1....0.78... ComodatoUso_1....0.74... CambioTariffa_1....0.40... copertura_1.....0.83.. assistenza_1..0.36..0.52.-0.40 diffusione_1......0.78. immagine_1......0.76. vsPochiNumeri_1.......0.84 Values less than 0.35 are not printed.

19 Output PROC FACTOR Rotated Factor Pattern Factor1Factor2Factor3Factor4Factor5Factor6Factor7Factor8 CostoMMS_10.82....... MMSTuoOperatore_10.81....... AccessoWeb_10.77....... NavigazioneWeb_10.72....... ChiarezzaTariffe_1.0.69...... Promozioni_1.0.68...... Autoricarica_1.0.64...... NoScattoRisp_1..0.66..... AltriOperatori_1..0.620.35.... NumeriFissi_1..0.55..... ChiamateTuoOperatore_1..0.49.... CostoSMS_1...0.78.... SMSTuoOperatore_1...0.77.... DurataMinContratto_1....0.78... ComodatoUso_1....0.74... CambioTariffa_1....0.40... copertura_1.....0.83.. assistenza_1..0.36..0.52.-0.40 diffusione_1......0.78. immagine_1......0.76. vsPochiNumeri_1.......0.84 Values less than 0.35 are not printed. COSTI SECONDARI VANTAGGI COSTI CHIAMATE SMS CONDIZIONI CONTRATTUALI SERVIZI OPERATORE VALORE DEL BRAND VS POCHI NUMERI COSTI CHIAMATE SMS

20 Fattori Una volta scelta la soluzione ottimale, è possibile utilizzare i fattori ottenuti come nuove “macro-variabili” da inserire in ulteriori analisi sul fenomeno indagato, al posto delle variabili originarie; Nel file di dati si potranno aggiungere 8 nuove variabili: –Costi secondari, –Vantaggi, –Costi chiamate, –SMS, –Condizioni contrattuali, –Servizi Operatore, –Valore del Brand, –Vs pochi numeri. si tratta di variabili standardizzate (ovvero a media nulla e varianza unitaria),

21 PROC FACTOR – Opzioni PROC FACTOR DATA=CORSO.TELEFONIA N=8 FUZZ=0.35 SCREE OUT=CORSO.FACTORS ROTATE=VARIMAX REORDER; VAR elenco variabili; RUN; OPZIONEDESCRIZIONE OUT =datasetProduce in output un data set che contiene le variabili originali e i fattori non ruotati N=num Consente di specificare il numero di fattori che si vuole estrarre ROTATE=metodoSpecifica che il criterio per la rotazione dei fattori (VARIMAX, …) SCREEProduce scree plot REORDEROrdina le variabili in modo da facilitare la lettura dei loadings FUZZ=valoreStampa solo |loadings| > valore indicato. Analisi fattoriale con il metodo delle componenti principali.

22 Step di analisi (1/2) STEP 1: scegliere quanti fattori considerare (scelta di varie soluzioni)  la regola autovalori > 1  lettura dello SCREE PLOT  Circa 1/3 delle variabili originarie  Variabilità spiegata tra 60% e 75% STEP 2: confrontare le soluzioni scelte  cumunalità finali PROC FACTOR DATA=data set SCREE FUZZ=k; VAR elenco variabili; RUN; PROC FACTOR DATA=data set SCREE FUZZ=k N=n ; VAR elenco variabili; RUN;

23 Step di analisi (2/2) STEP 3: una volta scelta la soluzione finale  ruotare i fattori  interpretare i fattori  salvare il data set con i fattori STEP 4: se l’interpretazione non è soddisfacente ripetere lo step n°3 variando metodo di rotazione o provando un’altra soluzione. PROC FACTOR DATA=data set SCREE FUZZ=k OUT=data set output ROTATE= metodo di rotazione REORDER N=n ; VAR elenco variabili; RUN;

24 Analisi Fattoriale - Esercizio 2 Il data set ECONOMIC_FREEDOM contiene i seguenti indicatori relativi alla libertà economica nei diversi stati del mondo. Svolgere un’analisi fattoriale a partire da tali indicatori. COUNTRYNome del paese CONTINENTEAF-Africa; AM-America Nord; AS-Asia; OC-Oceania; EU-Europa A. Attività del settore pubblico e tassazione A_ GVT_CONSUMPT Consumi pubblici  Rapporto tra consumi pubblici e consume totali (indice) A_ GVT_INVEST Investimenti pubblici  Rapporto tra investimenti pubblici e investimenti totali (indice) B_JUD_IMPARTImparzialità delle corti: contesto legale in cui i privati possono opporsi legalmente ad azioni del governo. B_MILITARY_POLInterferenza militare nel sistema giudiziario e politico (indice elevato se l’interferenza è bassa) B_LAW_INTEGRITYIntegrità del sistema giudiziario C. Accesso al contante C_GR_MONEY_SUPPLY Crescita media annuale dell’offerta di moneta (ultimi 5 anni) ‑ Crescita media annuale PIL (ultimi 10 anni) C_INFLTasso di inflazione recente (indice alto se inflazione bassa) C_STD_INFLVariabilità del tasso di inflazione negli ultimi 5 anni. (indice alto se inflazione stabile) C_FREEDOM_BANKLibertà di possedere conti presso banche straniere nel paese o all’estero D. Commercio internazionale D_TARIFTasse sul commercio con l’estero (indice alto se tasse basse e poco variabili) D_ACTUAL_EXP_TRADEDimensione del settore del commercio internazionale rispetto a quella attesa D_INT_CAP_CONTROLLivello del controllo sul mercato dei capitali internazionali (indice elevato se è elevata la libertà di accesso ai capitali e ai mercati internazionali) E. Regolamentazi one del credito, del lavoro e del business E_CREDIT_REGRegolamentazione del mercato del credito (indice elevato se c’è concorrenza con banche straniere, se molte banche sono private, se il credito al settore privato è elevato, se i tassi di interesse sono determinati dal libero mercato) E_NEW_BUSINESSFaciltà e trasparenza nella realizzazione di nuovi business

25 Soluzione es 2 (1/7) PROC FACTOR DATA=CORSO.ECONOMIC_FREEDOM SCREE FUZZ=0.35 ; VAR A_GVT_CONSUMPT A_GVT_INVEST B_JUD_IMPART B_LAW_INTEGRITY B_MILITARY_POL C_FREEDOM_BANK C_GR_MONEY_SUPPLY C_INFL C_STD_INFL D_ACTUAL_EXP_TRADE D_INT_CAP_CONTROL D_TARIF E_CREDIT_REG E_NEW_BUSINESS ; RUN; Estrazione fattori:

26 Soluzione es 2 (2/7) La regola degli autovalori > 1 suggerisce di prendere in considerazione 3 fattori, che spiegano insieme il 63% della varianza totale. Lo scree plot mostra un gomito netto in corrispondenza di 2 fattori e uno ‘accennato’ in corrispondenza di 4 fattori. AUTOVALORI EigenvalueDifferenceProportionCumulative 15.74624.08290.4104 21.66330.28150.11880.5293 31.38180.39210.09870.6280 40.98980.18550.07070.6986 50.80430.09970.05740.7561 60.70460.09920.05030.8064 70.60530.11940.04320.8497 80.48590.05240.03470.8844 90.43350.09790.03100.9153 100.33560.07330.02400.9393 110.26230.00980.01870.9580 120.25250.05440.01800.9761 130.19810.06130.01420.9902 140.1368 0.00981.0000 Quanti fattori considerare? Fattori Autovalori

27 Soluzione es 2 (3/7) PROC FACTOR DATA=CORSO.ECONOMIC_FREEDOM SCREE FUZZ=0.35 N=2; VAR lista variabili; RUN; Estrazione fattori per la soluzione a 2 e a 4 fattori: PROC FACTOR DATA=CORSO.ECONOMIC_FREEDOM SCREE FUZZ=0.35 N=4; VAR lista variabili; RUN; N.B. La soluzione a 3 fattori l’abbiamo già estratta: quando nella PROC FACTOR non viene indicato il numero di fattori con l’opzione “N = “ SAS adotta la regola degli autovalori >1 per scegliere il numero di fattori.

28 Soluzione es 2 (4/7) Variable LOADINGSCUMUNALITA' Prin1Prin2Prin3Prin4n=2n=3n=4 A_GVT_CONSUMPT -0.73 0.31 0.530.620.72 A_GVT_INVEST 0.64 0.35 0.420.54 B_JUD_IMPART 0.79 -0.38 0.620.770.78 B_MILITARY_POL 0.8 0.65 0.66 B_LAW_INTEGRITY 0.8 0.640.670.69 C_GR_MONEY_SUPPLY 0.430.66 0.35 0.620.630.75 C_INFL 0.450.66 0.65 0.69 C_FREEDOM_BANK 0.6-0.450.46 0.560.770.83 C_STD_INFL 0.450.55 0.510.53 D_TARIF 0.69 0.510.58 D_ACTUAL_EXP_TRADE -0.720.38 0.070.580.73 D_INT_CAP_CONTROL 0.65-0.4 0.41 0.590.650.82 E_CREDIT_REG 0.65 -0.54 0.420.450.74 E_NEW_BUSINESS 0.78 0.630.700.73 La soluzione a 2 fattori non fornisce una spiegazione adeguata di alcune variabili: tali variabili hanno probabilmente un alto contenuto di specificità. La soluzione a 4 sarebbe motivata dal recupero di capacità esplicativa solo su un paio di variabili. Inoltre per ogni variabile la % di varianza spiegata dati fattori è già soddisfacente e non aumenta in maniera sostanziale per effetto dell’estrazione del quarto fattore. Per ogni variabile si evidenziano le celle in corrispon- denza delle quali la comunalità aumenta in maniera sostanziale per effetto dell’estra- zione di un ulteriore fattore.

29 Soluzione es 2 (5/7) PROC FACTOR DATA=CORSO.ECONOMIC_FREEDOM OUT=CORSO.FACTORS N=3 ROTATE=VARIMAX REORDER FUZZ=0.35; VAR lista variabili; RUN; Consideriamo la soluzione a 3 fattori e operiamo una rotazione dei fattori con il metodo Varimax. IMPORTANTE:la % di varianza complessiva dei fattori ruotati rimane inalterata, mentre si modifica la % di varianza spiegata da ciascun fattore

30 Soluzione es 2 (6/7) VariabileDescrizioneFactor1Factor2Factor3 C_FREEDOM_BANKLibertà conti c/o banche stran. o estero0.87 D_INT_CAP_CONTROLLibertà di accesso a cap. e mkt internaz.0.77 D_TARIFBasse tasse su comm. con estero0.71 A_GVT_INVESTInvestimenti pubblici0.62 0.39 B_MILITARY_POLBassa Interf. militare0.580.52 E_CREDIT_REGRegolament. mkt credito0.54 B_JUD_IMPARTImparzialità delle corti 0.76 E_NEW_BUSINESSFaciltà realizz. newbusiness0.440.69 D_ACTUAL_EXP_TRADEDim. settore comm. internaz. 0.69 B_LAW_INTEGRITYIntegrità sist. giudiz.0.440.61 A_GVT_CONSUMPTConsumi pubblici -0.66 C_INFLBassa infl. recente 0.79 C_GR_MONEY_SUPPLYCrescita offerta di moneta 0.78 C_STD_INFLBassa variab. tasso infl. 0.7 LIBERTA’ DI CAPITALI LIBERTA’ DI BUSINESS MONETA Interpretazione fattori: Estraendo 3 fattori riusciamo a spiegare il 63% della varianza totale.

31 Soluzione es 2 (7/7) Varianza spiegata da ciascun fattore Totale Factor1Factor2Factor3 5.751.661.38 8.79 Varianza spiegata dai fattori: La % di varianza complessiva dei fattori ruotati rimane inalterata, mentre si modifica la % di varianza spiegata da ciascun fattore Varianza spiegata da ciascun fattore Totale Factor1Factor2Factor3 3.552.832.41 8.79 PRIMA DELLA ROTAZIONE DOPO LA ROTAZIONE


Scaricare ppt "Analisi fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°9."

Presentazioni simili


Annunci Google