L’ANALISI IN COMPONENTI PRINCIPALI L’Analisi in Componenti Principali è una tecnica fattoriale. Ciò significa che: essendo una tecnica e non un modello, si muove essenzialmente su un versante esplorativo; essendo una tecnica fattoriale, prevede l’analisi di fattori o dimensioni latenti L’ACP non è l’unica tecnica fattoriale esistente. Ad essa si possono aggiungere l’analisi dei fattori comuni, il metodo dei minimi quadrati generalizzati e la massima verosimiglianza. Analisi in componenti principali
I passaggi essenziali Standardizzare le variabili (es: descriptives /variables qi_mate to creativi /options 3.) Scegliere il numero di fattori (o componenti) da estrarre (a meno che non si voglia compiere questa operazione dopo avere analizzato l’output) Decidere se ed eventualmente a quale tipo di rotazione sottoporre i fattori Scartare le variabili che mostrano bassi valori di comunalità e che tendono a non saturare alcuna componente Ripetere l’ACP nel caso in cui si vada alla ricerca di soluzioni più convincenti Verificare le correlazioni tra i fattori estratti ed eventualmente variare la tecnica di rotazione dei fattori Ripetere l’analisi fino a quando non si trova una soluzione teoricamente soddisfacente Analisi in componenti principali
Glossario Matrice di correlazione. Riporta tutti i coefficienti di correlazione di un gruppo di variabili tra loro. È proprio questa matrice che viene analizzata e semplificata attraverso l’analisi fattoriale. Fattore. Corrisponde ad una dimensione o costrutto non misurabile direttamente (quindi latente) che riassume le relazioni tra un insieme di variabili originarie, che sono state misurate e delle quali si conosce la matrice di correlazione. Saturazione fattoriale. La saturazione è il coefficiente che esprime solitamente la correlazione tra una variabile originaria misurata ed il fattore. Elevando la saturazione fattoriale al quadrato otteniamo la porzione di varianza della variabile spiegata dal fattore. Auto yalore. La somma dei quadrati delle saturazioni delle variabili costituenti un fattore è uguale all’autovalore (o radice caratteristica) associato al fattore; l’autovalore diviso per il numero delle variabili costituenti un fattore è uguale alla proporzione di varianza totale spiegata dal fattore. Ogni fattore estratto ha un autovalore corrispondente. Nell’analisi delle componenti principali il primo fattore estratto è quello che ha l’autovalore più grande, ossia è il fattore che spiega la porzione maggiore di varianza dei dati rispetto agli altri fattori. Comunaiità Indica la proporzione di varianza della variabile spiegata dai fattori, calcolata elevando al quadrato la somma delle saturazioni fattorialì della variabile su tutti i fattori estratti. Valori di comunalità inferiori a 0,25 devono metterci in guardia rispetto al possibile uso di quelle determinate variabili che li producono. Analisi in componenti principali
Fattori con autovalore maggiore di 1 Operazioni preliminari: criteri per decidere il numero di fattori da estrarre Teorico Fattori con autovalore maggiore di 1 Uso dello scree-test, ovvero salti nell’entità degli autovalori Analisi in componenti principali
Operazioni preliminari: l’analisi delle correlazioni tra variabili A questo punto ha inizio l'analisi in componenti principali vera e propria. Per accertarsi della possibilità di applicare ragionevolmente questa tecnica di analisi multi-dimensionale, è indispensabile che il ricercatore analizzi preliminarmente la matrice delle correlazioni. Il comando è il seguente: factor /variables [var A] to [var Z] /print correlation. Analisi in componenti principali
Operazioni preliminari: testare la matrice Ulteriori test che risultano utili, anche se non indispensabili, al ricercatore, sono quello di Kaiser-Meyer e Olkin (KMO) e il test di sfericità di Bartlett. Il primo si basa sul coefficiente di correlazione parziale. Se la variabile partecipa al fattore comune, una volta tolti gli effetti lineari delle altre variabili, ci sarà una bassa correlazione tra coppie di variabili. La correlazione parziale stima la correlazione con il fattore unico, che in teoria non è correlato con le altre variabili. Un piccolo valore per la correlazione parziale è quindi appropriato per confermare gli assunti di base dell'analisi. Il valore negativo dei coefficienti di correlazione parziale forma l'anti-immagine della matrice di correlazione (AIC). Se la proporzione di coefficienti alti è grande, va riconsiderata la possibilità di adottare l'analisi fattoriale su quei dati. Valori buoni o discreti per KMO sono maggiori di 0,60. Valori inferiori a 0.50 sono inaccettabili. factor /variables [var A] to [var Z] /print kmo aic. Analisi in componenti principali
Metodi di rotazione dei fattori Esistono essenzialmente due famiglie di metodi: quelli che rendono ortogonali (cioè non correlate) le componenti e quelli che le rendono oblique. I primi hanno il suffisso in –max, i secondi il prefisso in obli-. I più usati metodi di rotazione dei fattori sono: Varimax, rotazione ortogonale che messimizza la somma delle varianze mantenendo i fattori tra loro non correlati (ortogonali, appunto) Oblimin, in cui gli assi non sono ortogonali, ma correlati tra loro. Le variabili in questo modo hanno tute saturazioni vicine allo 0 in tutti i fattori, tranne uno. Analisi in componenti principali
Il senso della rotazione dei fattori Analisi in componenti principali
Autovalori, autovettori, comunalità Variabile I autovettore II autovettore III autovettore IV autovettore V autovettore Somma per riga (comunalità) X1 .473 .065 .426 .033 .003 1 X2 .457 .237 .213 .092 .000 X3 .659 .123 .004 .001 X4 .814 .134 .052 X5 .576 .365 .024 .002 I autovalore II autovalore III autovalore IV autovalore V autovalore Varianza totale Somma per colonna = autovalore 2.979 0.924 0.668 0.340 0.089 5 Analisi in componenti principali
Autovalori, autovettori, comunalità Variabile I autovettore II autovettore Somma per riga (comunalità) X1 0,473 0,065 0,538 X2 0,457 0,237 0,694 X3 0,659 0,123 0,782 X4 0,814 0,134 0,948 X5 0,576 0,365 0,941 I autovalore II autovalore Varianza totale Somma per colonna = autovalore 2.979 0.924 5 Analisi in componenti principali
Fasi successive, 1 A questo punto ha inizio l'estrazione dei fattori vera e propria. Il comando è il seguente: factor /variables [var A] … [var Z]. Per assicurarsi che qualche fattore, con autovalore inferiore ad 1, non possa servirci per l'analisi, è ragionevole verificare il contributo dei diversi fattori attraverso l'analisi grafica. factor /variables [var A] … [var Z]/plot eigen. Ottenuta la conferma circa l'estrazione dei fattori attraverso l'analisi grafica, si passa quindi a vedere in quale misura ciascuna variabile contribuisce alla formazione di ognuno degli N fattori. Analisi in componenti principali
Fasi successive, 2 L'interpretazione dei fattori può essere favorita da uno dei 4 metodi di rotazione degli assi. I comandi possono essere dati contemporaneamente, con questo comando: factor /variables [var a] … [var z] / extract pc / rotation varimax / plot=rotaton(1,2) / rotation quartimax / plot=rotaton(1,2) / rotation equamax / plot=rotaton(1,2) / rotation oblimin / plot=rotaton(1,2) / rotation norotate / plot=rotaton(1,2). Per visualizzare meglio i contributi forniti da ciascuna variabile ad ognuno degli N fattori, si può richiedere al calcolatore di fornire un output che presenti soltanto i valori che superano una determinata soglia, che può essere posta a 0,5. Infine, le variabili originarie sintetizzate negli N fattori possono essere sostituite, per ciascun caso, dai pesi fattoriali ottenuti da ognuna delle cinque componenti. Questi pesi resteranno attivi per tutte le operazioni successive, tramite il comando: factor /variables [var a] … [var z] / criteria factor (5) /save bart (all pf). Analisi in componenti principali