1 Corso di Laurea magistrale in Psicologia Clinica, dello Sviluppo e Neuropsicologia Esame di Analisi Multivariata dei Dati Introduzione all’analisi fattoriale. A cura di Matteo Forgiarini
2 Utilizziamo nuovamente il file Adjective.sav per approfondire l’analisi della soluzione ottenuta. Utilizzando il metodo dell’ACP si ottiene una soluzione iniziale con 5 componenti che permettono di spiegare il 41% della varianza delle 25 variabili ossevate. Il modello appare adeguato: per parsimonia della soluzione (cfr. analisi del grafico degli autovalori) da un punto di vista teorico è coerente con le ipotesi iniziali sulla numerosità dei fattori. Il passaggio successivo è l’interpretazione dei fattori, ovvero l’attribuzione di un significato alle dimensioni latenti individuate.
3 Il significato delle dimensioni latenti viene attribuito sulla base delle saturazioni che tali dimensioni presentano con le variabili osservate. Infatti se una componente ha una saturazione molto elevata (circa 1) con una variabile e le altre saturazioni sono molto basse, è possibile ipotizzare che tale dimensione abbia lo stesso contenuto - lo stesso significato - della V.O. massimamente spiegata. Tuttavia le soluzioni iniziali ottenute con il metodo della PCA presentano spesso per ogni fattore saturazioni elevate per molte variabili: le componenti sono infatti estratte con lo scopo di massimizzare tutte le saturazioni. Occore quindi ruotare la soluzione ottenuta con lo scopo di ottenere una soluzione semplice, ovvero una soluzione che presenti saturazioni vicine a 0 o a 1: ogni variable sarà quindi spiegata possibilmente da un solo fattore e vi sarà un numero minimo di variabili con saturazioni elevate con più di un fattore. Esistono due tipi di rotazioni: quelle ortogonali e quelle oblique. Le prime mantengono l’ortogonalità delle componenti della soluzione iniziale; le rotazioni oblique al contrario pruducono una soluzione in cui le compomenti sono tra loro correlate.
4 Il metodo Varimax, mantenendo l’ortogonalità delle componenti, ruota la soluzione massimizzando la varianza delle saturazioni delle componenti: ovvero la soluzione massimizza la seguente sommatoria Dove n = numero di variabili e a ij = saturazione della variabile i per la componente j. Ovvero... Il metodo Varimax ruota la soluzione massimizzando la varianza delle colonne della component matrix. Rotazioni ortogonali
5 Selezioniamo inizialmente Varimax come metodo di rotazione.
6 Dopo la rotazione la varianza totale spiegata dalle 5 component rimane invariata; al contrario i singoli autovalori delle componenti cambiano poichè cambiano le saturazioni delle variabili; la loro somma rimane però costante. Tot=10,289
7 Massimizzando la varianza delle colonne della component matrix, la rotazione varimax produce poche saturazioni elevate per ogni componente e permette di discriminare con precisione i gruppi di variabili che afferiscono alla medesima componente. Le 5 variabili con le saturazioni più elevate permettono di interpretare le componenti e attibuire loro un significato.
8 Rotazioni oblique Le rotazioni oblique permettono di ruotare la soluzione senza mantenere l’ortogonalità degli assi; l’angolo tra le dimensioni può essere quindi variato per massimizzare la semplicità della soluzione. Selezionaimo la rotazione Oblimin e aumentiamo le iterazioni dell’algoritmo fino a 100.
9 Nelle rotazioni in cui i fattori sono correlati, il contributo unico di ogni fattore sulle variabili non coincide con le correlazioni tra fattore e variabile; infatti come nella retta di regressione multipla, le correlazioni tra i fattori e variabili risultano gonfiate in quanto al contributo unico sulla variabile si sommano i contributi condivisi tra più fattori. Pertanto nelle soluzioni oblique – oltre alla component matrix riferita alla soluzione iniziale non ruotata – vengono prodotte due distinte matrici: la Pattern matrix contiene i contributi unici tra fattore e variabile. la Structure Matrix contiene le correlazioni fattore-variabile. Per l’analisi della soluzione analizziamo la pattern matrix in quanto contiene le vere stime dei legami fattore-variabili.
10 Con la rotazione vengono ricalcolati gli autovalori in quanto la comunalità delle V.O. viene ridistribuita tra le componenti per massimizzare la semplicità della soluzione.
11 La pattern matrix contiene i contributi unici delle componenti alla spiegazione delle variabili. Le saturazioni più elevate per ogni componente permettono di interpretare la componente stessa e attribuirle un significato semantico.
12 La matrice di correlazioni tra le componenti contiene le correlazioni tra le componenti dopo che la soluzione è stata ruotata; le differenti correlazioni tra le coppie di componenti evidenziano come il metodo oblimin ruoti la soluzione in modo non rigido e non conservi l’ortogonalità delle componenti. Correlazioni=0 indicano che due componenti sono ortogonali; Correlazioni=1 indicano che due componenti sono coincidenti e dunque l’angolo compreso tra esse è 0; Valori intermedi indicano angoli acuti tra le due componenti. Notiamo che i valori delle correlazioni tra le componenti sono molto basse, tutte <0.2; pertanto una soluzione ortogonale appare più adeguata per questo modello.
13 L’analisi fattoriale permette di posizionare le variabili osservate in uno spazio n-dimandionale con n pari al numero di fattori estratti; Le coordinate di ciascun punto, ciascuna variabile, sono le correlazioni parziali fattore-variabile contenute nella pattern matrix. Ruotando la soluzione vengono cambiate le coordinate delle variabili in modo tale che siano massimamanete vicine agli assi.