Analisi delle componenti principali Corso di Laurea magistrale in PCSN Esame di Analisi Multivariata dei Dati Analisi delle componenti principali A cura di Matteo Forgiarini Modifiche di Giulio Costantini
Analisi delle componenti principali Tecnica di analisi multivariata solitamente impiegata per estrarre un numero di fattori (variabili latenti) da un set di variabili osservate (es. item). In questo modo è possibile da descrivere insiemi di variabili anche molto grandi con un numero molto ridotto di elementi. Variabili osservate che correlano molto tra loro possono essere riassunte da un fattore, variabili che non correlano tra loro faranno probabilmente parte di fattori differenti.
Step dell’analisi delle componenti principali Scelta del numero di fattori: Mineigen / Autovalore > 1 Scree-test (in SPSS: grafico decrescente degli autovalori) Interpretabilità dei fattori (ma solo DOPO aver scelto il tipo di rotazione) Rotazione obliqua (oblimin) o ortogonale (varimax): Se si estrae più di un fattore, bisogna ruotare la struttura. Prima rotazione oblimin. Esaminare le correlazioni tra fattori. Se almeno una è > .20 in valore assoluto, mantenere obliqua, altrimenti passare a varimax. Interpretazione dei fattori: esaminare la struttura ruotata. Se rotazione obliqua, usare matrice dei modelli. Eventuale eliminazione di item che non saturano chiaramente su nessun fattore (es. nessuna saturazione > |.35|) o che hanno saturazioni multiple senza che nessuna sia molto più alta degli altri. Salvataggio punteggi fattoriali e utilizzo per analisi successive
Utilizziamo il file “Adjective list”. Il file contiene i dati relativi ad una ricerca effettuata per identificare 5 tratti di personalità mediante un questionario auto-compilato; il questionario è stato strutturato con lo scopo di raccogliere i punteggi su una scala da 0 a 10 indicanti, relativamente alle qualità espresse da ogni aggettivo, il possesso che i soggetti si riconoscono di tali qualità. Scopo della ricerca è quindi individuare le dimensioni latenti sottostanti – i fattori – che semplificano, riassumono e permettono di spiegare i punteggi osservati sulle 25 variabili. Il questionario è stato sottoposto a 300 soggetti; il file risulta quindi formato da una matrice 300 X 25: ogni riga contiene i punteggi di un soggetto per tutte le 25 variabili. Ogni colonna contiene i punteggi di una variabile per tutti i 300 soggetti. La variabile genere discrimina i soggetti maschi (1) dai soggetti di genere femminile (0).
In SPSS Analizza > Riduzione delle dimensioni > Fattoriale
Scheda Estrazione Permette di scegliere il tipo di analisi (in questo caso, ACP), il numero di fattori da estrarre (si inizia sempre con Autovalore > 1) e permette di richiedere lo scree-test. Se il modello non converge, aumentare le iterazioni
Scheda Rotazione Permette di scegliere il tipo di rotazione. Dopo aver scelto il numero dei fattori, Se si è scelto 1 solo fattore, non ruotare. Se più fattori, iniziare con Oblimin. Se le correlazioni tra fattori sono tutte < |.20| passare a varimax. Se la rotazione oblimin non converge, aumentare le iterazioni
Scheda Punteggi Se si intende usare i punteggi fattoriali per altre analisi, la finestra punteggi permette di salvarli (flaggare «salva come variabili», lasciare pure il metodo «regressione» di default)
Scheda Opzioni Alcune opzioni comode che permettono per esempio di ordinare le variabili nelle matrici di saturazione fattoriale a seconda del fattore su cui saturano di più («ordinati per dimensioni») e di nascondere i coefficienti piccoli (es. < |.10|) per facilitarne la lettura.
Output
Comunalità Porzione della variabilità di ciascuna variabile spiegata da ogni fattore
Ordine di estrazione delle componenti Valori degli autovalori estratti per ogni componente % della varianza spiegata da ogni componente rispetto alla varianza totale delle 25 variabili. λ1=3.062; varianza totale osservata= =25 X 1=25; proporzione di varianza spiegata da λ1=3.062/25=0.1224 % di varianza spiegata da λ1=0.1224 X 100=12.24. Si noti che le 25 componenti complessivamente spiegano il 100% della varianza delle variabili osservate. La somma degli autovalori è quindi pari a 25. 12
Scree-plot Semplicemente il grafico degli autovalori presentati nella tabella precedente
Matrice delle saturazioni fattoriali (non ruotate)
Scelta del numero dei fattori Mineigen: 8 fattori con autovalore > 1. Non considereremo più di 8 fattori in nessun caso
Scelta del numero dei fattori - Scree-test Tracciamo una retta interpolante i peggiori autovalori. I fattori associati agli autovalori sovrastanti la retta sono i fattori da tenere. Lo scree-test suggerisce 5 fattori.
Scegliamo di esaminare una soluzione a 5 fattori Ripetere l’analisi con 5 fattori e scegliere il tipo di rotazione
Complessivamente le 5 componenti spiegano il 41,15% della varianza osservata.
Correlazione tra componenti ruotate Nessuna correlazione > |.20|, ripetiamo l’analisi con rotazione varimax
Interpretazione dei fattori – matrice dei componenti ruotati
Alcuni item hanno saturazioni su più fattori.
Esercizio Elimina le variabili che saturano su più fattori e ripeti l’analisi fattoriale Salva i punteggi fattoriali ed esamina se differiscono a seconda del genere
Esercizio The HEXACO-60 is a short 60-items inventory that assesses six major dimensions of personality: honesty–humility, emotionality, extraversion, agreeableness vs. anger, conscientiousness and openness to experience ( Ashton & Lee, 2007). Each of the major dimensions subsumes four facets, which can be computed as the average of two or three items. Participants indicated their agreement with each statement on a scale from 1 (strongly disagree) to 5 (strongly agree). (Costantini et al., 2015; http://www.sciencedirect.com/science/article/pii/S0092656614000701 ) Apri il file HEXACOfacets.sav che contiene i punteggi su 24 sfaccettature dell’HEXACO Svolgi un’analisi delle componenti principali.
Variabile Dimensione Facet Hsi Honesty–humility Sincerity Hfa Fairness Hga Greed-avoidance Hmo Modesty Efe Emotionality Fearfulness Ean Anxiety Ede Dependence Ese Sentimentality Xss Extraversion Social self-esteem Xsb Social boldness Xso Sociability Xli Liveliness Afo Agreeableness vs, anger Forgiveness Age Gentleness Afl Flexibility Apa Patience Cor Conscientiousness Organization Cdi Diligence Cpe Perfectionism Cpr Prudence Oaa Openness to experience Aesthetic appreciation Oin Inquisitiveness Ocr Creativity Oun Unconventionality