AMD2017 - Esercitazione 7 Giulio Costantini
Analisi delle componenti principali Tecnica di analisi multivariata solitamente impiegata per estrarre un numero di fattori (variabili latenti) da un set di variabili osservate (es. item). In questo modo è possibile da descrivere insiemi di variabili anche molto grandi con un numero molto ridotto di elementi. Variabili osservate che correlano molto tra loro possono essere riassunte da un fattore, variabili che non correlano tra loro faranno probabilmente parte di fattori differenti.
Step dell’analisi delle componenti principali Scelta del modello fattoriale: ACP o AFC. Noi vediamo solo ACP. Scelta del numero di fattori: Mineigen / Autovalore > 1 / Kaiser-Guttman Scree-test (in SPSS: grafico decrescente degli autovalori) Analisi Parallela (vedremo come farla usando una sintassi di SPSS già pronta; https://people.ok.ubc.ca/brioconn/nfactors/nfactors.html) Interpretabilità dei fattori (ma solo DOPO aver scelto il tipo di rotazione) Rotazione obliqua (oblimin) o ortogonale (varimax): Se si estrae più di un fattore, bisogna ruotare la struttura. Prima rotazione oblimin. Esaminare le correlazioni tra fattori. Se almeno una è > .20 in valore assoluto, mantenere obliqua, altrimenti passare a varimax. Interpretazione dei fattori: esaminare la struttura ruotata. Se rotazione obliqua, usare matrice dei modelli. Eventuale eliminazione di item che non saturano chiaramente su nessun fattore (es. nessuna saturazione > |.35|) o che hanno saturazioni multiple senza che nessuna sia molto più alta degli altri. Questo passaggio si fa soprattutto se l’obiettivo è la costruzione/validazione di un nuovo questionario. Salvataggio punteggi fattoriali e utilizzo per analisi successive. Per es. per svolgere un’ACP gerarchica, basterà salvare i punteggi fattoriali (rotazione obliqua) e usarli come input per una nuova ACP
Esercizio 1 Utilizziamo il file «Adjective_list.sav». Il file contiene i dati relativi ad una ricerca effettuata per identificare 5 tratti di personalità mediante un questionario auto-compilato; il questionario è stato strutturato con lo scopo di raccogliere i punteggi su una scala da 0 a 10 indicanti, relativamente alle qualità espresse da ogni aggettivo, il possesso che i soggetti si riconoscono di tali qualità. Scopo della ricerca è quindi individuare le dimensioni latenti sottostanti – i fattori – che semplificano, riassumono e permettono di spiegare i punteggi osservati sulle 25 variabili. Il questionario è stato sottoposto a 300 soggetti; il file risulta quindi formato da una matrice 300 X 25: ogni riga contiene i punteggi di un soggetto per tutte le 25 variabili. Ogni colonna contiene i punteggi di una variabile per tutti i 300 soggetti. La variabile genere discrimina i soggetti maschi (1) dai soggetti di genere femminile (0).
Scelta numero fattori
Analizza > Riduzione delle dimensioni > Fattoriale
Scheda Estrazione Permette di scegliere il tipo di analisi (in questo caso, ACP), il numero di fattori da estrarre (si inizia sempre con Autovalore > 1) e permette di richiedere lo scree-test. Se il modello non converge, aumentare il «numero massimo di iterazioni per la convergenza».
Scheda Rotazione Permette di scegliere il tipo di rotazione. Dopo aver scelto il numero dei fattori, Se si è scelto 1 solo fattore, non ruotare. Se più fattori, iniziare con Oblimin. Se le correlazioni tra fattori sono tutte < |.20| passare a varimax. Se la rotazione oblimin non converge, aumentare le iterazioni
Scheda punteggi Se si intende usare i punteggi fattoriali per altre analisi, la finestra punteggi permette di salvarli (flaggare «salva come variabili», lasciare pure il metodo «regressione» di default).
Scheda opzioni Alcune opzioni comode che permettono per esempio di ordinare le variabili nelle matrici di saturazione fattoriale a seconda del fattore su cui saturano di più («ordinati per dimensioni») e di nascondere i coefficienti piccoli (es. < |.20|) per facilitarne la lettura.
Output: Comunalità Porzione della variabilità di ciascuna variabile spiegata da ogni fattore. Matrice riassuntiva, non serve per nessuno degli step descritti sopra.
Ordine di estrazione delle componenti Valori degli autovalori estratti per ogni componente % della varianza spiegata da ogni componente rispetto alla varianza totale delle 25 variabili. λ1=3.062; varianza totale osservata= =25 X 1=25; proporzione di varianza spiegata da λ1=3.062/25=0.1224 % di varianza spiegata da λ1=0.1224 X 100=12.24. Il criterio Mineigen suggerisce di non selezionare più di 8 fattori Si noti che le 25 componenti complessivamente spiegano il 100% della varianza delle variabili osservate. La somma degli autovalori è quindi pari a 25.
Scree-plot Semplicemente il grafico degli autovalori presentati nella tabella precedente. Un esame visivo dello scree-plot suggerisce cinque fattori.
Analisi parallela (1) Aprite la sintassi parallel.sps Sintassi sviluppata da O’Connor. Reference: O'Connor, B. P. (2000). SPSS and SAS programs for determining the number of components using parallel analysis and Velicer's MAP test.Behavior Research Methods, Instrumentation, and Computers, 32, 396-402.
Analsi Parallela (2) Per svolgre l’analisi parallela bisogna sapere: Quanti casi/soggetti abbiamo (ncases): in questo caso 300 Quante variabili abbiamo (nvars): in questo caso 25 Quanti dataset vogliamo simulare: possiamo lasciare il default, 100 Quale percentile della distribuzione casuale vogliamo usare. Possiamo lasciare il default, 95. Che tipo di analisi vogliamo svolgere, se ACP (kind = 1) o AFC (kind = 2). L’ACP va sempre bene, anche se si fa AFC, quindi scegliamo kind = 1.
Analisi Parallela (3) Ci ricorda che abbiamo scelto ACP (principal components) Ci ricorda i nostri settaggi: Ncases (numero di casi) = 300, Nvars (numero di variabili) = 25, Ndatasets (numero di dataset casuali) = 100, Percent (il percentile dei valori usato come criterio) = 95. Qui abbiamo gli autovalori estratti dai dati casuali (riporto solo i primi 12). Root = numero del fattore. Means = media dell’autovalore. Prcntyle = 95°percentile degli autovalori estratti dai dati casuali.
Analisi parallela (4) Per scegliere il numero di fattori, confronto gli autovalori estratti dai dati reali con quelli estratti dai dati casuali, uno ad uno. Tengo i fattori fino a quando uno degli autovalori reali è più basso del corrispondente autovalore casuale. Se un fattore spiega meno del suo omologo causale, non ha senso tenerlo. Posso scegliere se fare il confronto con la media degli autovalori causali (Means) o con il 95° percentile (Prcntyle), basta esplicitarlo chiaramente. In questo caso, entrambi i criteri suggeriscono di tenere 5 fattori, perché il sesto spiega meno del suo omologo casuale.
Riassunto scelta numero fattori Scelta del numero di fattori: Mineigen: MAX 8 fattori Scree-test : 5 fattori Analisi Parallela: 5 fattori Interpretabilità dei fattori (ma solo DOPO aver scelto il tipo di rotazione): vedremo dopo come interpretarli, se non dovessero essere interpretabili potremmo selezionare strutture differenti. Il criteiro Mineigen suggerisce di considerare al massiumo 8 fattori. Noi esaminiamo una soluzione a 5 fattori, come suggerito dallo Scree test e dall’analisi parallela.
Scelta rotazione
Ripeto l’analisi con le seguenti modifiche: Nella scheda estrazione, specifico che voglio estrarre esattamente 5 fattori. Nella scheda rotazione, specifico una rotazione obliqua, «oblimin diretto».
Varianza totale spiegata Le cinque componenti estratte spiegano il 41.157% della varianza totale.
Scegliere la rotazione Nessuna correlazione > .20 in valore assoluto, ripetiamo l’analisi con rotazione Varimax
Interpretazione dei fattori
Interpretazione Se rotazione ortogonale, esamino matrice dei componenti ruotati. Se rotazione obliqua, esamino matrice dei modelli (NON matrice di struttura) Come potremmo interpretare i fattori emersi?
Interpretazione Riproducono i «Big Five», sebbene alcuni fattori siano più rappresentati di altri 1 = Coscienziosità 2 = estroversione 3 = Stabilità emotiva 4 = Apertura all’esperienza 5 = Gradevolezza Alcuni item saturano su più fattori, potremmo considerare di eliminarli. Per farlo dovremmo ripetere l’intera analisi senza questi due fattori.
Utilizzo dei punteggi fattoriali per analisi successive
Esercizio Esaminare se i punteggi nei 5 fattori differiscono per genere.
Salvare i punteggi fattoriali Nella scheda punteggi, flaggare «salva come variabili». Ripetere l’analisi. Questa volta nel file di dati saranno generate cinque nuove variabili, ciascuna indicante il punteggio di ciascun soggetto su ciascuno dei cinque fattori.
Svolgere I t-test Analizza > confronta medie > t test per campioni indipendenti. La variabile indipendente è il genere (0 = Fem 1 = Mas), le variabili dipendenti sono I 5 fattori emersi dall’analisi precedente
Per i fattori 1 e 3, il test di Levene è significativo, quindi dobbiamo guardare il t-test corretto per varianze non uguali; per gli altri fattori, guardiamo la prima riga (varianze uguali presunte) I t-test indicano che c’è una differenza tra maschi e femmine per i fattori 1 (Coscienziosità) e 3 (stabilità emotiva), ma non per gli altri fattori.
Uno sguardo alle medie rivela che le femmine hanno un valore più basso di coscienziosità e un valore più alto di stabilità emotiva rispetto ai maschi.
Esercizio per casa L’HEXACO-60 è un breve questionario di 60 item che valuta 6 dimensioni di personalità: onestà-umiltà, Emotività, estroversione, gradevolezza vs. rabbia, coscienziosità e apertura all’esperienza (Ashton & Lee 2007). Ciascuna di queste sei dimensioni è misurata tramite quattro «sfaccettature», che risultano dalla media di due o tre item ciascuna. In totale quindi ci sono 24 sfaccettature. Nel file HEXACOfacet.sav (tratto da Costantini et al., 2015) sono contenuti i punteggi di ciascuna sfaccettatura per 964 casi. Svolgi un’analisi fattoriale. Nella pagina successiva, è disponibile una descrizione di ciascuna sfaccettatura.
Variabile Dimensione Sfaccettatura Hsi Onestà-umiltà Sincerity Hfa Fairness Hga Greed-avoidance Hmo Modesty Efe Emotività Fearfulness Ean Anxiety Ede Dependence Ese Sentimentality Xss Estroversione Social self-esteem Xsb Social boldness Xso Sociability Xli Liveliness Afo Gradevolezza vs. rabbia Forgiveness Age Gentleness Afl Flexibility Apa Patience Cor Coscienziosità Organization Cdi Diligence Cpe Perfectionism Cpr Prudence Oaa Apertura all’esperienza Aesthetic appreciation Oin Inquisitiveness Ocr Creativity Oun Unconventionality
Scelta # fattori Il criterio mineigen suggerisce max 6 fattori, così come lo scree test
Analsi parallela Anche l’analsi parallela suggerisce 6 fattori, poiché l’autovalore del 7° fattore (0.856) è il primo ad essere inferiore alla media di quello estratto da dati casuali (1.11)
Rotazione Poiché in seguito ad un’analisi con rotazione oblimin emerge una correlazione tra fattori maggiore di 0.20 in valore assoluto (-.228 tra il 1° e il 6°) fattore, scelgo una rotazione oblimin
Interpretazione I sei fattori estratti riproducono molto chiaramente la struttura attesa: Apertura all’esperienza, emozionalità, gradevolezza vs. rabbia, estroversione, coscienziosità, onestà-umiltà L’unica sfaccettatura lievemente problematica è Xss, che satura non solo sul fattore 4 (estroversione), ma anche in modo negativo sul fattore 2 (emozionalità).