AMD2017 - Esercitazione 7 Giulio Costantini.

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE L’analisi Fattoriale.
Advertisements

L’Analisi Fattoriale (PCA) con SPSS
Analisi Fattoriale Tecnica utilizzata per studiare, riassumere e semplificare le relazioni in un insieme di variabili.
Dall’analisi Fattoriale alla regressione lineare
ANALISI FATTORIALE. Cosè lanalisi fattoriale? Statistica descrittiva Rappresentazione delle variabili in studio. Statistica confermativa vs Confermare,
L’ANALISI IN COMPONENTI PRINCIPALI
Esame di Analisi Multivariata dei Dati
1 Corso di Laurea magistrale in Psicologia Clinica, dello Sviluppo e Neuropsicologia Esame di Analisi Multivariata dei Dati Introduzione all’analisi fattoriale.
1 Principali analisi statistiche 1. Confronto fra medie (2 o piú campioni) 2. Correlazione e regressione 3. Analisi di tabelle di contigenza Variabile.
Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.
Disegni di Ricerca e Analisi dei Dati in Psicologia.
Rappresentazioni grafiche di una distribuzione di frequenze 1)Istogramma e poligono delle frequenze ● Dati raggruppati in classi ● Costituito da un insieme.
Indici di Posizione Giulio Vidotto Raffaele Cioffi.
Consentono di descrivere la variabilità all’interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche.
Il metodo STATIS (L’Hermier des Plantes, 1976; Escoufier, 1983; Lavit et al., 1994) STATIS = Structuration des Tableaux A Trois IndiceS Tecnica esplorativa.
Precorso di Statistica per le Lauree Magistrali
Logica Lezz
IL SOFTWARE (FPwin 6.0).
© 2007 SEI-Società Editrice Internazionale, Apogeo
Algoritmi Avanzati a.a.2014/2015 Prof.ssa Rossella Petreschi
Presentazione di Camilla Giustiniani Rimini - 23 giugno 2017
Analisi delle componenti principali
STATISTICA Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo.
L’analisi monovariata
Esame di Analisi Multivariata dei Dati
Simulazione esame Analisi Multivariata dei Dati
DISTRIBUZIONI TEORICHE DI PROBABILITA’
L’analisi del comportamento delle imprese (seconda parte)
PIANIFICAZIONE DEI TRASPORTI Regressione lineare
Analisi delle Traiettorie: Modelli di Crescita Latente (LGM)
Cluster Analysis Definizione di Classificazione: operazione concettuale condotta adottando un solo criterio (detto fondamento della divisione) per individuare.
DEM da laser-scan: rappresentazione contour in qGis
Corso di Laurea in Scienze e Tecniche Psicologiche
Un’università vuole raccogliere ed organizzare in un database
Corso di Laurea in Scienze e tecniche psicologiche
Secondo esempio 9 item di un questionario di personalità
Tipo di dato: array Un array è un tipo di dato usato per memorizzare una collezione di variabili dello stesso tipo. Per memorizzare una collezione di 7.
Precorso di Statistica per le Lauree Magistrali
PROGRAMMAZIONE BASH – ISTRUZIONE IF
La Statistica Istituto Comprensivo “ M. G. Cutuli”
SAS® OnDemand for Academics SAS Studio
Statistica descrittiva bivariata
L’analisi monovariata
realizzato dal prof.Conti Riccardo
ANALISI IN COMPONENTI PRINCIPALI
Statistica descrittiva
Statistica Scienza che studia i fenomeni collettivi.
INTRODUZIONE A EXCEL Il foglio elettronico o foglio di calcolo è una tabella che contiene parole e numeri che possono essere elaborati applicando formule.
Programmare.
I numeri relativi DEFINIZIONE. Si dicono numeri relativi tutti i numeri interi, razionali e irrazionali dotati di segno (positivo o negativo). ESEMPI Numeri.
Introduzione alla nuova versione di PowerPoint
Introduzione alla nuova versione di PowerPoint
Metodi Quantitativi per Economia, Finanza e Management Lezioni n°7-8
Lettura di un test statistico (1)
ANALISI DEI DATI ANALISI FATTORIALE.
Distribuzione per stato di occupazione
Corsi di Laurea in Biotecnologie
Lettura di un test statistico (1)
Introduzione alla nuova versione di PowerPoint
Riduzione dei Dati.
* 07/16/96 Sez. 2: Ordinamento La consultazione di banche dati è sempre più cruciale in tutte le applicazioni dell’Informatica. Se vogliamo consultare.
APPUNTI SUL LINGUAGGIO C Esercizi su File e Alberi Binari
Esercizio 2 Un gruppo di persone con DCA ha partecipato per tre mesi ad una psicoterapia di gruppo per aumentare la propria autostima. Verificare che la.
Precorso di Statistica per le Lauree Magistrali
Test per campioni indipendenti
Docente: Sabato Bufano
Statistica descrittiva bivariata
Esercitazione 8 Correzione simulazione esame AMD
Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3.
Digitare qui i dettagli dell'evento
Transcript della presentazione:

AMD2017 - Esercitazione 7 Giulio Costantini

Analisi delle componenti principali Tecnica di analisi multivariata solitamente impiegata per estrarre un numero di fattori (variabili latenti) da un set di variabili osservate (es. item). In questo modo è possibile da descrivere insiemi di variabili anche molto grandi con un numero molto ridotto di elementi. Variabili osservate che correlano molto tra loro possono essere riassunte da un fattore, variabili che non correlano tra loro faranno probabilmente parte di fattori differenti.

Step dell’analisi delle componenti principali Scelta del modello fattoriale: ACP o AFC. Noi vediamo solo ACP. Scelta del numero di fattori: Mineigen / Autovalore > 1 / Kaiser-Guttman Scree-test (in SPSS: grafico decrescente degli autovalori) Analisi Parallela (vedremo come farla usando una sintassi di SPSS già pronta; https://people.ok.ubc.ca/brioconn/nfactors/nfactors.html) Interpretabilità dei fattori (ma solo DOPO aver scelto il tipo di rotazione) Rotazione obliqua (oblimin) o ortogonale (varimax): Se si estrae più di un fattore, bisogna ruotare la struttura. Prima rotazione oblimin. Esaminare le correlazioni tra fattori. Se almeno una è > .20 in valore assoluto, mantenere obliqua, altrimenti passare a varimax. Interpretazione dei fattori: esaminare la struttura ruotata. Se rotazione obliqua, usare matrice dei modelli. Eventuale eliminazione di item che non saturano chiaramente su nessun fattore (es. nessuna saturazione > |.35|) o che hanno saturazioni multiple senza che nessuna sia molto più alta degli altri. Questo passaggio si fa soprattutto se l’obiettivo è la costruzione/validazione di un nuovo questionario. Salvataggio punteggi fattoriali e utilizzo per analisi successive. Per es. per svolgere un’ACP gerarchica, basterà salvare i punteggi fattoriali (rotazione obliqua) e usarli come input per una nuova ACP

Esercizio 1 Utilizziamo il file «Adjective_list.sav». Il file contiene i dati relativi ad una ricerca effettuata per identificare 5 tratti di personalità mediante un questionario auto-compilato; il questionario è stato strutturato con lo scopo di raccogliere i punteggi su una scala da 0 a 10 indicanti, relativamente alle qualità espresse da ogni aggettivo, il possesso che i soggetti si riconoscono di tali qualità. Scopo della ricerca è quindi individuare le dimensioni latenti sottostanti – i fattori – che semplificano, riassumono e permettono di spiegare i punteggi osservati sulle 25 variabili. Il questionario è stato sottoposto a 300 soggetti; il file risulta quindi formato da una matrice 300 X 25: ogni riga contiene i punteggi di un soggetto per tutte le 25 variabili. Ogni colonna contiene i punteggi di una variabile per tutti i 300 soggetti. La variabile genere discrimina i soggetti maschi (1) dai soggetti di genere femminile (0).

Scelta numero fattori

Analizza > Riduzione delle dimensioni > Fattoriale

Scheda Estrazione Permette di scegliere il tipo di analisi (in questo caso, ACP), il numero di fattori da estrarre (si inizia sempre con Autovalore > 1) e permette di richiedere lo scree-test. Se il modello non converge, aumentare il «numero massimo di iterazioni per la convergenza».

Scheda Rotazione Permette di scegliere il tipo di rotazione. Dopo aver scelto il numero dei fattori, Se si è scelto 1 solo fattore, non ruotare. Se più fattori, iniziare con Oblimin. Se le correlazioni tra fattori sono tutte < |.20| passare a varimax. Se la rotazione oblimin non converge, aumentare le iterazioni

Scheda punteggi Se si intende usare i punteggi fattoriali per altre analisi, la finestra punteggi permette di salvarli (flaggare «salva come variabili», lasciare pure il metodo «regressione» di default).

Scheda opzioni Alcune opzioni comode che permettono per esempio di ordinare le variabili nelle matrici di saturazione fattoriale a seconda del fattore su cui saturano di più («ordinati per dimensioni») e di nascondere i coefficienti piccoli (es. < |.20|) per facilitarne la lettura.

Output: Comunalità Porzione della variabilità di ciascuna variabile spiegata da ogni fattore. Matrice riassuntiva, non serve per nessuno degli step descritti sopra.

Ordine di estrazione delle componenti Valori degli autovalori estratti per ogni componente % della varianza spiegata da ogni componente rispetto alla varianza totale delle 25 variabili. λ1=3.062; varianza totale osservata= =25 X 1=25; proporzione di varianza spiegata da λ1=3.062/25=0.1224 % di varianza spiegata da λ1=0.1224 X 100=12.24. Il criterio Mineigen suggerisce di non selezionare più di 8 fattori Si noti che le 25 componenti complessivamente spiegano il 100% della varianza delle variabili osservate. La somma degli autovalori è quindi pari a 25.

Scree-plot Semplicemente il grafico degli autovalori presentati nella tabella precedente. Un esame visivo dello scree-plot suggerisce cinque fattori.

Analisi parallela (1) Aprite la sintassi parallel.sps Sintassi sviluppata da O’Connor. Reference: O'Connor, B. P. (2000). SPSS and SAS programs for determining the number of components using parallel analysis and Velicer's MAP test.Behavior Research Methods, Instrumentation, and Computers, 32, 396-402.

Analsi Parallela (2) Per svolgre l’analisi parallela bisogna sapere: Quanti casi/soggetti abbiamo (ncases): in questo caso 300 Quante variabili abbiamo (nvars): in questo caso 25 Quanti dataset vogliamo simulare: possiamo lasciare il default, 100 Quale percentile della distribuzione casuale vogliamo usare. Possiamo lasciare il default, 95. Che tipo di analisi vogliamo svolgere, se ACP (kind = 1) o AFC (kind = 2). L’ACP va sempre bene, anche se si fa AFC, quindi scegliamo kind = 1.

Analisi Parallela (3) Ci ricorda che abbiamo scelto ACP (principal components) Ci ricorda i nostri settaggi: Ncases (numero di casi) = 300, Nvars (numero di variabili) = 25, Ndatasets (numero di dataset casuali) = 100, Percent (il percentile dei valori usato come criterio) = 95. Qui abbiamo gli autovalori estratti dai dati casuali (riporto solo i primi 12). Root = numero del fattore. Means = media dell’autovalore. Prcntyle = 95°percentile degli autovalori estratti dai dati casuali.

Analisi parallela (4) Per scegliere il numero di fattori, confronto gli autovalori estratti dai dati reali con quelli estratti dai dati casuali, uno ad uno. Tengo i fattori fino a quando uno degli autovalori reali è più basso del corrispondente autovalore casuale. Se un fattore spiega meno del suo omologo causale, non ha senso tenerlo. Posso scegliere se fare il confronto con la media degli autovalori causali (Means) o con il 95° percentile (Prcntyle), basta esplicitarlo chiaramente. In questo caso, entrambi i criteri suggeriscono di tenere 5 fattori, perché il sesto spiega meno del suo omologo casuale.

Riassunto scelta numero fattori Scelta del numero di fattori: Mineigen: MAX 8 fattori Scree-test : 5 fattori Analisi Parallela: 5 fattori Interpretabilità dei fattori (ma solo DOPO aver scelto il tipo di rotazione): vedremo dopo come interpretarli, se non dovessero essere interpretabili potremmo selezionare strutture differenti. Il criteiro Mineigen suggerisce di considerare al massiumo 8 fattori. Noi esaminiamo una soluzione a 5 fattori, come suggerito dallo Scree test e dall’analisi parallela.

Scelta rotazione

Ripeto l’analisi con le seguenti modifiche: Nella scheda estrazione, specifico che voglio estrarre esattamente 5 fattori. Nella scheda rotazione, specifico una rotazione obliqua, «oblimin diretto».

Varianza totale spiegata Le cinque componenti estratte spiegano il 41.157% della varianza totale.

Scegliere la rotazione Nessuna correlazione > .20 in valore assoluto, ripetiamo l’analisi con rotazione Varimax

Interpretazione dei fattori

Interpretazione Se rotazione ortogonale, esamino matrice dei componenti ruotati. Se rotazione obliqua, esamino matrice dei modelli (NON matrice di struttura) Come potremmo interpretare i fattori emersi?

Interpretazione Riproducono i «Big Five», sebbene alcuni fattori siano più rappresentati di altri 1 = Coscienziosità 2 = estroversione 3 = Stabilità emotiva 4 = Apertura all’esperienza 5 = Gradevolezza Alcuni item saturano su più fattori, potremmo considerare di eliminarli. Per farlo dovremmo ripetere l’intera analisi senza questi due fattori.

Utilizzo dei punteggi fattoriali per analisi successive

Esercizio Esaminare se i punteggi nei 5 fattori differiscono per genere.

Salvare i punteggi fattoriali Nella scheda punteggi, flaggare «salva come variabili». Ripetere l’analisi. Questa volta nel file di dati saranno generate cinque nuove variabili, ciascuna indicante il punteggio di ciascun soggetto su ciascuno dei cinque fattori.

Svolgere I t-test Analizza > confronta medie > t test per campioni indipendenti. La variabile indipendente è il genere (0 = Fem 1 = Mas), le variabili dipendenti sono I 5 fattori emersi dall’analisi precedente

Per i fattori 1 e 3, il test di Levene è significativo, quindi dobbiamo guardare il t-test corretto per varianze non uguali; per gli altri fattori, guardiamo la prima riga (varianze uguali presunte) I t-test indicano che c’è una differenza tra maschi e femmine per i fattori 1 (Coscienziosità) e 3 (stabilità emotiva), ma non per gli altri fattori.

Uno sguardo alle medie rivela che le femmine hanno un valore più basso di coscienziosità e un valore più alto di stabilità emotiva rispetto ai maschi.

Esercizio per casa L’HEXACO-60 è un breve questionario di 60 item che valuta 6 dimensioni di personalità: onestà-umiltà, Emotività, estroversione, gradevolezza vs. rabbia, coscienziosità e apertura all’esperienza (Ashton & Lee 2007). Ciascuna di queste sei dimensioni è misurata tramite quattro «sfaccettature», che risultano dalla media di due o tre item ciascuna. In totale quindi ci sono 24 sfaccettature. Nel file HEXACOfacet.sav (tratto da Costantini et al., 2015) sono contenuti i punteggi di ciascuna sfaccettatura per 964 casi. Svolgi un’analisi fattoriale. Nella pagina successiva, è disponibile una descrizione di ciascuna sfaccettatura.

Variabile Dimensione Sfaccettatura Hsi Onestà-umiltà Sincerity Hfa Fairness Hga Greed-avoidance Hmo Modesty Efe Emotività Fearfulness Ean Anxiety Ede Dependence Ese Sentimentality Xss Estroversione Social self-esteem Xsb Social boldness Xso Sociability Xli Liveliness Afo Gradevolezza vs. rabbia Forgiveness Age Gentleness Afl Flexibility Apa Patience Cor Coscienziosità Organization Cdi Diligence Cpe Perfectionism Cpr Prudence Oaa Apertura all’esperienza Aesthetic appreciation Oin Inquisitiveness Ocr Creativity Oun Unconventionality

Scelta # fattori Il criterio mineigen suggerisce max 6 fattori, così come lo scree test

Analsi parallela Anche l’analsi parallela suggerisce 6 fattori, poiché l’autovalore del 7° fattore (0.856) è il primo ad essere inferiore alla media di quello estratto da dati casuali (1.11)

Rotazione Poiché in seguito ad un’analisi con rotazione oblimin emerge una correlazione tra fattori maggiore di 0.20 in valore assoluto (-.228 tra il 1° e il 6°) fattore, scelgo una rotazione oblimin

Interpretazione I sei fattori estratti riproducono molto chiaramente la struttura attesa: Apertura all’esperienza, emozionalità, gradevolezza vs. rabbia, estroversione, coscienziosità, onestà-umiltà L’unica sfaccettatura lievemente problematica è Xss, che satura non solo sul fattore 4 (estroversione), ma anche in modo negativo sul fattore 2 (emozionalità).