Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoDuilio Carletti Modificato 11 anni fa
1
Analisi fattoriale L’analisi fattoriale è un procedimento matematico-statistico che, partendo dalle risposte date da un gruppo di soggetti ad una serie di item, permette di identificare delle caratteristiche psicologiche, dette fattori, che non emergono a prima vista e che presumibilmente spiegano o influenzano le risposte ai test. Essenzialmente si tratta di una procedura di sintesi dei dati, tramite la quale è possibile individuare gli item che si raggruppano assieme (e quindi compongono un fattore). L’obiettivo dell’analisi fattoriale è individuare il fattore o i fattori che si presume siano la causa delle correlazioni osservate tra i punteggi.
2
Storia dell’analisi fattoriale
La nascita dell’analisi fattoriale viene di solito attribuita a Charles Spearman che nel 1904 pubblica su Amer. J. Of Psych. un articolo dal titolo “General Intelligence, objectively determined and measured” dove propone la Teoria dei Due Fattori. Sebbene nel 1901 Karl Pearson abbia pubblicato un articolo in cui descrive il “metodo degli assi principali”, Spearman ha dedicato 40 anni della propria vita allo sviluppo dell’analisi fattoriale, per cui viene considerato il vero fondatore della tecnica. Altri principali contribuenti furono: Cyril Burt, Godefrey H. Thomson, J. C. Maxwell Garnett, Karl Holzinger, oltre a K. Pearson. Secondo la Teoria dei Due Fattori di Spearman, la misurazione dell’intelligenza con un determinato questionario o test dipende da due fattori, uno generale (detto fattore g) e uno specifico (fattore s). Il fattore g costituisce la componente invariabile dell’abilità intellettiva, mente il fattore s è la componente variabile da condizione a condizione. Negli anni ’30 l’analisi fattoriale viene ulteriormente sviluppata. La teoria dei due fattori di Spearman non sempre risultava adeguata per spiegare i risultati ad una serie di test. Perciò si aprirono le porte per il raggruppamento in più fattori, ossia dell’analisi dei fattori multipli.
3
Tuttavia gli autori cercavano il più possibile, mantenendosi fedeli alle origini, di mantenere limitato il numero di fattori. L.L. Thurstone è considerato come il fondatore dell’analisi multifattoriale. Tuttavia non è stato il primo a separarsi dalla teoria di Spearman. Thurstone è famoso soprattutto per il metodo del centroide per la soluzione dei fattori principali. Ma il maggiore contributo di Thurstone è stato la generalizzazione del metodo di Spearman della differenza tra le tetrodi al rango della matrice di correlazione come base per il calcolo del numero di fattori comuni. Egli si rese conto che una differenza zero nelle tetrade corrisponde alla scomparsa di determinanti di ordine superiore e definì questa nozione della scomparsa di determinanti di ordine superiore come segno della presenza di più di un singolo fattore. Questo permise un ulteriore miglioramento dell’analisi fattoriale. Kelley utilizzò l’analisi fattoriale per la selezione del personale nell’esercito. In seguito l’analisi fattoriale trovò applicazione in branche come le scienze politiche, economiche e in medicina.
4
Cosa sono i fattori? I dati di partenza sono costituiti dalla matrice di correlazione o covarianze tra le variabili. Da tale matrice si estraggono le saturazioni dei fattori, ossia le correlazioni di ciascuna variabile con l’ipotetico costrutto del fattore. La somma dei quadrati delle saturazioni di una data variabile dà la comunalità di quella variabile. Infine, per poter avere una chiara interpretazione della matrice delle saturazioni, è necessario applicare un tecnica di rotazione degli assi fattoriali. Passi principali per eseguire l’analisi fattoriale: 1. calcolare la matrice di correlazione tra variabili 2. calcolare la matrice delle saturazioni fattoriali 3. calcolare le comunalità delle variabili 4. applicare una tecnica di rotazione degli assi fattoriali 5. interpretare i dati ottenuti con l’analisi
5
Premessa: se i punteggi da correlare sono ricavati da test diversi, occorre, prima di calcolare la matrice di correlazioni, trasformare i punteggi grezzi in punti z standardizzati. In questo modo i punteggi ottenuti con diversi test sono disposti lungo un unico continuum di valori con la stessa media Una volta trasformati i punteggi grezzi in punti zeta, si calcolano le correlazioni tra i punteggi dei diversi test. é anche possibile utilizzare l'analisi fattoriale per veder come si raggruppano gli item di uno stesso test. Ad esempio, se il test misura la depressione, è possibile che gli item siano stati differenziati in modo da misurare le 9 dimensioni della depressione stabilite dal DSM IV. L'analisi fattoriale in questo caso servirebbe a verificare se effettivamente gli item si raggruppano in 9 fattori, confermando così la loro validità.
6
L'analisi fattoriale si divide in:
1. Analisi fattoriale esplorativa (AFE). Viene applicata quando lo psicologo non sa quanti e quali fattori permettono di ragguppare i dati. Problemi: il numero di fattori dipende dalle tecniche di rotazione degli assi selezionate; è difficile a volte definire la natura del fattore; è difficile stabilire un criterio che stabilisca il numero minimo di fattori. 2. Analisi fattoriale confermativa (AFC). Viene applicata quando lo psicologo sa quanti sono i fattori e cerca di verificare se i dati verificano il raggruppamento ipotizzato. Problemi: se i dati non verificano il modello occorre stabilire che cosa ha impedito la verifica; occorrono numerosi dati per verificare in modo attendibile il modello; l'esito della verifica può cambiare a seconda del tipo di rotazione fattoriale selezionata. La AFC viene eseguita utilizzando programmi che si basano su modelli di equazioni strutturali. I più diffusi sono il LISREL di Joreskog e Sorbom (1981; 1984; 1988) e l’EQS di Bentler (1985; 1989).
7
Basi teoriche dell'analisi fattoriale
Se esistono più fattori nel determinare la variabilità dei punteggi, allora la varianza dei punteggi è interpretabile come la somma di tante quote di varianza, ciascuna determinata dal singolo fattore. Ad esempio: se abbiamo un test tx che misura un tratto psicologico in cui intervengono tra fattori A, B e C, allora la varianza totale del test s2x è scomponibile nella somme di tre quote di varianza, una per ciascun fattore, ossia: Ciascuna di queste quote costituisce una certa proporzione di varianza rispetto alla varianza totale del test.
8
Per ragioni di comodità e semplicità, indichiamo
Dato che rappresenta la proporzione di varianza dovuta al fattore A rispetto alla varianza totale del test, allora costituisce il quadrato del coefficiente di correlazione del fattore A con l'intero test tx, ossia: Lo stesso si applica agli altri fattori: Da cui: ossia la radice quadrata della proporzione di varianza dovuto al singolo fattore rispetto alla varianza totale del test è la correlazione tra il test e quel fattore.
9
La correlazione test-fattore viene definita tecnicamente saturazione o peso fattoriale del test.
quando un soggetto esegue un test, una certa quota del suo punteggio è determinata da una fattore, un'altra quota da un altro fattore e così via. Dato che il punteggio dell'i-esimo soggetto è espresso in punti zeta, allora: dove indica la quota del punteggio al test tx dovuta al fattore A, è la saturazione del test nel fattore A e è il punteggio del soggetto nel fattore. La quota del punteggio nel test che un soggetto ottiene per l'incidenza del fattore è espressa da un'equazione di regressione semplice. Analogamente per i fattori B e C, abbiamo: Il punteggio totale nel test è dato dalla somme dei tre punteggi parziali: e nello stesso modo, lo stesso soggetti i in un altro test ty in cui sono presenti i tra fattori A, B e C, può essere espresso fattorialmente come:
10
indicando con rxy la correlazione dei punteggi ottenuti nei test tx e ty, in cui ipotizziamo operino solo due fattori A e B, essa è data da: per cui l'equazione precedente diventa: quindi la correlazione tra due test è uguale alla somma dei prodotti delle reciproche saturazioni fattoriali. In definitiva: 1. I tratti psicologici sono interpretabili in termini di N dimensioni fattoriali 2. Le dimensioni fattoriali sono reciprocamente indipendenti 3. I test ne costituiscono una misura Questi valori diventano zero, dato che si assume che i fattori siano tra loro indipendenti Questi valori diventano 1, dato che la varianza dei punti z è 1
11
Come si calcolano le saturazioni fattoriali?
Le procedure di calcolo variano a seconda del modello matematico adottato. I due modelli di AF più noti sono: 1. Il modello con due fattori di Spearman 2. Il modello multifattoriale di Thurstone Il modello a due fattori Tale modello stabilisce che il punteggio del singolo soggetto ad un test dipende da un fattore generale, indicato con G e da un fattore specifico per ciascun test, indicato da S. Avremo tanti fattori S quanti sono i test. In termini matematici: La varianza dei punteggi al test tx è data da: Le correlazioni tra test e fattori sono:
12
La formula che esprime la correlazione tra due test tx e ty è:
per cui l'equazione diventa: Supponiamo di avere somministrato 4 test t1, t2, t3, e t4. La matrice delle correlazioni R tra i punteggi ai 4 test è: Dato che i fattori specifici non sono tra loro correlati, allora il prodotto dell saturazioni si annulla
13
Il calcolo delle tetradi:
I valori delle tetradi tendono a zero. Perchè? Il fatto si spiega se si interpretano i coefficienti di saturazione fattoriale: ne deriva che: prima tetrade: seconda tetrade:
14
In teoria, l'annullamento delle tetradi è giustificato dal fatto che le tetradi esprimono la differenza tra le composizioni delle saturazioni fattoriali. Da questa constatazione deriva la procedura per il calcolo delle saturazioni fattoriali. Se abbiamo tra test tk, tm e tn, allora da cui Inoltre dato che per cui In questo modo possiamo calcolare le saturazioni del fattore specifico S da quelle del fattore generale G.
15
calcolo delle saturazioni fattoriali
del fattore generale G: calcolo delle saturazioni fattoriali del fattore specifico S:
16
Matrice delle saturazioni fattoriali
Matrice delle comunanze e dei fattori specifici comunanza (h2) : La comunanza è la somma delle saturazioni dei fattori generali. Dato che nel modello a due fattori n = 1, allora La quota di varianza dei fattori S è elevata al quadrato. Nel test 1, il 67,2% di varianza è dovuta al fattore G e il 32,7% al fattore S. Nel test 2, il 37,1% di varianza è dovuta al fattore G e il 62,9% al fattore S. Nel test 3, il 79,0% di varianza è dovuta al fattore G e il 21,0% al fattore S. Nel test 4, il 32,4% di varianza è dovuta al fattore G e il 67,6% al fattore S.
17
Matrice dei residui R' Moltiplicando tra di loro le saturazioni fattoriali si ottiene la matrice dei residui R': Calcolando la differenza tra la matrice originaria delle correlazioni R e la matrice R' si ottiene la matrice dei residui R - R':
18
I dati del modello a due fattori presentato nell'esempio sono dati teorici, in quanto manca la componente di errore. Nei dati empirici, ossia nei punteggi ai test, è sempre presente la componente di varianza dovuta agli errori. Per cui il modello completo della saturazione fattoriale prevede anche una quota di varianza dovuta all'errore: dove è la saturazione fattoriale della componente di varianza dovuta all'errore (specifico per ogni test).
19
Il modello multifattoriale
Nel modello multifattoriale il punteggio del soggetto al test non dipende solo dal fattore specifico S, ma anche da due o più fattori generali o comuni, indicati con F. Supponendo di avere m fattori generali, indicati con F1, F2, ..,, Fm, allora il punteggio è dato da: Le saturazioni fattoriali sono: La varianza del test è: dato che La correlazione tra due test è data dalla somma dei prodotti delle saturazioni dei due test nei medesimi fattori generali:
20
Supponiamo di avere 6 test:
t1 = intervista di giudici t2 = contruzione con cubi (Gesell) t3 = vocabolario figurato (Terman) t4 = significato di vocaboli (Terman) t5 = disegno della figura umana (Goodenough) t6 = test visuo-motorio (Bender-Santucci) Matrice di correlazioni tra i sei test:
21
Utilizzando la tecnica delle tetradi è possibile calcolare le saturazioni fattoriali per i sei test. Tali saturazioni vanno poi a comporre la matrice dell saturazioni fattoriali. Dato che i test in tutto sono sei, si ipotizza, all'inizio, un numero massimo di fattori generali pari a sei. Con la matrice delle saturazioni dei fattori generali possiamo fare diversi calcoli. Ad esempio, possiamo calcolare la quota di varianza del test t1 dovuta ai fattori generali : è la quota di varianza dovuta al fattore specifico e all'errore.
22
La correlazione tra i due test t1 e t2 è:
Dalla matrice delle saturazioni dei fattori generali è possibile calcolare gli eigenvalue o autovalori dei sei fattori. Ad esempio, l'eigenvalue del fattore F1 è: La stessa procedura si applica per gli altri fattori. É possibile così ottenere la matrice degli eigenvalue e delle proporzione di varianza totale spiegata per ciascun fattore e la percentuale cumulativa di varianza totale spiegata. La proporzione di varianza totale spiegata è:
23
Quanti fattori scegliere? Esistono diverse procedure:
La percentuale cumulativa di varianza totale spiegata si ottiene sommando le percentuali della varianze totali spiegate da ciascun fattore. Per cui prop. var. tot. spiegata perc. var. tot. spiegata perc. cum. var. tot. spiegata eigenvalue Quanti fattori scegliere? Esistono diverse procedure: 1. Scree-plot di Cattell 2. Procedura Kaiser -Guttman 3. Saturazioni > 0,30 4. Matrice dei residui
24
Lo Scree-plot di Cattell:
eigenvalue Lo Scree-plot di Cattell permette, tramite un grafico che in ascissa riporta il numero di fattori e in ordinata gli eigenvalue, di stabilire il numero di fattori da scegliere. Di solito, la scelta è fatta in corrispondenza di una brusca variazione della pendenza del grafico, indicata, in questo caso dalla freccia rossa. Questa procedura è molto discussa perché non consente un'accurata selezione dei fattori.
25
Procedura Kaiser-Guttman
eigenvalue Consiste nella selezione degli eigenvalue maggiori di 1. Nel nostro esempio, solo due fattori generali sono maggiori di uno. Saturazioni >0,30 I programmi per calcolatori usano una procedura iterativa per l'estrazione dei fattori, ossia una procedura che ripete ciclicamente i calcoli delle saturazioni. Tale procedura si interrompe se le saturazioni calcolate (in valore assoluto) sono inferiori a 0,30. L'interruzione della procedura determina il numero di fattori in cui sono raggruppabili i punteggi dei test.
26
Esempio di estrazione dei fattori da una serie di punteggi ottenuti da 12 test con il metodo delle saturazioni inferiori a 0,30. eigenvalue
27
Matrice dei residui I programmi al computer possono ricalcolare la matrice delle correlazioni tra i test ad ogni nuova estrazione dei fattori. Se la differenza tra la matrice di correlazioni calcolata R' e la matrice di correlazioni originaria ha tutte differenze inferiori a 0,1, ossia se R – R' < 0,1 allora la procedura di estrazione dei fattori si interrompe. L'interruzione della procedura determina il numero di fattori in cui sonno raggruppabili i punteggi dei test. Necessità delle rotazioni fattoriali Una volta stabilito il numero massimo di fattori, l'analisi prosegue con le rotazioni fattoriali. Le rotazioni fattoriali servono per rendere le saturazioni chiaramente interpretabili. L'obiettivo è l'eliminazione della saturazioni doppie o triple, ecc..., che rendono più difficile l'interpretazione dei dati.
28
Esempio di matrice delle saturazioni facilmente interpretabile:
Esempio di matrice non facilmente interpretabile: I test hanno saturazioni in un solo fattore. In questo caso non occorre la rotazione degli assi. La matrice mostra delle saturazioni doppie per alcuni test. In questo caso occorre la rotazione degli assi.
29
Metodi di rotazione fattoriale:
Esistono due classi di metodi di rotazione fattoriale: rotazioni ortogonali e oblique. Le prime presuppongono che i fattori siano tra loro non correlati. Le seconde che i fattori siano tra lo correlati. In altri termini, le rotazioni ortogonali presuppongono una coincidenza tra la correlazione variabile-fattore e la saturazione di quest’ultimo, mentre le seconde no, in quanto parte della varianza della variabile dipende da altri fattori. 1) Rotazioni ortogonali: a) VARIMAX: massimizza la varianza delle saturazioni delle variabili all’interno di ogni fattore. In questo modo le saturazioni alte diventano più alte e quelle basse più basse, separando maggiormente i fattori. b) QUARTIMAX: massimizza la varianza delle saturazioni per riga. In tal modo è possibile concentrare più varianza possibile per ogni variabile su un unico fattore.
30
2) Rotazioni oblique: a) OBLIMIN: semplifica la matrice delle saturazioni facendo in modo che le variabili abbiano saturazioni il più possibile vicine a zero in tutti i fattori tranne uno. b) Rotazione di PROCUSTE: La matrice originale vine ruotata verso una matrice “bersaglio” che ha caratteristiche definite dal ricercatore. La soluzione iniziale viene ruotata in modo da renderla più simile possibile alla matrice bersaglio. c) PROMAX: la matrice delle saturazioni viene trasformata in una più semplice usando i metodi Quartimax o Varimax. Le saturazioni vengono poi elevate alla seconda, terza, quarta o a potenze maggiori in modo da rendere le saturazioni basse sempre più basse e la matrice sempre più semplice. La matrice più semplice viene usata come matrice bersaglio per una rotazione di Procuste che viene effettuata sulla matrice originale non ruotata.
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.