ANALISI FATTORIALE. Cosè lanalisi fattoriale? Statistica descrittiva Rappresentazione delle variabili in studio. Statistica confermativa vs Confermare,

Slides:



Advertisements
Presentazioni simili
Selezione delle caratteristiche - Principal Component Analysis
Advertisements

Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Come organizzare i dati per un'analisi statistica al computer?
ESERCITAZIONE L’analisi Fattoriale.
Capitolo 8 Sistemi lineari.
Autovalori e autovettori
COORDINATE POLARI Sia P ha coordinate cartesiane
L’Analisi Fattoriale (PCA) con SPSS
Analisi Fattoriale Tecnica utilizzata per studiare, riassumere e semplificare le relazioni in un insieme di variabili.
Analisi Fattoriale Esplorativa
Algebra delle Matrici.
Descrizione dei dati Metodi di descrizione dei dati
ANALISI DELLA COVARIANZA
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Regressione logistica
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
MODELLO DI REGRESSIONE LINEARE MULTIPLA
Analisi della varianza (a una via)
La logica della regressione
Processi Aleatori : Introduzione – Parte I
Appunti di inferenza per farmacisti
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Metodi di ricerca in Psicologia
Corso di biomatematica lezione 9: test di Student
Sistemi di equazioni lineari
Corso di biomatematica lezione 6: la funzione c2
Corso di biomatematica lezione 7-2: Test di significatività
Corso di biomatematica lezione 7: Test di significatività
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
Modello di regressione lineare semplice
Analisi delle corrispondenze
Analisi dei gruppi – Cluster Analisys
Regressione Logistica
I principali tipi di grafici
Le distribuzioni campionarie
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
L’ANALISI IN COMPONENTI PRINCIPALI
La ricerca delle relazioni tra fenomeni
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
MODELLI NON PARAMETRICI
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
La verifica d’ipotesi Docente Dott. Nappo Daniela
1 Corso di Laurea magistrale in Psicologia Clinica, dello Sviluppo e Neuropsicologia Esame di Analisi Multivariata dei Dati Introduzione all’analisi fattoriale.
La statistica F Permette di confrontare due varianze, per stabilire se sono o no uguali. Simile al valore t di Student o al chi quadrato, l’F di Fisher.
La correlazione.
Metodi Quantitativi per Economia, Finanza e Management Lezioni n°7-8.
Test basati su due campioni Test Chi - quadro
Analisi discriminante lineare - contesto
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
MATEMATICA PER L’ECONOMIA e METODI QUANTITATIVI PER LA FINANZA a. a
TRATTAMENTO STATISTICO DEI DATI ANALITICI
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.
Ottimizzazione dei terreni di coltura Metodi statistici.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
Riduzione dei Dati. Nelle scienze sociali ci si trova molto spesso di fronte a ricerche in cui vi è una sovrabbondanza di misurazioni nel tentativo di.
L’analisidei dati L’analisi dei dati Analisi mutlidimensionali: Analisi delle corrispondenze multiple Cluster Analysis.
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
Teoria dei Sistemi di Trasporto Tematica 4: Elementi minimi di teoria della probabilità.
Transcript della presentazione:

ANALISI FATTORIALE

Cosè lanalisi fattoriale? Statistica descrittiva Rappresentazione delle variabili in studio. Statistica confermativa vs Confermare, dimostrare unipotesi di partenza. - H di partenza - Variabili dipendenti - Fattori - Strumenti di raccolta dati - Analisi dei dati - Eventuale falsificazione dellH0 Aumentare la quantità di informazioni relative ai dati raccolti ed alle variabili considerate. Rappresentazione più efficace ed utile possibile dei dati. Semplificazione dei dati per migliorare la loro interpretazione.

Nasce in ambito medico-psicologico. E una procedura matematica. Utilizzata soprattutto per validare i questionari perché fornisce informazioni relative alla struttura dei dati. Spesso viene sovrastimata da molti autori. Non ci permette di arrivare alla conferma di unH di partenza ma è una tecnica vantaggiosa, per questo ampiamente usata, che ci fornisce informazioni difficili da ottenere in altro modo.

Come lavora lAnalisi Fattoriale Variabili di partenza Operazioni matematiche Quantitative, gaussiane, correlate fra loro che vengono analizzate allo stesso livello. Matrice di correlazione Estrazione di fattori ortogonali Rotazione

Scopi principali 2. Trasformazione delle varabili in studio in variabili indipendenti. 1. Riduzione del numero di variabili in studio (ma non dellinformazione). 3. Individuazione delle sorgenti delle variabili. 4. Assegnazione di significato reale a tali variabili.

Ruolo indiscusso: Vantaggi: Critiche: - Riduzione delle variabili ma non dellinformazione utile. Validazione di questionari e riduzione del numero di variabili in studio, non correlate tra loro. Trova variabili artificiali, aleatorie, è possibile rintracciarne un numero infinito. Sono indipendenti tra loro, per questo non riflettono la realtà psicologica dove è difficile trovare fenomeni non correlati. - Creazione di fattori che rappresentano la stessa realtà ma che sono indipendenti fra loro. - Non vengono considerate le differenze fra le diverse variabili.

I punteggi grezzi vengono trasformati in punti z, ovvero vengono standardizzati Standardizzazione dei dati raccolti Semplifica i conti. Permette il confronto di punteggi appartenenti a diversi questionari. Una variabili gaussiana è detta variabile Z quando ha:

Cosè la varianza? Può essere vista come la quantità dinformazione trasportata da ogni parametro. La varianza complessiva risulta ora uguale al numero totale delle variabili considerate. Maggiore è la variabilità e maggiore è linformazione.

I OPERAZIONE: Creazione della Matrice di Correlazione La prima matrice di correlazione estratta dallanalisi è la matrice di correlazione R. Due variabili sono statisticamente correlate fra loro quando al variare di una anche laltra varia. Avremo un numero di nuove variabili, fattori, corrispondente al numero delle variabili iniziali, item. Mostra tutte le relazioni possibili tra le variabili. Le variabili vengono correlate a due a due. Avremo una varianza complessiva uguale al numero delle variabili iniziali, perché ogni item ha varianza 1 e media 0.

II OPERAZIONE: Estrazione dei Fattori Metodi di estrazione: - Metodo delle componenti principali - Metodo della massima verosimiglianza - Metodo dei minimi quadrati - ….

Metodo delle componenti principali Tale metodo permette di creare variabili artificiali, dette fattori, fra loro ortogonali (correlazione = 0). I fattori sono combinazioni lineari delle variabili sperimentali, si ottengono cioè dalla somma dei prodotti delle singole variabili sperimentali, o meglio dei loro valori z, per gli opportuni coefficienti. Il valore e il segno di questi coefficienti indicano quanto e come il singolo fattore sia legato alle diverse variabili sperimentali. I fattori non hanno più varianza = 1 Utilizza un processo a cascata per cui il primo fattore spiega il massimo della varianza, ed è il più importante. Si avvale del calcolo degli AUTOVALORI e degli AUTOVETTORI dalla matrice di correlazione.

Cosa sono gli AUTOVALORI e gli AUTOVETTORI? Vengono calcolati direttamente dalla matrice di correlazione R attraverso un processo algebrico. R x AUTOVETTORE = AUTOVETTORE x AUTOVALORE AUTOVETTORE x R devessere uguale a se stesso a meno di una costante che si chiama AUTOVALORE. Autovalori = la quantità di varianza di un fattore, la comunalità. Autovettori = sono i fattori o componenti.

Come decidere quanti fattori tenere? 1. Posso decidere un numero preciso da tenere (sottoscale). 2. Posso decidere la percentuale di informazione spiegata che voglio tenere (60-65%). 3. Tengo solo i fattori con varianza maggiore o uguale ad Guardo lo scree plots.

A cosa mi servono le nuove variabili? - Compattazione dei dati. - Tengo un numero inferiore di dati, perdo una parte accettabile dinformazione ed ho una interpretazione delle variabili in studio. - Guardo il legame tra fattori e variabili di partenza. - Osservando la matrice per colonna posso indagare quanto i singoli fattori sono correlati alle variabili di partenza. - Osservando la matrice per riga è possibile decidere quali sono gli item da scartare in relazione alla loro correlazione con i fattori (quelli meno correlati).

E possibile calcolare il valore ad ogni fattore soggetto per soggetto. Punteggio grezzo del soggetto 1 allitem 1 Coefficiente di correlazione tra item 1 e fattore 1 Faccio la stessa cosa con tutti gli item (1, 2, 3, …), sommo tutti i prodotti ed ottengo il punteggio del soggetto 1 al fattore 1. X Tali punteggi saranno variabili Z con media = 0 e varianza = 1.

Metodo dei minimi quadrati Minimizza la somma dei quadrati degli scarti fra i dati osservati e la matrice di correlazione prodotta dal modello.

Metodo della Massima Verosimiglianza Questa tecnica affronta la casualità in termini inversi rispetto alla probabilità: Lavora per approssimazioni successive e stima una matrice di correlazione e uninsieme di varianze che rappresentano i dati sperimentali, eliminando la ridondanza con la minima dispersione dinformazione. parte dai dati sperimentali e si chiede che probabilità cè di avere una distribuzione del fenomeno di un certo tipo.

Lo scopo principale è quello di rappresentare al meglio la realtà. LAnalisi Fattoriale è utilizzata per studiare modelli che rappresentino al meglio la realtà, caratterizzati da legami tra item e fattori, in altre parole modelli a variabili artificiali, latenti. La tecnica della Massima Verosimiglianza ci offre la miglior rappresentazione della realtà possibile e ci da anche la misura di quanto bene riesca a rappresentarla!

Tale tecnica parte dallestrazione dei fattori delle Componenti Principali. Vengono modificati i fattori per rappresentare al meglio gli item sperimentali. Aumenta e diminuisce la varianza dei fattori e contemporaneamente vengono modificati anche gli altri fattori finchè non trova la combinazione di fattori, varianze, che rappresentano al meglio la realtà.

Ogni volta che si fa una modifica viene applicato il test del Chi2 per misurare la bontà delladattamento dei dati. La significatività indica che la modifica apportata è significativamente migliore rispetto ai fattori delle Componenti Principali (e della modifica precedente). Il valore reale (dati grezzi) è differente dal valore dei fattori (calcolato), così il Chi2 confronta le due situazioni relative agli stessi dati e ci dice quanto è reale la rappresentazione attuale. Quando fermarsi?

Ottengo anche in questo caso delle variabili ortogonali ma non avrò il primo fattore con la maggior quantità dinformazione spiegata e i fattori successivi con varianza man mano sempre minore. Per creare fattori non ridondanti non è necessario creare un fattore principale con effetto a cascata sulla quantità di varianza degli altri, anzi la maggior parte dei questionari distribuisce in modo equo linformazione fra i diversi item.. Cè una distribuzione equa, più simile possibile alla realtà dellinformazione.

Componenti Principali Massima Verosimiglianza Calcola i fattori attraverso una formula diretta. Calcola i fattori attraverso una formula diretta. Offre la miglior condensazione di varianza,con la minima dispersione dinformazione; questo non significa che rappresenta la realtà nel miglior modo. Offre la miglior condensazione di varianza,con la minima dispersione dinformazione; questo non significa che rappresenta la realtà nel miglior modo. Al variare del numero di fattori da tenere l analisi non cambia Al variare del numero di fattori da tenere l analisi non cambia Usa la tecnica delle approssimazioni successive. Usa la tecnica delle approssimazioni successive. Trova i fattori che meglio rappresentano la realtà. Trova i fattori che meglio rappresentano la realtà. Non lavora con troppe o troppo poche variabili. Non lavora con troppe o troppo poche variabili. Se vario il numero di fattori che sono interessato a tenere devo rifare lanalisi. Se vario il numero di fattori che sono interessato a tenere devo rifare lanalisi. Maggiore sarà il numero delle variabili di partenza e maggiore sarà la differenza dei risultati delle due analisi.

III Operazione: Rotazione dei fattori Modifica la relazione esistente tra item e fattori attraverso una rotazione dei fattori. Con la rotazione operiamo una combinazione lineare dei fattori di partenza in modo da modificare la loro relazione con gli item. Tali fattori possono rimanere fra loro ortogonali oppure divenire non ortogonali.

Nasce principalmente da due critiche: La rotazione rende i fattori maggiormente interpretabili. 1.Vengono scoperte variabili latenti indipendenti. 2. Vengono dati dei nomi ai fattori. Una diversa interpretazione dei fattori, e del loro legame con gli item, modifica linterpretazione e il significato della ricerca!

Mentre la rotazione ORTOGONALE mantiene lindipendenza dei fattori, la rotazione OBLIQUA rende i fattori correlati fra loro. Le rotazioni sono meglio interpretabili attraverso un grafico cartesiano dove gli assi rappresentano i fattori e le coordinate sono date dalle correlazioni della matrice R. La rotazione può essere ORTOGONALE oppure OBLIQUA.

Con la rotazione ORTOGONALE ruoto rigidamente gli assi cartesiani ed essi rimangono ortogonali e la somma totale delle varianze rimane uguale al totale della variabili di partenza. Con la rotazione OBLIQUA gli assi cartesiani non sono più perpendicolari fra loro ma obliqui, quindi non sono più indipendenti ma correlati e la somma totale delle varianze non corrisponderà più al numero totale delle variabili di partenza.

Varimax Method. Effettua una rotazione ortogonale che minimizza il numero di variabili che sono fortemente correlate con ogni fattore. Il peso dei fattori è così distribuito più uniformemente e linterpretazione dei fattori è semplificata. Tecniche di rotazione: Quartimax Method. Ha un funzionamento opposto a quello della Varimax. Minimizza il numero di fattori necessari a spiegare ciascuna variabile. Semplifica la spiegazione delle variabili osservate.

Equamax Method. È una combinazione fra il varimax e il quartimax. Oblimin Rotation. Rotazione obliqua che cerca di adattare i fattori agli item e li correla. Promax Rotation. Rotazione obliqua. E un metodo più diretto che cerca la rotazione che meglio si adatta a rappresentare i fattori con un singolo item e lo fa direttamente.

Ultima fase: Utilizzo dei punteggi fattoriali per ulteriori analisi Attraverso la correlazione fra i punteggi dei fattori calcolati su ciascun caso è possibile verificare la correlazione fra i fattori e le sottoscale.

Grazie per lattenzione