L’Analisi Fattoriale (PCA) con SPSS

Slides:



Advertisements
Presentazioni simili
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Advertisements

SCALA INTERVALLO / A RAPPORTO
2. Introduzione alla probabilità
Come organizzare i dati per un'analisi statistica al computer?
ESERCITAZIONE L’analisi Fattoriale.
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
Presupposti alla lezione
POTENZE cosa sono proprietà curiosità visualizzazione.
La regressione lineare trivariata
Analisi Fattoriale Tecnica utilizzata per studiare, riassumere e semplificare le relazioni in un insieme di variabili.
Analisi Fattoriale Esplorativa
Descrizione dei dati Metodi di descrizione dei dati
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
Analisi fattoriale L’analisi fattoriale è un procedimento matematico-statistico che, partendo dalle risposte date da un gruppo di soggetti ad una serie.
ANALISI FATTORIALE E PSICOLOGIA
C – Indici di Asimmetria e Curtosi
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
Ripasso (dallanalisi univariata allanalisi fattoriale) Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°7.
Inferenza statistica per un singolo campione
GRIGLIA PER LA LETTURA DI UN LAVORO SCIENTIFICO
Analisi della varianza (a una via)
CORSO DI MODELLI DI SISTEMI BIOLOGICI LAUREA IN INGEGNERIA CLINICA E BIOMEDICA.
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Analisi delle corrispondenze
Analisi dei gruppi – Cluster Analisys
Dall’analisi Fattoriale alla regressione lineare
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Principali analisi statistiche
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
Laboratorio di Metodologia Modulo: Metodologie Quantitative
Le distribuzioni campionarie
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
ANALISI FATTORIALE. Cosè lanalisi fattoriale? Statistica descrittiva Rappresentazione delle variabili in studio. Statistica confermativa vs Confermare,
Esercizi riepilogativi Analisi Univariata e Bivariata Analisi Fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°5.
L’ANALISI IN COMPONENTI PRINCIPALI
Presentazione di una ricerca: Fetal Alcohol Syndrome - Kristina Gummel - I parte: presentazione del disegno di ricerca e della metodologia utilizzata II.
POTENZE cosa sono proprietà curiosità visualizzazione.
La Moltiplicazione – Base 4 (0,1,2,3) Step 1 – Elemento base: # • #
Le variabili casuali e la loro distribuzione di probabilità Generalmente, lanciando un dado, si considera il valore numerico della faccia uscita.
Misurare la diversità Alessandro Giuliani. La diversità può essere definita solo in riferimento ad una popolazione e per quanto riguarda una misura dotata.
La regressione come strumento di sintesi delle relazioni tra variabili
LABORATORIO DI ANALISI AVANZATA DEI DATI Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LINEARE MULTIPLA Esempio (d)istruttivo.
SELF-DIRECTED SEARCH e BIG FIVE Integrazione PADOVA 26 e 27 marzo 2010.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9 Regressione lineare multipla: la stima del modello e la sua valutazione, metodi automatici.
La regressione II Cristina Zogmaister.
modelli classici e sviluppi recenti
Esame di Analisi Multivariata dei Dati
ANALISI DEI DATI STATISTICI
Due esempi con dati reali
L’analisi del contenuto Doppia funzione dell’analisi del contenuto: -Può essere un tipo di ricerca specifico -Può essere una tecnica di ricerca Come TECNICA.
Accenni di analisi monovariata e bivariata
1 Corso di Laurea magistrale in Psicologia Clinica, dello Sviluppo e Neuropsicologia Esame di Analisi Multivariata dei Dati Introduzione all’analisi fattoriale.
La correlazione.
Metodi Quantitativi per Economia, Finanza e Management Lezioni n°7-8.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Corso di Laurea in Scienze e tecniche psicologiche
Accenni di analisi monovariata e bivariata
Direzione Centrale Servizi ai Contribuenti Customer Satisfaction 2014 Calcolo del Bollo Auto online.
Direzione Centrale Servizi ai Contribuenti Customer Satisfaction 2014 Unico web.
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
EPG di Metodologia della ricerca e Tecniche Multivariate dei dati A.A
Riduzione dei Dati. Nelle scienze sociali ci si trova molto spesso di fronte a ricerche in cui vi è una sovrabbondanza di misurazioni nel tentativo di.
L’analisidei dati L’analisi dei dati Analisi mutlidimensionali: Analisi delle corrispondenze multiple Cluster Analysis.
Analisi delle osservazioni
Esercitazione 8 Correzione simulazione esame AMD
Transcript della presentazione:

L’Analisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Aprire lib/psico/corsi/zogmaister Trascinare SECONDA LEZIONE nel vostro spazio Lanciare SPSS PASW 18 Aprire dal vostro spazio il file customer_satisfaction.sav

L’Analisi Fattoriale è un processo iterativo Passi preliminari Selezionare e misurare un insieme di variabili verificare l’adeguatezza delle variabili – es. normalità delle distribuzioni, presenza di outlier, linearità delle relazioni, rapporto tra nr. di variabili e nr. di fattori attesi, rapporto tra nr. di variabili e nr. di soggetti.

L’Analisi Fattoriale è un processo iterativo Analisi fattoriale (processo iterativo) Eseguire una prima analisi fattoriale Determinare il numero di fattori Eseguire la rotazione prima obliqua, poi eventualmente ortogonale Interpretare i risultati e dare un nome ai fattori Il criterio che guida l’AF è l’interpretabilità Una buona AF ‘ha senso’, una cattiva AF ‘non ha senso’

L’Analisi Fattoriale è un processo iterativo Passi successivi: verificare la struttura fattoriale (replicabilità), stabilire la validità di costrutto dei fattori (correlazioni con altre variabili; effetto delle manipolazioni sui punteggi fattoriali)

File dati: customer_satisfaction.sav Intervista a 200 clienti di un ristorante Obiettivo: capire quali sono gli aspetti che determinano il livello di soddisfazione nei confronti del ristorante Ipotesi di partenza: 4 aspetti Qualità del cibo Qualità del servizio (cortesia del personale) Ambiente Prezzo

Il questionario 12 domande relative ai quattro aspetti ipotizzati alla base della soddisfazione dei clienti (x1 – x12) Qualità del cibo Qualità del servizio (cortesia del personale) Ambiente Prezzo 3 domande sulla soddisfazione (d1 – d3) 3 domande sociodemografiche

E’ possibile riassumere le risposte relative alla soddisfazione nelle 4 dimensioni ipotizzate? Sono rispettati i prerequisiti per un’analisi fattoriale? Ampiezza del campione idealmente 300 casi o più, ma dipende da numero di fattori, forza delle relazioni tra le variabili Adeguato numero di variabili Almeno 3 per ogni fattore (meglio di più) Ci sono outlier univariati (e multivariati)? Le variabili sono distribuite normalmente? Se le variabili non sono normali, la soluzione è meno chiara (e non si possono applicare test statistici che implicano la normalità) Le relazioni tra le coppie di variabili sono lineari? La matrice è fattorializzabile? correlazioni bivariate sufficientemente elevate (>|.30|) test di Bartlett (troppo sensibile)

L’analisi fattoriale Analizza Riduzione dimensione Fattoriale

Scegliamo le variabili su cui vogliamo operare la PCA (x1 – x12)

Indicazioni di base Chiediamo la matrice delle correlazioni Metodo di estrazione: PCA Numero di fattori (per il momento non lo conosciamo) Scree plot

Default: PCA Default: criterio mineigen

Esaminiamo l’output Matrice di correlazioni iniziali: diversi r>|.30|

Comunalità È la somma dei quadrati delle correlazioni della variabile con i fattori. Indica quanta della varianza della variabile è spiegata dai fattori

Varianza totale spiegata 3.159 / 12 = .26325 = 25% La varianza totale spiegata dai fattori (prima della rotazione) Mineigen

Scree plot Sia lo scree plot, sia il criterio mineigen suggeriscono la presenza di 4 componenti

Matrice delle componenti Matrice di correlazione tra le componenti e le variabili. Tutti e quattro i fattori sono correlati in maniera sostanziale (r>|.32|) con molte variabili e le variabili sono correlate con più fattori. La soluzione non è chiara (perché non è stata fatta la rotazione)

Eseguiamo la rotazione Ortogonale o obliqua? Prima obliqua, se non ci sono correlazioni sostanziali passiamo a una rotazione ortogonale.

Matrice di correlazione tra le componenti (in fondo all’output)

Rotazione ortogonale (varimax) Varianza totale spiegata: una nuova parte della tabella indica la varianza spiegata dai fattori dopo la rotazione La varianza totale non cambia rispetto a prima della rotazione, ma è suddivisa in maniera diversa tra i fattori

Matrice delle componenti ruotata Più chiara!!! Ogni variabile ha saturazioni importanti su una sola componente.

Interpretiamo le componenti 1 = ? 2 = ? 3 = ? 4 = ?

Report dell’analisi E’ stata condotta l’analisi delle componenti principali. Un primo esame dello screeplot suggeriva la presenza di 4 componenti. Anche il criterio Mineigen suggeriva una soluzione a 4 componenti. Questa numerosità corrispondeva a quella che era stata precedentemente ipotizzata in fase di costruzione del questionario. Le analisi successive hanno confermato la presenza di 4 componenti, non correlate. Con una rotazione obliqua (criterio oblimin) emergeva una correlazione massima tra le componenti di r = |.167|, perciò è stata condotta una rotazione ortogonale (criterio varimax). La soluzione a quattro componenti spiega il 75% della varianza osservata nelle variabili. Le quattro componenti sono interpretate come: qualità del cibo, qualità del servizio, ambiente, prezzo. La matrice delle componenti ruotate è presentata in Tab. 1.

Domanda n. 2: Le domande sulla soddisfazione (d1, d2, d3) possono essere riassunte in un unico punteggio? (la scala è monofattoriale?) Svolgete la PCA e provate a dare una risposta.

Risposta La PCA ha confermato la presenza di un unico fattore sottostante alle domande relative alla soddisfazione. I tre item sono altamente correlati tra di loro (correlazione minima r = .81) e un’unica componente spiega il 90 % della varianza.

Domanda n. 3 Legame tra le 4 componenti e la soddisfazione Calcolo dei punteggi nei fattori Punteggio fattoriale Punteggio sommato

Calcolo dei punteggi fattoriali Conduciamo l’analisi fattoriale Estrazione: PCA Nr. componenti: 4 Rotazione: Varimax Calcolo dei punteggi fattoriali

Date etichette appropriate

Calcolare il punteggio fattoriale per la soddisfazione Correlazione tra i quattro fattori di valutazione e il fattore di soddisfazione

Calcoliamo i punteggi sommati s.cibo = x1 + x4 + x9 s.personale = x6 + x11 + x12. s.ambiente = x2 + x7 + x8. s.prezzo = x3 + x 5 + x10. s.Sodd = d1 + d2 + d3.

Correlazioni Tra punteggi fattoriali e punteggi sommati: sono molto alte Tra punteggi sommati e soddisfazione: rivelano gli stessi legami già visti in precedenza.

Ora da soli: file personalità.sav A 459 persone è stato somministrato un questionario di self-report di personalità Dovevano valutare quanto si sentivano descritti da ciascuno di 44 diversi aggettivi Ipotesi: 5 componenti (big five) Energia Amicalità Coscienziosità Stabilità emotiva Apertura mentale Quante sono le componenti? Sono ortogonali o oblique? Corrispondono alle 5 componenti ipotizzate?

Quante sono le componenti?

Mineigen: 10

Quante sono le componenti? Mineigen: massimo 10 Scree plot: 5 Attesa teorica: 5 Partiamo da 5 componenti, vediamo se la soluzione è interpretabile

Le componenti sono correlate? (Rotazione oblimin) No

Rotazione Varimax – prima componente coscienziosità

Seconda componente: energia

Terza componente: (in)stabilità emotiva

Quarta componente: (mancanza di) amicalità

Quinta componente: apertura mentale

Da soli: BimbiCompetenze.sav 177 bambini della scuola per l’infanzia. Batteria di 10 test Questi punteggi possono essere ridotti a un numero inferiore di dimensioni? Quante? Quali? Sono correlate tra di loro? Quale percentuale di varianza osservata viene spiegata complessivamente, quale percentuale di varianza viene spiegata da ciascuna dimensione? Ci sono variabili pure? Quali? Suggerimenti per migliorare la batteria di test?