L’ANALISI IN COMPONENTI PRINCIPALI

Slides:



Advertisements
Presentazioni simili
Selezione delle caratteristiche - Principal Component Analysis
Advertisements

Come organizzare i dati per un'analisi statistica al computer?
ESERCITAZIONE L’analisi Fattoriale.
Capitolo 8 Sistemi lineari.
COORDINATE POLARI Sia P ha coordinate cartesiane
6. Catene di Markov a tempo continuo (CMTC)
L’Analisi Fattoriale (PCA) con SPSS
Introduzione all’analisi fattoriale
Analisi Fattoriale Tecnica utilizzata per studiare, riassumere e semplificare le relazioni in un insieme di variabili.
Analisi Fattoriale Esplorativa
Algebra delle Matrici.
Analisi fattoriale L’analisi fattoriale è un procedimento matematico-statistico che, partendo dalle risposte date da un gruppo di soggetti ad una serie.
ANALISI DELLA COVARIANZA
ANALISI FATTORIALE E PSICOLOGIA
Università degli Studi di Cagliari
6. Catene di Markov a tempo continuo (CMTC)
Progetto Pilota 2 Lettura e interpretazione dei risultati
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Analisi fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
ALCUNI METODI STATISTICI PER LA SELEZIONE DELLE VARIABILI NELL’ANALISI DISCRIMINANTE Eliminazione di variabili con contributo discriminatorio statisticamente.
Teoria e Tecniche del Riconoscimento
Analisi della varianza (a una via)
La logica della regressione
CORSO DI MODELLI DI SISTEMI BIOLOGICI LAUREA IN INGEGNERIA CLINICA E BIOMEDICA.
BIOINGEGNERIA S. Salinari Lezione 8. RETI AD APPRENDIMENTO NON SUPERVISIONATO Le reti ad apprendimento non supervisionato debbono essere in grado di determinare.
STATISTICA a.a PARAMETRO t DI STUDENT
Modello di regressione lineare semplice
Analisi delle corrispondenze
Analisi dei gruppi – Cluster Analisys
OPERAZIONI CON TRINOMI DI II° GRADO
Valutazione di Incidenza di un piano di lottizzazione per edilizia residenziale in zona p.SIC n Località balneare Lido Morelli e Pilone Caroli.
Dall’analisi Fattoriale alla regressione lineare
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
ANALISI FATTORIALE. Cosè lanalisi fattoriale? Statistica descrittiva Rappresentazione delle variabili in studio. Statistica confermativa vs Confermare,
UNIVERSITÀ DI PISA FACOLTÀ DI INGEGNERIA CORSO DI LAUREA SPECIALISTICA IN INGEGNERIA INFORMATICA PER LA GESTIONE D’AZIENDA Tesi di laurea: Progettazione.
La regressione come strumento di sintesi delle relazioni tra variabili
DATA MINING PER IL MARKETING
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Analisi Fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Dall’Analisi Fattoriale alla Regressione Lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n° 11.
OPERAZIONI CON TRINOMI DI II° GRADO
DATA MINING PER IL MARKETING
Introduzione alla regressione multipla
Esempio di estrazione delle componenti principali
modelli classici e sviluppi recenti
Esame di Analisi Multivariata dei Dati
Analisi di Immagini e Dati Biologici Introduzione al linguaggio di MATLAB/OCTAVE Parte 2 16 L5.
ANALISI DEI DATI STATISTICI
La verifica d’ipotesi Docente Dott. Nappo Daniela
1 Corso di Laurea magistrale in Psicologia Clinica, dello Sviluppo e Neuropsicologia Esame di Analisi Multivariata dei Dati Introduzione all’analisi fattoriale.
IL CAMPIONE.
Analisi fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezioni n°7-8.
REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Sistemi di equazioni lineari. Sistemi di primo grado di due equazioni a due incognite Risolvere un sistema significa trovare la coppia di valori x e y.
Riduzione dei Dati. Nelle scienze sociali ci si trova molto spesso di fronte a ricerche in cui vi è una sovrabbondanza di misurazioni nel tentativo di.
Lezione n° 10 Algoritmo del Simplesso: - Coefficienti di costo ridotto - Condizioni di ottimalità - Test dei minimi rapporti - Cambio di base Lezioni di.
La funzione CASUALE. Gli istogrammi.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
L’analisidei dati L’analisi dei dati Analisi mutlidimensionali: Analisi delle corrispondenze multiple Cluster Analysis.
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
Transcript della presentazione:

L’ANALISI IN COMPONENTI PRINCIPALI L’Analisi in Componenti Principali è una tecnica fattoriale. Ciò significa che: essendo una tecnica e non un modello, si muove essenzialmente su un versante esplorativo; essendo una tecnica fattoriale, prevede l’analisi di fattori o dimensioni latenti L’ACP non è l’unica tecnica fattoriale esistente. Ad essa si possono aggiungere l’analisi dei fattori comuni, il metodo dei minimi quadrati generalizzati e la massima verosimiglianza. Analisi in componenti principali

I passaggi essenziali Standardizzare le variabili (es: descriptives /variables qi_mate to creativi /options 3.) Scegliere il numero di fattori (o componenti) da estrarre (a meno che non si voglia compiere questa operazione dopo avere analizzato l’output) Decidere se ed eventualmente a quale tipo di rotazione sottoporre i fattori Scartare le variabili che mostrano bassi valori di comunalità e che tendono a non saturare alcuna componente Ripetere l’ACP nel caso in cui si vada alla ricerca di soluzioni più convincenti Verificare le correlazioni tra i fattori estratti ed eventualmente variare la tecnica di rotazione dei fattori Ripetere l’analisi fino a quando non si trova una soluzione teoricamente soddisfacente Analisi in componenti principali

Glossario Matrice di correlazione. Riporta tutti i coefficienti di correlazione di un gruppo di variabili tra loro. È proprio questa matrice che viene analizzata e semplificata attraverso l’analisi fattoriale. Fattore. Corrisponde ad una dimensione o costrutto non misurabile direttamente (quindi latente) che riassume le relazioni tra un insieme di variabili originarie, che sono state misurate e delle quali si conosce la matrice di correlazione. Saturazione fattoriale. La saturazione è il coefficiente che esprime solitamente la correlazione tra una variabile originaria misurata ed il fattore. Elevando la saturazione fattoriale al quadrato otteniamo la porzione di varianza della variabile spiegata dal fattore. Auto yalore. La somma dei quadrati delle saturazioni delle variabili costituenti un fattore è uguale all’autovalore (o radice caratteristica) associato al fattore; l’autovalore diviso per il numero delle variabili costituenti un fattore è uguale alla proporzione di varianza totale spiegata dal fattore. Ogni fattore estratto ha un autovalore corrispondente. Nell’analisi delle componenti principali il primo fattore estratto è quello che ha l’autovalore più grande, ossia è il fattore che spiega la porzione maggiore di varianza dei dati rispetto agli altri fattori. Comunaiità Indica la proporzione di varianza della variabile spiegata dai fattori, calcolata elevando al quadrato la somma delle saturazioni fattorialì della variabile su tutti i fattori estratti. Valori di comunalità inferiori a 0,25 devono metterci in guardia rispetto al possibile uso di quelle determinate variabili che li producono. Analisi in componenti principali

Fattori con autovalore maggiore di 1 Operazioni preliminari: criteri per decidere il numero di fattori da estrarre Teorico Fattori con autovalore maggiore di 1 Uso dello scree-test, ovvero salti nell’entità degli autovalori Analisi in componenti principali

Operazioni preliminari: l’analisi delle correlazioni tra variabili A questo punto ha inizio l'analisi in componenti principali vera e propria. Per accertarsi della possibilità di applicare ragionevolmente questa tecnica di analisi multi-dimensionale, è indispensabile che il ricercatore analizzi preliminarmente la matrice delle correlazioni. Il comando è il seguente: factor /variables [var A] to [var Z] /print correlation. Analisi in componenti principali

Operazioni preliminari: testare la matrice Ulteriori test che risultano utili, anche se non indispensabili, al ricercatore, sono quello di Kaiser-Meyer e Olkin (KMO) e il test di sfericità di Bartlett. Il primo si basa sul coefficiente di correlazione parziale. Se la variabile partecipa al fattore comune, una volta tolti gli effetti lineari delle altre variabili, ci sarà una bassa correlazione tra coppie di variabili. La correlazione parziale stima la correlazione con il fattore unico, che in teoria non è correlato con le altre variabili. Un piccolo valore per la correlazione parziale è quindi appropriato per confermare gli assunti di base dell'analisi. Il valore negativo dei coefficienti di correlazione parziale forma l'anti-immagine della matrice di correlazione (AIC). Se la proporzione di coefficienti alti è grande, va riconsiderata la possibilità di adottare l'analisi fattoriale su quei dati. Valori buoni o discreti per KMO sono maggiori di 0,60. Valori inferiori a 0.50 sono inaccettabili. factor /variables [var A] to [var Z] /print kmo aic. Analisi in componenti principali

Metodi di rotazione dei fattori Esistono essenzialmente due famiglie di metodi: quelli che rendono ortogonali (cioè non correlate) le componenti e quelli che le rendono oblique. I primi hanno il suffisso in –max, i secondi il prefisso in obli-. I più usati metodi di rotazione dei fattori sono: Varimax, rotazione ortogonale che messimizza la somma delle varianze mantenendo i fattori tra loro non correlati (ortogonali, appunto) Oblimin, in cui gli assi non sono ortogonali, ma correlati tra loro. Le variabili in questo modo hanno tute saturazioni vicine allo 0 in tutti i fattori, tranne uno. Analisi in componenti principali

Il senso della rotazione dei fattori Analisi in componenti principali

Autovalori, autovettori, comunalità Variabile I autovettore II autovettore III autovettore IV autovettore V autovettore Somma per riga (comunalità) X1 .473 .065 .426 .033 .003 1 X2 .457 .237 .213 .092 .000 X3 .659 .123 .004 .001 X4 .814 .134 .052 X5 .576 .365 .024 .002 I autovalore II autovalore III autovalore IV autovalore V autovalore Varianza totale Somma per colonna = autovalore 2.979 0.924 0.668 0.340 0.089 5 Analisi in componenti principali

Autovalori, autovettori, comunalità Variabile I autovettore II autovettore Somma per riga (comunalità) X1 0,473 0,065 0,538 X2 0,457 0,237 0,694 X3 0,659 0,123 0,782 X4 0,814 0,134 0,948 X5 0,576 0,365 0,941 I autovalore II autovalore Varianza totale Somma per colonna = autovalore 2.979 0.924 5 Analisi in componenti principali

Fasi successive, 1 A questo punto ha inizio l'estrazione dei fattori vera e propria. Il comando è il seguente: factor /variables [var A] … [var Z]. Per assicurarsi che qualche fattore, con autovalore inferiore ad 1, non possa servirci per l'analisi, è ragionevole verificare il contributo dei diversi fattori attraverso l'analisi grafica. factor /variables [var A] … [var Z]/plot eigen. Ottenuta la conferma circa l'estrazione dei fattori attraverso l'analisi grafica, si passa quindi a vedere in quale misura ciascuna variabile contribuisce alla formazione di ognuno degli N fattori. Analisi in componenti principali

Fasi successive, 2 L'interpretazione dei fattori può essere favorita da uno dei 4 metodi di rotazione degli assi. I comandi possono essere dati contemporaneamente, con questo comando: factor /variables [var a] … [var z] / extract pc / rotation varimax / plot=rotaton(1,2) / rotation quartimax / plot=rotaton(1,2) / rotation equamax / plot=rotaton(1,2) / rotation oblimin / plot=rotaton(1,2) / rotation norotate / plot=rotaton(1,2). Per visualizzare meglio i contributi forniti da ciascuna variabile ad ognuno degli N fattori, si può richiedere al calcolatore di fornire un output che presenti soltanto i valori che superano una determinata soglia, che può essere posta a 0,5. Infine, le variabili originarie sintetizzate negli N fattori possono essere sostituite, per ciascun caso, dai pesi fattoriali ottenuti da ognuna delle cinque componenti. Questi pesi resteranno attivi per tutte le operazioni successive, tramite il comando: factor /variables [var a] … [var z] / criteria factor (5) /save bart (all pf). Analisi in componenti principali