Metodi Quantitativi per Economia, Finanza e Management Lezioni n°7-8
Lettura di un test statistico (1) Esempio: 1) Ipotesi b1= b2 = ....=bk = 0 H0: H1: bi = 0 2) Statistica test Statistica F 3) p-value Rappresenta la probabilità di commettere l’errore di prima specie. Può essere interpretato come la probabilità che H0 sia “vera” in base al valore osservato della statistica test 1
Lettura di un test statistico (2) Se p-value piccolo RIFIUTO H0 Altrimenti ACCETTO H0 1
Analisi fattoriale Quando le variabili considerate sono numerose spesso risultano tra loro correlate. Numerosità e correlazione tra variabili porta a difficoltà di analisi => ridurre il numero (semplificando l’analisi) evitando, però, di perdere informazioni rilevanti. L’Analisi Fattoriale è una tecnica statistica multivariata per l’analisi delle correlazioni esistenti tra variabili quantitative. A partire da una matrice di dati (n x p) con p variabili originarie, consente di sintetizzare l’informazione in un set ridotto di variabili trasformate (i fattori latenti).
Analisi fattoriale Perché sintetizzare mediante l’impiego della tecnica? Se l’informazione è “dispersa” tra più variabili correlate tra loro, le singole variabili faticano da sole a spiegare il fenomeno oggetto di studio, mentre combinate tra loro risultano molto più esplicative. Esempio: l’attrattività di una città da cosa è data? Dalle caratteristiche del contesto, dalla struttura demografica della popolazione, dalla qualità della vita, dalla disponibilità di fattori quali capitale, forza lavoro, know-how, spazi, energia, materie prime, infrastrutture, ecc. I fattori latenti sono “concetti” che abbiamo in mente ma che non possiamo misurare direttamente.
Le ipotesi del Modello Fattoriale Analisi fattoriale Le ipotesi del Modello Fattoriale Variabili Quantitative x1, x2, ......, xi, ......... xp Info xi = Info condivisa + Info specifica Var xi = Communality + Var specifica xi = f(CF1, ....,CFk) + UFi i = 1, ........., p k << p CFi = Common Factori UFi = Unique Factori Corr (UFi , UFj) = 0 per i ^= j Corr (CFi , CFj) = 0 per i ^= j Corr (CFi , UFj) = 0 per ogni i,j
Factor Loadings & Factor Score Coefficients Analisi fattoriale Factor Loadings & Factor Score Coefficients xi = li1CF1 + li2CF2 + .... + likCFk + UFi li1, li2,........,lik factor loadings i = 1, ........., p significato fattori CFj = sj1x1 + sj2x2 + .............. + sjpxp sj1, sj2,........,sjp factor score coeff. j = 1, ....., k << p costruzione fattori
Metodo delle Componenti Principali Analisi fattoriale Metodo delle Componenti Principali Uno dei metodi di stima dei coefficienti (i LOADINGS) è il Metodo delle Componenti Principali. Utilizzare tale metodo significa ipotizzare che il patrimonio informativo specifico delle variabili manifeste sia minimo, mentre sia massimo quello condiviso, spiegabile dai fattori comuni. Per la stima dei loadings si ricorre agli autovalori e agli autovettori della matrice di correlazione R: di fatto i loadings coincidono con le correlazioni tra le variabili manifeste e le componenti principali.
Metodo delle Componenti Principali Analisi fattoriale Metodo delle Componenti Principali I fattori calcolati mediante il metodo delle CP sono combinazioni lineari delle variabili originarie Sono tra loro ortogonali (non correlate) Complessivamente spiegano la variabilità delle p variabili originarie Sono elencate in ordine decrescente rispetto alla variabilità spiegata CPj = sj1x1 + sj2x2 + .............. + sjpxp
Metodo delle Componenti Principali Analisi fattoriale Metodo delle Componenti Principali Il numero massimo di componenti principali è pari al numero delle variabili originarie (p). La prima componente principale è una combinazione lineare delle p variabili originarie ed è caratterizzata da varianza più elevata, e così via fino all’ultima componente, combinazione sempre delle p variabili originarie, ma a varianza minima. Se la correlazione tra le p variabili è elevata, un numero k<<p (k molto inferiore a p )di componenti principali è sufficiente rappresenta in modo adeguato i dati originari, perché riassume una quota elevata della varianza totale.
Analisi fattoriale I problemi di una analisi di questo tipo sono: a)-quante componenti considerare rapporto tra numero di componenti e variabili; percentuale di varianza spiegata; le comunalità lo scree plot; interpretabilità delle componenti e loro rilevanza nella esecuzione dell’analisi successive b)-come interpretarle correlazioni tra componenti principali e variabili originarie rotazione delle componenti
Analisi Fattoriale Qualità degli ingredienti Genuinità Leggerezza Sapore/Gusto Caratteristiche Nutrizionali Attenzione a Bisogni Specifici Lievitazione Naturale Produzione Artigianale Forma/Stampo Richiamo alla Tradizione Grandezza della Confezione (Peso Netto) Funzionalità della Confezione Estetica della Confezione Scadenza Nome del Biscotto Pubblicità e Comunicazione Promozione e Offerte Speciali Consigli per l’Utilizzo Prezzo Notorietà della Marca Sono stati individuati 20 attributi caratterizzanti il prodotto-biscotto È stato chiesto all’intervistato di esprimere un giudizio in merito all’importanza che ogni attributo esercita nell’atto di acquisto
Analisi fattoriale
Analisi fattoriale
Analisi fattoriale
Analisi Fattoriale
Analisi fattoriale Aspetti Interpretativi: La matrice delle saturazioni (factor loadings) La parte forse più rilevante dell’output di analisi fattoriale è costituita dalla cosiddetta “component matrix”, che riporta le correlazioni tra le variabili originarie e le componenti individuate (factor loadings) Ciascuna variabile viene associata in particolare al fattore col quale possiede la correlazione più elevata Il fattore viene quindi interpretato considerando le variabili ad esso associate
Analisi fattoriale Aspetti Interpretativi: La rotazione dei fattori Esistono infiniti output di analisi fattoriale compatibili con gli stessi dati di input Ovviamente questi infiniti output in generale non forniscono interpretazioni del fenomeno pesantemente contrastanti tra loro, ma differiscono solo marginalmente e nelle aree di ambiguità
Analisi fattoriale CFj CF*i CF*j x1 x4 x2 CFi x3 interpretazione le coordinate nel grafico sono i factor loadings interpretazione dei fattori CF*i CF*j x4 x3
Analisi fattoriale Aspetti Interpretativi: La rotazione dei fattori Il metodo di rotazione Varimax, proposto da Kaiser, ha come obiettivo la minimizzazione del numero di variabili che possiedono saturazioni elevate per ciascun fattore, Il metodo Quartimax cerca di minimizzare il numero di fattori fortemente correlati a ciascuna variabile, Il metodo Equimax è una combinazione di Varimax e Quartimax La percentuale di varianza complessiva dei fattori ruotati rimane inalterata, mentre si modifica la percentuale di varianza spiegata da ciascun fattore
Analisi Fattoriale
Analisi fattoriale Una volta scelta la soluzione ottimale, è possibile utilizzare i fattori ottenuti come nuove “macro-variabili” da inserire in ulteriori analisi sul fenomeno indagato, al posto delle variabili originarie; Considerando ancora l’esempio proposto, nel file di dati si potranno aggiungere 6 nuove variabili: Salute, Convenienza & Praticità, Immagine, Artigianalità, Comunicazione, Sapore & Gusto. Si tratta di variabili standardizzate (ovvero a media nulla e varianza unitaria), che costituiranno l’input per le analisi successive (dipendenza e/o interdipendenza).
Analisi fattoriale Individuazione variabili di analisi standardizzazione metodo c.p. prime evidenze numero di fattori rotazione interpretazione 1