Metodi Quantitativi per Economia, Finanza e Management Lezioni n°7-8
Lettura di un test statistico (1) Esempio: 1) Ipotesi b1= b2 =....=bk = 0H0:H0: H1:H1: bi = 0 2) Statistica test Statistica F 3) p-value Rappresenta la probabilità di commettere l’errore di prima specie. Può essere interpretato come la probabilità che H 0 sia “vera” in base al valore osservato della statistica test
Lettura di un test statistico (2) Se p-value piccolo RIFIUTO H 0 Altrimenti ACCETTO H 0
Analisi fattoriale Quando le variabili considerate sono numerose spesso risultano tra loro correlate. Numerosità e correlazione tra variabili porta a difficoltà di analisi => ridurre il numero (semplificando l’analisi) evitando, però, di perdere informazioni rilevanti. L’Analisi Fattoriale è una tecnica statistica multivariata per l’analisi delle correlazioni esistenti tra variabili quantitative. A partire da una matrice di dati (n x p) con p variabili originarie, consente di sintetizzare l’informazione in un set ridotto di variabili trasformate (i fattori latenti).
Analisi fattoriale Perché sintetizzare mediante l’impiego della tecnica? Se l’informazione è “dispersa” tra più variabili correlate tra loro, le singole variabili faticano da sole a spiegare il fenomeno oggetto di studio, mentre combinate tra loro risultano molto più esplicative. Esempio: l’attrattività di una città da cosa è data? Dalle caratteristiche del contesto, dalla struttura demografica della popolazione, dalla qualità della vita, dalla disponibilità di fattori quali capitale, forza lavoro, know-how, spazi, energia, materie prime, infrastrutture, ecc. I fattori latenti sono “concetti” che abbiamo in mente ma che non possiamo misurare direttamente.
Analisi fattoriale Le ipotesi del Modello Fattoriale Variabili Quantitative x 1, x 2,......, x i, x p Info x i = Info condivisa + Info specifica Var x i = Communality + Var specifica x i = f(CF 1,....,CF k ) +UF i i = 1, , p k << p CF i = Common Factor i UF i = Unique Factor i Corr (UF i, UF j ) = 0 per i ^= j Corr (CF i, CF j ) = 0 per i ^= j Corr (CF i, UF j ) = 0 per ogni i,j
Analisi fattoriale Factor Loadings & Factor Score Coefficients x i = l i1 CF 1 + l i2 CF l ik CF k + UFi l i1, l i2, ,l ik factor loadings i = 1, , psignificato fattori CF j = s j1 x 1 + s j2 x s jp x p s j1, s j2, ,s jp factor score coeff. j = 1,....., k << pcostruzione fattori
Analisi fattoriale Metodo delle Componenti Principali Uno dei metodi di stima dei coefficienti (i LOADINGS) è il Metodo delle Componenti Principali. Utilizzare tale metodo significa ipotizzare che il patrimonio informativo specifico delle variabili manifeste sia minimo, mentre sia massimo quello condiviso, spiegabile dai fattori comuni. Per la stima dei loadings si ricorre agli autovalori e agli autovettori della matrice di correlazione R: di fatto i loadings coincidono con le correlazioni tra le variabili manifeste e le componenti principali.
I fattori calcolati mediante il metodo delle CP sono combinazioni lineari delle variabili originarie Sono tra loro ortogonali (non correlate) Complessivamente spiegano la variabilità delle p variabili originarie Sono elencate in ordine decrescente rispetto alla variabilità spiegata Analisi fattoriale Metodo delle Componenti Principali CP j = s j1 x 1 + s j2 x s jp x p
Il numero massimo di componenti principali è pari al numero delle variabili originarie (p). La prima componente principale è una combinazione lineare delle p variabili originarie ed è caratterizzata da varianza più elevata, e così via fino all’ultima componente, combinazione sempre delle p variabili originarie, ma a varianza minima. Se la correlazione tra le p variabili è elevata, un numero k<<p (k molto inferiore a p )di componenti principali è sufficiente rappresenta in modo adeguato i dati originari, perché riassume una quota elevata della varianza totale. Analisi fattoriale Metodo delle Componenti Principali
I problemi di una analisi di questo tipo sono: a)-quante componenti considerare 1.rapporto tra numero di componenti e variabili; 2.percentuale di varianza spiegata; 3.le comunalità 4.lo scree plot; 5.interpretabilità delle componenti e loro rilevanza nella esecuzione dell’analisi successive b)-come interpretarle 1.correlazioni tra componenti principali e variabili originarie 2.rotazione delle componenti Analisi fattoriale
Analisi Fattoriale Sono stati individuati 20 attributi caratterizzanti il prodotto-biscotto È stato chiesto all’intervistato di esprimere un giudizio in merito all’importanza che ogni attributo esercita nell’atto di acquisto 1.Qualità degli ingredienti 2.Genuinità 3.Leggerezza 4.Sapore/Gusto 5.Caratteristiche Nutrizionali 6.Attenzione a Bisogni Specifici 7.Lievitazione Naturale 8.Produzione Artigianale 9.Forma/Stampo 10.Richiamo alla Tradizione 11.Grandezza della Confezione (Peso Netto) 12.Funzionalità della Confezione 13.Estetica della Confezione 14.Scadenza 15.Nome del Biscotto 16.Pubblicità e Comunicazione 17.Promozione e Offerte Speciali 18.Consigli per l’Utilizzo 19.Prezzo 20.Notorietà della Marca
Analisi fattoriale
Analisi Fattoriale
Aspetti Interpretativi: La matrice delle saturazioni (factor loadings) –La parte forse più rilevante dell’output di analisi fattoriale è costituita dalla cosiddetta “component matrix”, che riporta le correlazioni tra le variabili originarie e le componenti individuate (factor loadings) –Ciascuna variabile viene associata in particolare al fattore col quale possiede la correlazione più elevata –Il fattore viene quindi interpretato considerando le variabili ad esso associate Analisi fattoriale
Aspetti Interpretativi: La rotazione dei fattori –Esistono infiniti output di analisi fattoriale compatibili con gli stessi dati di input –Ovviamente questi infiniti output in generale non forniscono interpretazioni del fenomeno pesantemente contrastanti tra loro, ma differiscono solo marginalmente e nelle aree di ambiguità Analisi fattoriale
x3x3 x4x4 CF i CF j x1x1 x2x2 le coordinate nel grafico sono i factor loadings Analisi fattoriale interpretazione dei fattori interpretazione dei fattori CF* i CF* j
Aspetti Interpretativi: La rotazione dei fattori –Il metodo di rotazione Varimax, proposto da Kaiser, ha come obiettivo la minimizzazione del numero di variabili che possiedono saturazioni elevate per ciascun fattore, –Il metodo Quartimax cerca di minimizzare il numero di fattori fortemente correlati a ciascuna variabile, –Il metodo Equimax è una combinazione di Varimax e Quartimax –La percentuale di varianza complessiva dei fattori ruotati rimane inalterata, mentre si modifica la percentuale di varianza spiegata da ciascun fattore Analisi fattoriale
Analisi Fattoriale
Una volta scelta la soluzione ottimale, è possibile utilizzare i fattori ottenuti come nuove “macro-variabili” da inserire in ulteriori analisi sul fenomeno indagato, al posto delle variabili originarie; Considerando ancora l’esempio proposto, nel file di dati si potranno aggiungere 6 nuove variabili: –Salute, –Convenienza & Praticità, –Immagine, –Artigianalità, –Comunicazione, –Sapore & Gusto. Si tratta di variabili standardizzate (ovvero a media nulla e varianza unitaria), che costituiranno l’input per le analisi successive (dipendenza e/o interdipendenza). Analisi fattoriale
Individuazione variabili di analisi standardizzazione metodo c.p. prime evidenze numero di fattori rotazione interpretazione Analisi fattoriale