IL MODELLO DI REGRESSIONE MULTIPLA

Slides:



Advertisements
Presentazioni simili
MATLAB.
Advertisements

Statistica Economica I
Come organizzare i dati per un'analisi statistica al computer?
Dipartimento di Economia
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Capitolo 8 Sistemi lineari.
Si definisce matrice di ordine mn una tabella della forma:
METODI EQUAZIONI DIFFERENZIALI Funzioni che mettono in relazione una variabile indipendente ( es. x), una sua funzione ( es. y = f(x) ) e la.
RICERCA IN UN VETTORE.
RICERCA IN UN VETTORE. Metodi basati sul confronto di chiavi Si confrontano gli elementi del vettore V con lelemento (chiave K) che si vuole ricercare.
Algebra delle Matrici.
Dipartimento di Economia
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 10.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°10.
Algebra Lineare. Algebra Lineare Esercizio Dato il vettore a := (3, 2, 5) , scrivere l’equazione cartesiana del piano  passante per.
Teoria e Tecniche del Riconoscimento
DIPARTIMENTO DI ELETTRONICA E INFORMAZIONE Stringhe e tipi di dati strutturati Marco D. Santambrogio – Ver. aggiornata al.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
RICHIAMI ELEMENTARI DI ALGEBRA MATRICIALE
MODELLO DI REGRESSIONE LINEARE MULTIPLA
Statistica per le decisioni aziendali ed analisi dei costi Modulo II - Statistica per le decisioni Aziendali Richiami di Algebra Matriciale.
Dip. Economia Politica e Statistica
E(’)= Riassumendo: ipotesi per OLS Modello lineare
Cinematica differenziale
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Sistemi di equazioni lineari
Trimr Gauss, tra le altre, fornisce una preziosissima funzione che risulta di estrema utilità nell’ambito matriciale. Questa funzione, chiamata trimr(x,t,b),
Modello di regressione lineare semplice
1 Y Modello di regressione semplice Supponiamo che una variabile Y sia funzione lineare di unaltra variabile X, con parametri incogniti 1 e 2 che vogliamo.
Statistica economica (6 CFU) Corso di Laurea in Economia e Commercio a.a Docente: Lucia Buzzigoli Lezione 13 1.
STATISTICA PER LE DECISIONI DI MARKETING
Lezione n° 18: Maggio Problema del trasporto: formulazione matematica Anno accademico 2008/2009 Prof. Cerulli – Dott.ssa Gentili Lezioni di.
Stabilità per E.D.O. (I): STABILITÀ LINEARIZZATA
Sottospazi vettoriali
DATA MINING PER IL MARKETING
DATA MINING PER IL MARKETING
Il modello di Regressione
Metodi Quantitativi per Economia, Finanza e Management Lezione n°11 Regressione lineare multipla: Analisi di influenza. Case Study.
DATA MINING PER IL MARKETING
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9 Regressione lineare multipla: la stima del modello e la sua valutazione, metodi automatici.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Domande riepilogative per l’esame
Strumenti statistici in Excell
redditività var. continua classi di redditività ( < 0 ; >= 0)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°10 Regressione lineare multipla: la valutazione del modello, metodi automatici di selezione.
Analisi Multivariata dei Dati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9.
Riassumendo: ipotesi per OLS 1.Modello lineare 2.X e Y sono frutto di osservazioni indipendenti 3.X è di rango pieno 4.I residui hanno media = 0 5.I residui.
Analisi discriminante lineare - contesto
REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta.
Regressione lineare - Esercizi
Regressione lineare - Esercizi Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°9.
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
Metodo di Cramer Dato il sistema lineare a due incognite per risolvere il sistema dobbiamo costruire 3 matrici. È detta matrice un qualsiasi gruppo di.
Esercitazioni di Statistica con Matlab Dott
DIPARTIMENTO DI ELETTRONICA E INFORMAZIONE Array n-dimensionali e tipi di dati strutturati Marco D. Santambrogio – Ver. aggiornata.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
Statistica per l’economia e l’impresa Capitolo 4 MODELLO DI REGRESSIONE LINEARE SEMPLICE.
MODELLO DI REGRESSIONE LINEARE MULTIPLA
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Transcript della presentazione:

IL MODELLO DI REGRESSIONE MULTIPLA Per le N osservazioni possiamo scrivere: VETTORE COLONNA (N*1)

MATRICE (N*K) VETTORE VETTORE COLONNA COLONNA (K*1) (N*1) IL MODELLO IN FORMA MATRICIALE DIVIENE:

(N*1) (N*K) (K*1) (N*1) LA MATRICE HA ELEMENTO GENERICO IN CUI L’INDICE j RAPPRESENTA LA VARIABILE (REGRESSORE) CONSIDERATA (j=1,2, … ,K) MENTRE L’INDICE i DENOTA LA i-ESIMA OSSERVAZIONE (i=1,2,…,N). OGNI COLONNA DI È UN VETTORE DI N OSSERVAZIONI COSTANTE PER REGRESSORI j INTERCETTA 1 2 ………K OSSERVAZIONI i 1 2 N

ASSUNZIONI PER STIME OLS 1. SPECIFICAZIONE LINEARE DEL MODELLO 2.a SONO NON STOCASTICI. 2.b IL RANGO DI È UGUALE A K<N 3. 4. LA VARIABILE DI ERRORE HA DISTRIBUZIONE NORMALE LA 2., RANK =K<N, ASSICURA L’ASSENZA DI MULTICOLLINEARITÀ. INFATTI QUANDO RANK < K UNA DELLE COLONNE SAREBBE COMBINAZIONE LINEARE DELLE ALTRE E QUINDI LA MATRICE RISULTEREBBE SINGOLARE LA 3. GARANTISCE CHE GLI ERRORI ABBIANO MEDIA NULLA, VARIANZA FINITA E COSTANTE E COVARIANZA NULLA. ESAMINIAMO LA MATRICE DI VARIANZA E COVARIANZA DERIVANTE DA OMOSCHEDASTICITA’ INCORRELAZIONE

ALLORA TUTTI I VALORI AL DI FUORI DELLA DIAGONALE PRINCIPALE SONO NULLI E QUELLI SULLA DIAGONALE SONO UGUALI A , CIOÈ:

OBIETTIVO: DETERMINARE IL VETTORE CHE MINIMIZZA LA QUANTITÀ STIMA OLS OBIETTIVO: DETERMINARE IL VETTORE CHE MINIMIZZA LA QUANTITÀ DOVE: VETTORE (N*1) DEI RESIDUI VETTORE (N*1) DEI VALORI TEORICI VETTORE DELLE STIME OLS SOSTITUENDO E IN SI HA: A B

QUESTO PERCHÈ A E B SONO ENTRAMBI DUE SCALARI UGUALI. INFATTI A =SCALARE (1*K) (K*N) (N*1) B ANALOGAMENTE MINIMIZZANDO LA , CIOÈ: SI HA: LA MATRICE DETTA MATRICE “CROSS-PRODUCT”, HA CERTAMENTE L’INVERSA per l’ipotesi che implica RANK =K ovvero NON SINGOLARE.

DIMENSIONI DELLE MATRICI MATRICE “CROSS-PRODUCT” = (K*N) (N*K)

VETTORE

PRODOTTO

DALLE RELAZIONI MATRICIALI VISTE SEGUONO DUE RISULTATI UTILI PER SUCCESSIVI SVILUPPI: 1) PERCHÈ 2) PERCHÈ: COME GIÀ VISTO E PERCHÈ: IL RISULTATO 1) CI DICE CHE IL PRODOTTO INCROCIATO TRA I REGRESSORI E GLI ERRORI È NULLO. CIÒ È LA TRADUZIONE CAMPIONARIA DELLA ASSUNZIONE , IN ALTRE PAROLE CHE I RESIDUI NON DEVONO DIPENDERE DAI REGRESSORI.

PROPRIETÀ DEGLI STIMATORI OLS VALORE ATTESO DI CON ALLORA: VETTORE DI STIMATORI CORRETTI

VARIANZA DEGLI STIMATORI DATO CHE GLI ELEMENTI DI A SONO NON STOCASTICI. NB LA matrice cross product è simmetrica

PERTANTO: VEDIAMO SE TALE VARIANZA È MINIMA. RICORDANDO CHE , CONSIDERIAMO LA MATRICE ARBITRARIA E LO STIMATORE LINEARE alternativo . LA MEDIA DI È: CHE RISULTA UGUALE A SE E SOLO SE CALCOLIAMO ORA: QUESTO PERCHÈ

PERTANTO: MA = 0 = AFFINCHÈ SI PUÒ DIMOSTRARE CHE LA MATRICE È POSITIVA SEMIDEFINITA. PERTANTO LA FORMA QUADRATICA AD ESSA ASSOCIATA È POSITIVA, ALLORA . QUANDO TALE FORMA QUADRATICA È NULLA, ALLORA TUTTI GLI ELEMENTI DI SONO ZERO E PERTANTO . QUINDI È BLUE

CONSISTENZA IN MEDIA QUADRATICA DEGLI STIMATORI OLS Gli stimatori dei minimi quadrati sono consistenti in media quadratica. Per dimostrare questa proprietà è necessaria un’ipotesi ulteriore, cioè Con matrice finita e non singolare. Si osservi che tale matrice contiene le medie delle variabili esplicative, dei loro quadrati e dei loro prodotti. E’ quindi ragionevole assumere che il limite di queste quantità, al divergere della numerosità campionaria, sia finito. Per dimostrare la consistenza in media quadratica è necessario verificare le due condizioni seguenti

La prima condizione è verificata: essendo gli stimatori OLS non distorti per n finito, lo sono anche asintoticamente. Per verificare la seconda condizione si considera il limite della matrice di varianza e covarianza di , Asintoticamente la matrice di varianza e covarianza converge ad una matrice nulla e di conseguenza le varianze degli stimatori tendono a zero.

M è una matrice SIMMETRICA e IDEMPOTENTE STIMA DI Obiettivo : ricavare una stima della varianza dei termini di errore del modello. Poiché gli errori non sono osservabili pare ragionevole stimare utilizzando la devianza residua RSS. Il punto è determinare il divisore della devianza residua: la soluzione possiamo trovarla imponendo il vincolo che lo stimatore di appartenga alla classe degli stimatori corretti. dove M è una matrice SIMMETRICA e IDEMPOTENTE Matrice idempotente Una matrice simmetrica P è idempotente se PP = P.

Dalla Idempotenza e simmetria di M segue che si definisce traccia di una matrice, e si utilizza il simbolo tr(A), la somma dei valori di tutti gli elementi che stanno nella diagonale principale della matrice A. tr(AB) = tr(BA) Calcolando il valore atteso:

Dalla definizione di M si ha rappresenta lo stimatore corretto della varianza del termine di errore del modello. La radice quadrata dello stimatore, s, viene detta errore standard della stima.

Una spiegazione intuitiva della circostanza che lo stimatore non distorto è ottenuto dividendo la somma dei quadrati dei residui per n−k, anziché per n, è costituita dal fatto che, benché si considerano n residui, soltanto n−k sono linearmente indipendenti infatti le equazioni impongono k vincoli (si dimostra facilmente esplicitando il sistema che la somma dei residui e la somma dei prodotti dei residui per ciascuna delle variabili esplicative deve essere uguale a zero). Determinato il valore dei primi n−k residui, gli ultimi dovranno essere tali da soddisfare la condizione sopra . Vi sono k vincoli, uno per ogni coefficiente di regressione stimato, e si perdono quindi k gradi di libertà.