ANALISI DELLA COVARIANZA

Slides:



Advertisements
Presentazioni simili
- le Medie la Moda la Mediana
Advertisements

8) GLI INTERVALLI DI CONFIDENZA
L’ IPERBOLE.
L’Analisi della Varianza ANOVA (ANalysis Of VAriance)
2. Introduzione alla probabilità
Come organizzare i dati per un'analisi statistica al computer?
Intervalli di confidenza
Presupposti alla lezione
COORDINATE POLARI Sia P ha coordinate cartesiane
1 2. Introduzione alla probabilità Definizioni preliminari: Prova: è un esperimento il cui esito è aleatorio Spazio degli eventi elementari : è linsieme.
Meccanica 8 31 marzo 2011 Teorema del momento angolare. 2° eq. Cardinale Conservazione del momento angolare Sistema del centro di massa. Teoremi di Koenig.
Meccanica aprile 2011 Oscillatore armonico, energia meccanica
Variabili casuali a più dimensioni
Analisi dei dati per i disegni ad un fattore
La regressione lineare trivariata
esponente del radicando
Definizione e caratteristiche
(se a = 0 l’equazione bx + c = 0 è di primo grado)
Lezione 4 IL MERCATO DEI BENI
Regressione lineare Esercitazione 24/01/04.
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
Inferenza statistica per un singolo campione
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Capitolo 9 I numeri indici
Analisi della varianza (a una via)
Processi Aleatori : Introduzione – Parte I
Corso di biomatematica lezione 9: test di Student
Sistemi di equazioni lineari
Corso di biomatematica lezione 6: la funzione c2
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
CORSO DI MODELLI DI SISTEMI BIOLOGICI LAUREA IN INGEGNERIA CLINICA E BIOMEDICA.
Modello di regressione lineare semplice
OPERAZIONI CON TRINOMI DI II° GRADO
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
Lezione 8 La valutazione dello scarto per “fuori tolleranza”
Analisi della varianza
I NUMERI IMMAGINARI X2 + 1 = 0 X2 = -1
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
Scomposizione polinomi
1101 = x 10 x 10 x x 10 x = CORRISPONDENZE
LA CIRCONFERENZA.
LEZIONI DI MACROECONOMIA CAPITOLO 2
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
Lez. 3 - Gli Indici di VARIABILITA’
OPERAZIONI CON TRINOMI DI II° GRADO
Gli indici di dispersione
Capitolo III. Il mercato dei beni.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Il residuo nella predizione
Test basati su due campioni Test Chi - quadro
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
ANALISI E INTERPRETAZIONE DATI
Test dell’ ANOVA L EZIONI III PARTE F ONDAMENTI E METODI PER L ’ ANALISI EMPIRICA NELLE SCIENZE SOCIALI A. A
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
INTRODUZIONE ALL’ANALISI DELLA VARIANZA
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Transcript della presentazione:

ANALISI DELLA COVARIANZA Per stabilire come varia la domanda di un bene in funzione non solo del reddito disponibile, ma anche di fattori sociali o ambientali si può impiegare l’analisi della covarianza, che combina il modello di regressione con l’analisi della varianza, consentendo di valutare gli effetti dei fattori sia quantitativi che qualitativi.

Scopo dell’ANCOVA Con l’analisi della covarianza si cerca di vedere se il consumo di un bene obbedisce alla stessa legge per diversi gruppi di famiglie.

Yij è spesa totale della famiglia j-ma appartenente al gruppo i-mo Il consumo del prodotto o del gruppo di prodotti in esame si può esprimere secondo il modello: ai e bi sono i parametri incogniti che dipendono dal gruppo i uij è la componente erratica della famiglia j-ma appartenente al gruppo i-mo Yij è spesa totale della famiglia j-ma appartenente al gruppo i-mo xij è spesa per il consumo del prodotto in esame della famiglia j-ma appartenente al gruppo i-mo i=1,2,…,q individua la modalità di raggruppamento delle famiglie; j=1,2,…,p individua la singola famiglia all’interno di ciascun gruppo;

In base ai valori che possono assumere i parametri ai e bi nell’ambito dei vari gruppi, le situazioni che si possono presentare sono sintetizzate nella seguente tabella:

ai = tra loro ai ≠ tra loro  bi =tra loro 1 2 bi ≠ tra loro 3 4

ai bi Quadrante 1

ai bi ai bi Quadrante 2

ai ai bi bi Quadrante 3

ai bi ai bi Quadrante 4

I TEST DI IPOTESI L’analisi consiste nel sottoporre a verifica se vi è convenienza a suddividere l’insieme delle famiglie in gruppi. Si ipotizza che la suddivisione in gruppi delle famiglie non ha alcun effetto sulla variabile dipendente, cioè all’interno di ciascun gruppo si assiste allo stesso andamento dei consumi in relazione a tutte le famiglie. Tale ipotesi si verifica attraverso il test F di Fisher-Snedecor.  

La verifica del test si basa sulla seguente considerazione: la variabilità della componente erratica nel modello di regressione senza la suddivisione in gruppi è maggiore dell’analoga variabilità nel modello con suddivisione in gruppi.

Per la proprietà della scomposizione della devianza si ha: Devianza totale dell’errore Devianza esterna Devianza interna

Essendo: si ha che: la devianza del modello senza suddivisione in gruppi è maggiore di quella calcolata con la suddivisione.

Tale considerazione resta valida se dalle devianze si passa alle varianze. Con le varianze è possibile effettuare il test di verifica utilizzando la F di Fisher-Snedecor, in cui viene ad essere testato l’incremento di varianza nel passare dal modello con suddivisione al modello senza, in corrispondenza di due ipotesi.

H0 : b1 = b2 = b3 =…= bt La suddivisione in gruppi è ininfluente, avendosi lo stesso andamento della spesa per il consumo del bene in analisi. H1 : b1  b2  b3 ...  bt esiste un diverso andamento del consumo all’interno dei gruppi.

Modello con suddivisione Per il calcolo delle varianze da utilizzare nel test F, si parte dal modello iniziale con la suddivisione in gruppi: yij=ai+bixij+uij [1] Si calcolano le medie del primo e del secondo membro ottenendosi: Sottraendo la prima equazione alla seconda si passa al modello centrato:

Modello senza suddivisione Il modello senza suddivisione in gruppi può essere così formulato: yj=at+bt xj+uj Effettuando le medie, si ha: Sottraendo la prima equazione alla seconda si ottiene il modello centrato: In cui: - y.. e x.. sono le medie delle rispettive variabili calcolate su tutte le famiglie; - at e bt sono i coefficienti che si ottengono utilizzando nella stima le osservazioni concernenti tutte le modalità di raggruppamento.

Indicando con ESS2 la somma delle devianze di ciascun gruppo, nota anche come devianza interna, e con ESS3 la devianza totale dell’errore del modello senza suddivisione in gruppi, ESS3 = F1 è uguale a: dove: (2q-2) e (k-2q) sono i gradi di libertà e indica il numero complessivo delle osservazioni.

F1<F1* accetto H0: la suddivisione delle famiglie in gruppi è perfettamente inutile, c’è omogeneità di comportamento. F1>F1* rigetto H0: all’interno di ciascun gruppo di famiglie c’è una relazione spesa totale-consumo diversa.

Accertata la significativa diversità dal modello senza suddivisione in gruppi (F1>F1*) si possono avere due possibilità:   le intercette dei modelli che descrivono le varie modalità sono tra loro diverse, ma i coefficienti angolari sono statisticamente uguali fra loro, ma diversi da bt; per cui le diversità nei comportamenti consistono in differenti livelli di consumo; - oltre alle ai sono statisticamente diverse tra loro anche le bi ; per cui le diverse modalità di raggruppamento sottintendono comportamenti di consumo completamente diversi.

Al fine di verificare in quale delle 2 situazioni ci si trovi si può supporre che i coefficienti angolari siano uguali ad un particolare valore bw (w sta per within) comune a tutti i gruppi.

Per verificare tale ipotesi vanno considerate: a) la devianza dei residui di tale modello, che può scriversi: yij=ai+bwxij+uij Calcolando le medie si ha: Sottraendo membro a membro si perviene al relativo modello centrato: b) la devianza del modello iniziale con suddivisione in gruppi opportunamente centrato, come nel caso visto in precedenza, che risulta inferiore alla devianza calcolata sub a).

Occorre verificare la significatività dell’incremento della varianza che si ha passando dal modello in cui i vari gruppi presentano coefficienti angolari bi statisticamente uguali tra loro a quello in cui i gruppi sono caratterizzati da coefficienti angolari statisticamente diversi tra loro. Si calcola il test F: H0 : b1=b2=b3=……=bw H1 : b1b2b3……bw

Indicando con ESS2 la somma dei quadrati dei residui del modello con suddivisione in gruppi e con ESS4 la devianza totale dell’errore del modello con suddivisione in gruppi caratterizzati da un coefficiente angolare comune bw. Dove (q-1) e (k-2q) sono i gradi di libertà e k indica il numero totale delle osservazioni.

F2<F2* si accetta H0: l’eterogeneità dei gruppi si traduce soltanto nelle differenze fra le intercette F2>F2* Si accettata H1: il criterio di raggruppamento sottintende una completa eterogeneità del comportamento di consumo nei gruppi di famiglie individuati dalle i modalità

(3) Accettazione (4) Accettazione H1 di F1 H1 di F2 bi ai = tra loro ai  tra loro   (1) Accettazione (2) Accettazione Ho di F1. Ho di F2 bi= (3) Accettazione (4) Accettazione H1 di F1 H1 di F2 bi