Corso di Modelli Lineari

Slides:



Advertisements
Presentazioni simili
ANALISI della VARIANZA FATTORIALE
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
L’Analisi della Varianza ANOVA (ANalysis Of VAriance)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Intervalli di confidenza
Proprietà degli stimatori
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Presupposti alla lezione
Confronto tra 2 campioni Nella pratica è utilissimo confrontare se 2 campioni provengono da popolazioni con la stessa media: Confronti tra produzioni di.
Analisi dei dati per i disegni ad un fattore
ANALISI DELLA COVARIANZA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
Inferenza statistica per un singolo campione
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Analisi della varianza (a una via)
Appunti di inferenza per farmacisti
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 7-2: Test di significatività
STATISTICA a.a PARAMETRO t DI STUDENT
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Analisi della varianza
Verifica delle ipotesi su due campioni di osservazioni
Le distribuzioni campionarie
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Anova a due fattori Esempio di piano fattoriale: il caso della progettazione robusta di batterie Tipo di Materiale Temperatura (°F)
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
IL CAMPIONE.
L’analisi della varianza
Corso di Laurea in Scienze e tecniche psicologiche
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
Intervalli di confidenza
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Corso di Laurea in Scienze e tecniche psicologiche
Dalmine, 26 Maggio 2004 Esercitazioni di Statistica con Matlab Dott. Orietta Nicolis fttp:\ingegneria.unibg.it.
Disegni ad un fattore tra i soggetti. Disegni ad un solo fattore between Quando i livelli del trattamento possono influenzarsi reciprocamente è necessario.
TRATTAMENTO STATISTICO DEI DATI ANALITICI
ANALISI DELLA VARIANZA (ANOVA)
Accademia europea dei pazienti sull'innovazione terapeutica Lo scopo e i fondamenti della statistica negli studi clinici.
Test dell’ ANOVA L EZIONI III PARTE F ONDAMENTI E METODI PER L ’ ANALISI EMPIRICA NELLE SCIENZE SOCIALI A. A
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Statistica di Base per le Scienze Pediatriche luigi greco D.C.H, M.D., M.Sc.M.C.H., Ph.D. Dipartimento di Pediatria UniFEDERICOII.
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
L’ecologia è oggi sempre più una disciplina che enfatizza lo studio olistico del sistema. Anche se il concetto che l’intero possa essere più della somma.
INTRODUZIONE ALL’ANALISI DELLA VARIANZA
L’analisidei dati L’analisi dei dati Analisi mutlidimensionali: Analisi delle corrispondenze multiple Cluster Analysis.
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
Il DEFF Il DEFF (Design EFFect) è l’Effetto del Piano di
Transcript della presentazione:

Corso di Modelli Lineari ANalysis Of VAriance Corso di Modelli Lineari a.a. 2012/2013 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Carmela Iorio Dipartimento di Scienze Economiche e Statistiche Origini storiche L’analisi della varianza fu inizialmente proposta da R.A. Fisher negli anni ’20 e ’30 del secolo scorso, ma nella sua forma attuale è dovuta a G.W. Snedecor che ne perfezionò il metodo rispetto alla proposta originale di Fisher. L’analisi della varianza è basata sul rapporto tra varianze, denominato test F in onore di Fisher e utilizza la distribuzione F, ricordata anche come distribuzione di Fisher-Snedecor. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

La metodologia L’analisi della varianza è una metodologia: che permette di valutare gli effetti su una variabile dipendente (quantitativa) di una o più variabili esplicative qualitative, dette fattori di fondamentale importanza per l’analisi di dati sperimentali (ma non solo) in cui le variabili indipendenti sono qualitative ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Carmela Iorio Dipartimento di Scienze Economiche e Statistiche La terminologia Fattore: variabile qualitativa utilizzata per discriminare un gruppo della popolazione da un altro. Livello: uno dei possibili valori/stati che il fattore può assumere. I fattori che definiscono i gruppi della popolazione possono essere uno o più di uno: Con un solo fattore analisi della varianza ad una via (o ad un fattore). - Con due (o più) fattori analisi della varianza a due vie (o più vie) o due (o più) fattori. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Carmela Iorio Dipartimento di Scienze Economiche e Statistiche L’obiettivo Obiettivo dell'analisi è misurare se la differenza tra le medie (variabilità tra gruppi) è superiore alla variabilità interna a ciascun gruppo (variabilità entro gruppi) al fine di verificare se la variabilità apporta informazione sulle cause dei fenomeni e sulla loro relazione. In conclusione, siamo interessati a studiare le relazioni tra le medie delle popolazioni (ovvero se esse sono da considerarsi uguali o meno). ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Carmela Iorio Dipartimento di Scienze Economiche e Statistiche L’utilizzo (1/2) L’analisi della varianza consente di valutare l’importanza relativa, in termini di significatività statistica, delle diverse fonti di variazione* nella variabilità sia in studi osservazionali che sperimentali Sistematiche (sotto il controllo del ricercatore: fattori esplicativi o modelli) * Casuali o accidentali (errori di misurazioni o di numerose cause che producono numerosi effetti impercettibili il cui comportamento è assimilabile ad errori di misura, ecc) Il principio su cui si fonda l’ANOVA e’ quello del rapporto tra due varianze (quella sistematica e quella dovuta all’errore) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Carmela Iorio Dipartimento di Scienze Economiche e Statistiche L’utilizzo (2/2) La procedura si utilizza quando si è interessati a verificare l’ipotesi di differenza tra due o più medie. Quando le medie sono solo due si può utilizzare il t di Student (dallo pseudonimo del suo inventore William Gosset); Se le medie sono più di due, si usa l’analisi della varianza (ANOVA, ANalisis Of VAriance). ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA: una breve premessa L’analisi della varianza, in una prima accezione, estende il test sulla differenza tra medie di due popolazioni a più popolazioni. Essa infatti può essere impiegata per verificare l’ipotesi nulla di uguaglianza di h medie di altrettante popolazioni, discriminate sulla base di un fattore che può essere assimilato ad una variabile qualitativa. Il test dell’ANOVA ad una via è basato sull’analisi della variabilità complessiva (devianza totale) in funzione delle diverse cause della variazione: ￿ devianza entro trattamenti ￿ devianza tra trattamenti da cui il termine Analisi della Varianza. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Carmela Iorio Dipartimento di Scienze Economiche e Statistiche ANOVA: esempio introduttivo (1/5) Si consideri il caso di una ditta farmaceutica che vuole verificare se tre prodotti volti alla cura della medesima patologia siano o meno ugualmente efficaci. A tale scopo, i farmaci vengono somministrati ad alcune cavie Si misura sulle cavie l’effetto dei tre farmaci Se i tre farmaci sono ugualmente efficaci, le risposte ai trattamenti da parte delle cavie dovrebbero essere in media non troppo diverse. Sintetizzando al massimo, potremmo dire che lo scopo della analisi della varianza è stabilire cosa debba intendersi per “troppo diverse”. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Carmela Iorio Dipartimento di Scienze Economiche e Statistiche ANOVA: esempio introduttivo (2/5) In caso di uguaglianza degli effetti: le differenze che si riscontrano tra le medie delle risposte ai trattamenti da parte dei tre gruppi di cavie sono dovute alla variabilità sperimentale (o componente accidentale delle risposte sperimentali) che fa si che la risposta differisca da cavia a cavia anche quando queste sono sottoposte al medesimo trattamento. Questo tipo di differenze sono infatti dovute ad un complesso molto ampio di cause che sfuggono al controllo dello sperimentatore e che vengono allora incluse nella componente accidentale, a sua volta rappresentata mediante una variabile casuale, per la quale si ipotizza una distribuzione di tipo normale. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Carmela Iorio Dipartimento di Scienze Economiche e Statistiche ANOVA: esempio introduttivo (3/5) Dalla normalità della componente accidentale discende che le risposte da parte dei tre gruppi di cavie possono essere riguardate come altrettanti campioni estratti da popolazioni anch’esse normali e con media diversa od uguale a seconda che i farmaci siano o meno parimenti efficaci. L’ipotesi nulla prevede che le risposte ai trattamenti di tutti i gruppi abbiano la stessa origine, ovvero provengano dalla stessa popolazione, e che le differenze osservate tra i gruppi siano solo dovute al caso. L’ipotesi alternativa afferma invece che le risposte ai trattamenti dei tre gruppi provengono da popolazioni diverse, aventi medie diverse ma la stessa varianza. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Carmela Iorio Dipartimento di Scienze Economiche e Statistiche ANOVA: esempio introduttivo (4/5) Il problema è quello di stabilire se tali differenze tra le medie delle risposte ai trattamenti siano riconducibili agli errori del campionamento (come affermato dall’ipotesi nulla), oppure se riflettano il fatto che tali risposte provengono da popolazioni diverse (come affermato dall’ipotesi alternativa). Per valutare l’ipotesi alternativa contro l’ipotesi nulla è necessario stabilire: quale quota della variabilità complessiva della variabile risposta sia attribuibile alla diversa efficacia del farmaco (varianza tra i gruppi) e quale quota della varianza sia invece attribuibile alle fluttuazioni casuali dovute agli errori (varianza entro i gruppi). ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Carmela Iorio Dipartimento di Scienze Economiche e Statistiche ANOVA: esempio introduttivo (5/5) Il test è basato sulle seguenti considerazioni: Se è vera l’ipotesi nulla, le risposte ai trattamenti differiscono tra loro per il solo effetto della variabilità casuale. Se è vera l’ipotesi alternativa, entrambe le fonti di variabilità contribuiscono a determinare la variabilità complessiva. Viene scelta l’ipotesi alternativa se la varianza tra i gruppi è più grande della varianza entro i gruppi. Altrimenti viene considerata vera l’ipotesi nulla. Il confronto tra la varianza tra i gruppi e la varianza entro i gruppi viene eseguito mediante il test F di Fisher. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Un solo fattore A ad h modalità ANOVA ad una via (1/3) Un solo fattore A ad h modalità (la cui efficacia si intende verificare) Una sola v.c. “risposta” Y (cioè il risultato che misuriamo sull’unità statistica j nel gruppo i) Rappresentale medie delle popolazioni da cui si possono ritenere estratti h campioni. Rappresentano la componente casuale o errore i è l’indice per i gruppi (i=1, …, h) j è l’indice per le osservazioni all’interno dei gruppi (j=1, …, ni) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Carmela Iorio Dipartimento di Scienze Economiche e Statistiche ANOVA ad una via (2/3) Componente causale L’errore εij sintetitizza la variabilità sperimentale. La componente erratica del modello è una v.c. che deve rispettare le solite assunzioni dei modelli lineari: Normalità: le osservazioni appartenenti all’ i-esimo gruppo provengano da una Omoschedasticità: è costante sui h gruppi. 3. Incorrelazione: la variazione casuale di ogni osservazione non deve essere influenzata da quella di un’altra. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA ad una via (3/3) Componente sistematica Rappresenta il valore medio della risposta quando agisce il trattamento Ai Rappresenta la media comune delle h popolazioni L’effetto differenziale, rispetto al livello medio generale, della i-esima modalità del fattore sperimentale ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA ad una via: il modello (1/2) Si ipotizza che le risposte siano generate da un modello in forma additiva e lineare: j-esima risposta al trattamento con la i-esima modalità del fattore effetto comune e costante per l’intero esperimento effetto dovuto al trattamento con la i-esima modalità del fattore sperimentale effetto erratico (casuale) collegato all’ j-esima unità sottoposta all’ i-esimo trattamento ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA ad una via: il modello (2/2) Al fine di identificare gli h + 1 parametri del modello si pone, senza perdere in generalità, il vincolo che Qualora il numero delle osservazioni sperimentali è costante per ciascun trattamento ipotizzato (ni=n/h per ogni i) si definisce un disegno sperimentale bilanciato Il modello può essere ad: effetti fissi: i livelli del fattore sperimentale sono deterministici in quanto si considerano tutti i possibili livelli del fattore. Quindi la conclusione di un’analisi si applica solo ai livelli studiati. effetti casuali (randomizzato): i livelli del fattore discendono da un’estrazione casuale e pertanto sono variabili aleatorie che soddisfano le stesse ipotesi viste per la componente accidentale. Quindi, poiché i livelli inclusi nell’analisi rappresentano un c.c. di tutti i possibili livelli, la conclusione di un’ANOVA ad effetti casuali si applica a tutti i livelli del fattore (non solo a quelli studiati). ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Contro un ipotesi alternativa: Il TEST Si sottopone a test: o equivalentemente: Contro un ipotesi alternativa: Per effettuare il test si considera la devianza campionaria totale di Y ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Carmela Iorio Dipartimento di Scienze Economiche e Statistiche Sum of Squares SST (Total Sum of Squares) DEVIANZA CAMPIONARIA TOTALE: misura la variabilità totale nei valori della Y attorno alla media campionaria generale SSA (Sum of Squares Among Groups) DEVIANZA TRA I TRATTAMENTI: rappresenta la parte della devianza campionaria totale spiegata dai livelli del fattore SSW (Sum of Squares Within Groups) DEVIANZA ENTRO I TRATTAMENTI: rappresenta la parte dovuta alla variabilità sperimentale ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Il TEST : cosa ci aspettiamo** SE E’ VERA L’IPOTESI NULLA: Possiamo attenderci uno scarso contributo della devianza tra i gruppi alla devianza totale SE E’ FALSA L’IPOTESI NULLA: Possiamo attenderci che entrambe le devianze contribuiscano a determinare la devianza totale. A questo livello non è però possibile fare confronti, perché le devianze hanno un numero di addendi diverso. Per rendere possibile il confronto, ciascuna devianza viene divisa per i rispettivi gradi di libertà ottenendo le medie dei quadrati, cioè le varianze : ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA ad una via: la tabella (1/4) Source df Sum of Squares Mean Square F AMONG (h-1) SSA MSA= SSA/(h-1) MSA/MSW WITHIN (n-h) SSW MSW= SSW/(n-h) TOTAL (n-1) SST Il migliore stimatore non distorto di della componente erratica è dato da MSW Se si assume l’omogeneità della varianza La varianza campionaria entro i trattamenti può essere interpretata come la media aritmetica ponderata delle varianze campionarie (non distorte) di ciascun trattamento, avente per pesi i rispettivi gradi di libertà. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA ad una via: la tabella (2/4) Assumendo la normalità della componente erratica del modello, mediante l’applicazione del teorema di Fisher e Cochran, si dimostra che, se è vera l’ipotesi nulla: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA ad una via: la tabella (3/4) Per verificare l’ipotesi di uguaglianza delle medie si utilizza la statistica test che confronta MSA e MSW: la v.c. Tn è il rapporto tra due v.c. Chi-quadrato indipendenti divise per i rispettivi gradi di libertà: ovvero: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA ad una via: la tabella (4/4) Il numeratore e il denominatore di Tn sono stimatori indipendenti e non distorti della stessa varianza Se è VERA l’ipotesi nulla Se è FALSA l’ipotesi nulla SSA/(h-1) sarà notevolmente maggiore di SSW(n-h) ed il rapporto Tn sarà largamente superiore ad 1 Saranno molto simili ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Carmela Iorio Dipartimento di Scienze Economiche e Statistiche ANOVA ad una via: interpretazione Più questo rapporto è elevato, maggiore è il contributo dei livelli del fattore sperimentale alla spiegazione della variabilità del fenomeno osservato: ciò che induce a rigettare l’ipotesi nulla. Se si rigetta l’ipotesi nulla significa che esiste almeno un livello del fattore per il quale l’ipotesi nulla non è verificata ossia la media del gruppo differisce dalla media generale ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Carmela Iorio Dipartimento di Scienze Economiche e Statistiche ANOVA ad una via: la regola decisionale Si rifiuta H0 se: il valore calcolato della statistica test è maggiore del valore critico della distribuzione di Fisher ad un determinato livello di significatività α del test I valori critici si individuano nelle tavole della distribuzione di Fisher in base ai gradi di libertà e al livello di significatività. Se H0 è falsa ci aspettiamo che la statistica test assuma valori maggiori rispetto ai valori tabulati nella tavola della distribuzione di Fisher la variabilità totale è dovuta soprattutto all’effetto del trattamento Se H0 è vera ci aspettiamo che il valore osservato di F sia minore al valore tabulato. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA ad una via: dopo il test F Quali gruppi hanno medie diverse? Dopo aver rilevato qualche differenza nei livelli del fattore che ci ha condotto a rigettare l’ipotesi nulla, si è interessati nel confronto a coppie di trattamenti o combinazione complesse di trattamenti. Si noti che non ha senso chiedersi se un determinato livello è significativo in quanto si pone la questione: "significativamente diverso da cosa?" Ogni test significativo deve prevedere un confronto di qualche tipo. Ci sono una varietà di procedure che comunemente vengono usate per effettuare tutti i confronti simultanei tra coppie di gruppi ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

*Confronti a coppie usando la distribuzione t Supponiamo di sottoporre a test H0: Si costruisce un intervallo di confidenza (c.i.) per la differenza tra ciascuna coppia di medie: dove: LSD (Least Significance Difference)= Se > LSD ( {0 c.i.} allora le medie differiscono significativamente al livello ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

*Confronti Multipli: errore del I tipo (1/6) Quando i livelli del fattore che si studia sono più di due sembrerebbe intuitivo effettuare i confronti a due a due utilizzando il test t di Student e ripetere l’analisi tante volte quanti sono i possibili confronti a coppie tra i trattamenti. La probabilità di commettere un errore del I tipo, cioè la probabilità α di trovare una differenza significativa quando in realtà essa non esiste, è corretta per il singolo confronto tra due medie. Questo tasso d’errore, chiamato comparison-wise, all’aumentare del numero di confronti determina un tasso d’errore per tutto l’esperimento, chiamato experimental-wise, notevolmente maggiore. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

*Confronti Multipli: errore del I tipo (2/6) Se si effettua un singolo test t di Student tra due medie con α=0,05 tale confronto ha una probabilità di (1-α)=0,95 di affermare il vero e una probabilità α=0,05 di commettere l’errore di I tipo: Se vengono effettuate N ripetizioni del test t, la probabilità di commettere l’errore di 1° specie E1 : ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

*Confronti Multipli: errore del I tipo (3/6) Se ci sono h gruppi possiamo effettuare N=h(h-1)/2 confronti Con tre gruppi, per esempio, sono possibili N = 3 confronti e la probabilità complessiva (experiment-wise) di non commettere errori del I tipo: In generale, nel caso di N confronti tra coppie di medie, la probabilità, indicata con G1, di non rifiutare H0 quando è vera: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

α =1– P(non rifiutare H0|H0 è vera)=1 – (1 – α)2 = 0,0975 *Confronti Multipli: errore del I tipo (4/6) Di conseguenza, la probabilità di commettere un errore del I tipo è: Quindi: 1 confronto: la probabilità di rifiutare H0 quando è vera è α; 2 confronti indipendenti: la probabilità di rifiutare almeno un’ipotesi nulla se entrambi sono vere è α =1– P(non rifiutare H0|H0 è vera)=1 – (1 – α)2 = 0,0975 3 confronti indipendenti: la probabilità di rifiutare almeno un’ipotesi nulla se tutte e tre sono vere è α=1– P(non rifiutare H0|H0 è vera) = 1 – (1 – α)3 = 0,143 Anche se nominalmente α=0,05 per tre confronti è pari a 0,14 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

In generale, per N confronti indipendenti, l’ experiment-wise è *Confronti Multipli: errore del I tipo (5/6) In conclusione, se si eseguono 3 test t di Student, la probabilità d’errore di I tipo è quasi 3 volte superiore a quella che si realizza quando viene eseguito un singolo test. Se si effettuano più confronti la probabilità di commettere l’errore di primo tipo aumenta proporzionalmente al numero di confronti: il test t di Student non garantisce un adeguato livello di protezione del test. Indichiamo con: α la probabilità dell’errore del I tipo I del singolo test (comparison-wise) - αT la probabilità dell’errore del I tipo per tutto il test (experiment-wise) In generale, per N confronti indipendenti, l’ experiment-wise è ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

*Confronti Multipli: errore del I tipo (6/6) Nel caso di 8 gruppi, per esempio, sono possibili: confronti a coppie. Se tutti questi confronti venissero eseguiti, ponendo α=0,05 per ciascun confronto, la probabilità d’errore del I tipo complessiva sarà: Nei confronti multipli è dunque necessario ricorrere a delle procedure che garantiscono un adeguato livello di protezione nei confronti dell’errore del I tipo ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Confronti Multipli (1/2) I confronti possono essere svolti prima o dopo l’esame dei dati Se i confronti sono stati decisi PRIMA di esaminare i dati (pianificati nel disegno dello studio): CONFRONTO SINGOLO: si utilizza il t-test standard oppure il test t basato sugli intervalli di confidenza POCHI CONFRONTI: si utilizza la correzione di Bonferroni. MOLTI CONFRONTI: poiché Bonferroni diventa sempre più conservativo al crescere di h, si preferisce utilizzare il metodo di Scheffé o quello di Tukey. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Confronti Multipli (2/2) Se i confronti sono stati decisi DOPO aver esaminato i dati (generati dall’osservazione dei risultati): E’ necessario “regolare” l’intervallo di confidenza per consentire la possibilità di effettuare tutti i confronti Ci sono due casi importanti: SOLI CONFRONTI A COPPIE: si utilizza il metodo di Tukey. TUTTI I CONTRASTI, CIOÈ COMBINAZIONI LINEARI: si utilizza il metodo Scheffé. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Confronti Multipli: Fisher’ LSD L’utilizzo dei confronti multipli è preceduto dal test F visto prima Fisher’s LSD o t-protetto: per tutelare l’errore di I specie al livello α, Fisher suggerisce di applicare la procedura LSD solamente se al livello α del test F l’ipotesi nulla di uguaglianza delle medie è rifiutata. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

*Confronti Multipli: Bonferroni Il test di Bonferroni consiste nell’usare il t test per confrontare due trattamenti modificando il livello di protezione (1-α) di ogni singolo confronto, in modo da garantire il livello di protezione complessivo desiderato. In base a tale principio per effettuare N(=h(h-1)/2) volte il test di Student mantenendo costante la probabilità totale αT, la probabilità di ogni confronto deve essere: Per esempio, con 3 confronti e con αT = 0,05 La correzione di Bonferroni richiede che ogni singolo test sia condotto al livello 0,05/3=0,0166, cioè si dichiareranno significativi solo i risultati con p-value < 0,0166 Se costruiamo più di un intervallo di confidenza dobbiamo utilizzare la correzione di Bonferroni per il calcolo dei quantili della t ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

*Confronti Multipli: metodo di Scheffé Supponiamo di sottoporre a test H0: Si costruisce un intervallo di confidenza per la differenza tra ciascuna coppia di medie. Il livello di significatività del test di Scheffé è un multiplo della F di Fisher, dove il multiplo è il numero di gruppi meno 1. Tra i test a posteriori, il test di Scheffé è il più robusto ma anche il più conservativo: garantisce che l’errore campionario dipende da per ciascuna coppia di medie. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

I CONTRASTI SONO UTILI PER IL CONFRONTO SIMULTANEO TRA PIÙ MEDIE I confronti tra coppie di medie rappresentano casi particolari di contrasti Un contrasto è una combinazione lineare delle medie: dove: Due confronti caratterizzati dai coefficienti e tali che per i=1,…, h sono detti CONFRONTI ORTOGONALI I CONTRASTI SONO UTILI PER IL CONFRONTO SIMULTANEO TRA PIÙ MEDIE ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Allora una ipotesi nulla da verificare sarà Contrasti (2/4) Se si ipotizza che: Allora una ipotesi nulla da verificare sarà Questa ipotesi è un confronto ortogonale con i coefficienti (1/2, -1/2, 1/2, -1/2)* rispettivamente per * Per convenzione i coefficienti hanno somma algebrica pari a 0 e somma dei valori assoluti pari a 2 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Contrasti (3/4) Il metodo di Scheffé per il confronto tra coppie di medie potrà essere esteso al confronto L considerando l’intervallo di confidenza: Si assume che per TUTTI i confronti possibili la proporzione di intervalli che non include lo zero è pari ad se le g medie della popolazione sono uguali, controllando così l’errore di primo tipo del test. Se si rifiuta l’ipotesi nulla allora esisterà un confronto che differirà significativamente da zero. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Contrasti (4/4) sono dati da: I coefficienti del confronto che darà il più grande valore di: sono dati da: Questo confronto sarà il primo responsabile del rigetto dell’ipotesi nulla che tutte le medie sono uguali tra loro ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” Il Problema: Una società di trasporto intende verificare l’esistenza di una differenza significativa tra il costo degli interventi di riparazione sul materiale rotabile effettuati da 5 diverse officine ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” I dati: Sono state osservate le attività svolte da 5 officine di riparazione Per ognuna di esse si è misurato, per alcune settimane, il costo medio unitario degli interventi effettuati nello stesso periodo (costo medio per intervento) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” I dati: Il costo medio per intervento delle 5 officine: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” Variabilità del costo d’intervento ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” Analisi della Varianza dei Costi Le Ipotesi: H0 : non vi è differenza significativa tra i costi unitari medi delle 5 officine H1 : vi è differenza significativa tra i costi unitari medi delle 5 officine ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” ANOVA: Regola di Decisione Accetto H0 Rigetto H0 2,606 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” Analisi della Varianza dei costi dell’intervento Devianza tra i gruppi (tra le officine) Devianza nei gruppi (all’interno del gruppo di interventi effettuati da ogni officina) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” Analisi della Varianza del costo di intervento Varianza dei trattamenti (tra le officine) Varianza degli errori (all’interno del gruppo di interventi effettuati da ogni officina) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” ANOVA: Risultato del test Accetto H0 Rigetto H0 2,606 F=12,662 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” ANOVA - Conclusioni Sulla base del campione raccolto si può concludere, ad un livello di significatività del 5%, che: “esiste una differenza significativa tra i costi medi unitari degli interventi effettuati dalle 5 officine” ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” Ulteriori investigazioni: Visto che esiste una differenza significativa che porta a rigettare l’ipotesi nulla: “Quale o quali sono le officine che spingono a rigettare l’ipotesi?” ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” Confronti Multipli (post hoc) Si effettuano confronti tra tutte le officine prese a due a due Si individuano le officine che si differenziano “particolarmente” da tutte le altre al fine di costruire un test migliore ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” Confronti Multipli con Metodo LSD ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” Confronti Multipli (post hoc) È certo che l’officina C si differenzia da tutte le altre! È interessante, a questo punto, verificare se le officine A e B si differenziano significativamente da D ed E Gruppi uguali hanno coefficienti uguali (lo zero indica l’esclusione) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” Confronti Multipli (post hoc) Si effettua un test tra i due gruppi di officine Acc. H0 Rif. H0 t=3,338 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” Confronti Multipli (post hoc) Si effettua un test tra i due gruppi di officine Si può concludere che: Le officine D ed E hanno una media dei costi di intervento significativamente minore a quella di A e B !!! ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” Confronti Multipli (post hoc) L’officina D è significativamente migliore di E ? ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” Confronti Multipli (post hoc) Si effettua un test tra le due officine Acc. H0 Rif. H0 t=0,517 Conclusione: non vi è una differenza significativa tra D ed E ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 1: “Costo delle Riparazioni” Ulteriori investigazioni (2): E in riguardo alla durata degli interventi? E alla efficienza degli interventi? ….. Per una “valutazione comparata” di tutte le informazioni del fenomeno complesso “prestazione dell’officina” ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA e Regressione L’analisi di regressione studia come varia in media la variabile dipendente Y al variare di una o più variabile esplicative. L’ANOVA può essere come ottenuto come caso speciale del modello di regressione multipla utilizzando le variabili dummy per rappresentare le variabili qualitative Una variabile dummy è una variabile binaria che assume valore 1 se l’unità statistica possiede una data caratteristica e 0 altrimenti. L’ANOVA ad una via può essere scritta come una regressione multipla definendo h variabili dummy per rappresentare i h gruppi. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Campagna Pubblicitaria Regressione con variabili dummy: un esempio (1/14) Un’azienda di marketing vuole verificare gli acquisti di prodotti alimentari a base di latte a seguito dell’introduzione di 4 campagne pubblicitarie (AD) Y Campagna Pubblicitaria 8 AD1 7 9 6 5 AD2 4 3 AD3 2 AD4 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Regressione con variabili dummy: un esempio (2/14) Al fine di ottenere un modello ANOVA-one way, utilizzando la dummy coding occorre costruire tante variabili dummy quante sono le modalita della variabile qualitativa nel seguente modo. Relativamente ai dati del nostro esempio cominciamo con il considerare la seguente tabella: Y AD0 AD1 AD2 AD3 AD4 8 1 7 9 6 5 4 3 2 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Regressione con variabili dummy: un esempio (3/14) A partire da una variabile che assume h modalità, si possono definire h dummies, ma soltanto h-1 variabili dummies vanno incluse nel modello (altrimenti, in presenza di un termine costante, ci sarebbe perfetta collinearità). Per applicare l’approccio dummy: definiamo le variabili dummy K1, K2, K3 per rappresentare le prime 3 AD; la quarta campagna è scelta come caso base. La colonna X0 codifica la media di riferimento (qui quella del k-esimo gruppo) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Regressione con variabili dummy: un esempio (4/10) L’equazione per il modello è: I consumo medi per i 4 gruppi di campagne pubblicitarie sono per le campagne 1, 2, 3 e 4 rispettivamente. Questo sistema di codifica implica che la generale matrice X’X assumerà come valori: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Regressione con variabili dummy: un esempio (5/14) Da cui: Analogamente la matrice X’y diventerà: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Regressione con variabili dummy: un esempio (6/14) Da cui: Analogamente la matrice X’y diventerà: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Regressione con variabili dummy: un esempio (7/14) (7/10) Quindi: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Regressione con variabili dummy: un esempio (8/14) Quindi: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Regressione con variabili dummy: un esempio (9/14) La codifica dummy stabilisce che il parametro β0 corrisponde alla media della k-esima categoria presa in considerazione: Gli altri parametri corrispondono alla differenza tra le medie dei gruppi e la categoria di riferimento e cioè l’ultima I parametri beta stimati nella codifica dummy permettono di valutare nell’ordine le seguenti ipotesi nulle: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Regressione con variabili dummy: un esempio (10/14) Poiché: Per ciascuna delle nk osservazioni possiamo riscontrare che Xk = 1 mentre i rimanenti X-k = 0. Pertanto il valore stimato dalla regressione per ogni gruppo di indipendenti osservazioni può essere ricondotto alla media delle osservazioni. Infatti: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Regressione con variabili dummy: un esempio (11/14) In generale, è possibile scomporre la sommatoria totale dei quadrati (SStot) nella componente attribuita alla regressione (SST) e la componente dovuta all’errore (SSW). ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Regressione con variabili dummy: un esempio (12/14) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Regressione con variabili dummy: un esempio (13/14) Come nella regressione multipla, è possibile verificare l’ipotesi nulla che tutti i coefficienti di regressione siano simultaneamente uguali a zero. Applichiamo il test F totale: contro l’ipotesi che esista almeno un regressore che abbia un effetto significativamente diverso da zero sulla variabile dipendente. La variabile test è definita a partire dalla decomposizione ANOVA della devianza totale SST in devianza di regressione SSR e devianza residua SSE. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Regressione con variabili dummy: un esempio (13/14) Il convenzionale F-test della regressione multipla è equivalente a testare l’uguaglianza delle 4 medie. Il risultato è: Dal p-value, possiamo concludere che le medie per le campagne pubblicitarie 1,2,3 sono significativamente diverse dalla 4 al livello di significatività del 5%. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Effect Coding (1/10) E’ possibile un’altra codifica dei livelli del fattore: effect coding, che è centrata sulla media generale delle osservazioni: Riprendendo l’esempio di prima: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Effect Coding (2/10) Le variabili sono definite: AD1= 1 per AD1 = 0 per AD2 e AD3 = -1 per AD4 AD2= 1 per AD2 = 0 per AD1 e AD3 AD3= 1 per AD3 = 0 per AD1 e AD2 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Effect Coding (3/10) La matrice X ottenuta usando l’effetto coding è mostrata a lato. Da notare la colonna X0 per codificare la media generale. L’ultimo gruppo viene ad assumere come valore -1, portando a 0 la sommatoria dei valori presenti in ciascuna colonna. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Effect Coding (4/10) Questo sistema di codifica implica che la generale matrice X’X assumerà come valori: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Effect Coding (5/10) Da cui: Analogamente la matrice X’y diventerà: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Effect Coding (6/10) Poiché: Il coefficiente 5 rappresenta la media nelle 20 celle iniziali. Il coefficiente 2 è ottenuto sottraendo alla media delle celle dell’AD1(k1) che è 7 la media generale….. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

il parametro β0 corrisponde alla media generale delle osservazioni: Effect Coding (7/10) La Effect coding stabilisce che: il parametro β0 corrisponde alla media generale delle osservazioni: gli altri parametri corrispondono alla differenza tra la media del gruppo e la media generale: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Effect Coding (8/10) I parametri beta stimati nella Effect coding permettono di valutare nell’ordine le seguenti ipotesi nulle: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Effect Coding (9/10) Poiché: Per ciascuna delle nk osservazioni possiamo riscontrare che Xk = 1 mentre i rimanenti X-k = 0. Pertanto il valore stimato dalla regressione per ogni gruppo di indipendenti osservazioni può essere ricondotto alla media delle osservazioni. Infatti: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Effect Coding (10/10) Per il k-esimo gruppo avremo: Si mostra quindi come la differenza tra le due codifiche consiste nel valore che assume il parametro beta: nella dummy rappresenta la differenza della media rispetto al gruppo di riferimento, nella coding rappresenta la differenza rispetto alla media generale. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA a due fattori: premessa L’analisi di un fenomeno non si deve limitare alla valutazione dei singoli fattori in studio, ma molto spesso è importante valutare come tali fattori interagiscono tra di loro: lo studio delle interazioni è fondamentale per capire i diversi effetti di un fattore a seconda della modalità degli altri fattori considerati. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA a due fattori: un esempio Valutare l’effetto di un farmaco su un certo sintomo a seconda dell’appartenenza a classi di età diverse o a seconda del sesso. L’effetto del farmaco è diverso nei giovani rispetto agli anziani? L’effetto del farmaco varia a seconda del sesso? Se non c’è interazione allora il farmaco avrà un effetto uguale per tutte le classi di età. L’efficacia sarà la stessa per tutti i soggetti in studio indipendentemente dalla loro età. Se c’è interazione allora il farmaco avrà effetti diversi a seconda della classe di età o del sesso, quindi non si può considerare un effetto medio uguale in tutte le classi ma si dovranno fornire i diversi profili di efficacia. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA a due fattori (1/4) Introduzione di una seconda variabile qualitativa (fattore) consente lo STUDIO DELLE INTERAZIONI Quando si analizzano due fattori si può essere interessati a verificare: gli effetti principali di un singolo fattore le interazioni tra più fattori per determinare l’effetto congiunto ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA a due fattori (2/4) 2 fattori: A(con h livelli) e B (con g livelli) Supponiamo di conoscere le medie della popolazione B1 B2 Bk Bg A1 μ11 μ12 … μ1g μ1. A2 μ21 μ22 μ2g μ2. Aj μjk Ah μh1 μh2 μhg μh. μ.1 μ.2 μ.g μ.. All’interno della cella (j,k), la variabile di risposta Y ha una popolazione media ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA a due fattori (3/4) se R e C NON INTERAGISCONO: i singoli fattori hanno degli effetti che non variano a seconda del livello degli altri fattori (ADDITIVITA’ DEGLI EFFETTI ) se R e C INTERAGISCONO: La presenza contemporanea di determinati livelli dei fattori migliora o peggiora il risultato rispetto alla semplice additività. Graficamente i segmenti non sono paralleli, perché l’effetto di un fattore dipende dal livello dell’altro. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA a due fattori (4/4) Le medie campionarie mostreranno sempre qualche interazione, anche se le interazioni sono assenti nella popolazione, a causa dell’errore di campionamento Noi dobbiamo determinare se la violazione dell’ipotesi di parallelismo osservata nel campione sia sufficientemente grande da essere statisticamente significativa, o se è casuale. Nei grandi campioni, noi vogliamo determinare se le interazioni statisticamente significative sono sufficientemente grandi da meritare interesse. Potremmo decidere di ignorare le interazioni che sono statisticamente significative, ma piccole. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA a due fattori: premessa L’interpretazione dell’ANOVA a due vie dipende dalla presenza o dall’assenza delle interazioni. Cominciamo col testare l’interazione: Gli effetti riga sono gli stessi all’interno dei livelli del fattore colonna Dopo l’interazione, guardiamo agli effetti principali Conviene esprimere l’ipotesi sugli effetti principali in termini di medie marginali: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA a due fattori: il modello Senza Interazione Si ipotizza che le risposte siano generate da un modello in forma additiva e lineare: Rappresenta la media generale delle h*g popolazioni Effetto riga (effetto trattamento i del fattore A) Effetto colonna (effetto trattamento j del fattore B) Variabilità sperimentale Si assume senza perdita di generalità che: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA a due fattori: il test Senza Interazione Per effettuare il test si considera la devianza campionaria totale di Y ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Sum of Squares _ senza interazione (1/2) SST (Total Sum of Squares) DEVIANZA CAMPIONARIA TOTALE: misura la variabilità totale nei valori della Y attorno alla media campionaria generale SSA (Sum of Squares dovuta al fattore A) È la media delle risposte campionarie per l’i-esimo livello di A, qualunque sia il livello di B ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Sum of Squares _ senza interazione (2/2) SSB (Sum of Squares dovuta al fattore B) È la media delle risposte campionarie per il j-esimo livello di B, qualunque sia il livello di A SSE (Sum of Squares dovuta alla variabilità sperimentale)= SST-SSA-SSB ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA a due vie, senza interazione: la tabella (1/3) Origine della variabilità df Sum of Squares Mean Square F FATTORE A (h-1) SSA MSA= SSA/(h-1) MSA/MSE FATTORE B (g-1) SSB MSB= SSB/(g-1) MSB/MSE RESIDUALE (h-1)(g-1) SSE MSE=SSE/(h-1)(g-1) TOTALE (n-1) SST ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA a due vie, senza interazione: la tabella (2/3) Assumendo la normalità della componente erratica se è vera l’ipotesi nulla: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA a due vie, senza interazione: la tabella (3/3) Il test viene condotto considerando i rapporti: L’ipotesi nulla si rifiuta se il relativo rapporto considerato risulta elevato così che saranno bassi i livelli di significatività ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA a due fattori: il modello Con Interazione Si ipotizza che per ciascun trattamento vengono considerate le replicazioni r: Rappresenta la media generale delle h*g popolazioni Effetto riga Effetto colonna Variabilità sperimentale Esprime l’effetto dovuto all’interazione tra i due fattori Il numero delle replicazioni è ipotizzato costante e pari a r per ogni combinazione dei livelli dei due fattori ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA a due fattori: il test Con Interazione Per effettuare il test si considera la devianza campionaria totale di Y ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Sum of Squares _ con interazione (1/2) SST (Total Sum of Squares) SSA (Sum of Squares dovuta al fattore A) SSB (Sum of Squares dovuta al fattore B) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Sum of Squares _ con interazione (2/2) SSI (Sum of Squares dovuta all’Interazione) È la media campionaria delle risposte al trattamento con l’i-esimo livello di A e con il j-esimo livello di B SSE (Sum of Squares dovuta alla variabilità sperimentale) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA a due vie, con interazione: la tabella (1/2) Origine della variabilità df Sum of Squares Mean Square F FATTORE A (h-1) SSA MSA= SSA/(h-1) MSA/MSE FATTORE B (g-1) SSB MSB= SSB/(g-1) MSB/MSE INTERAZIONE (h-1)(g-1) SSI MSI=SSI/(h-1)(g-1) MSI/MSE SPIEGATA (hg -1) SSL RESIDUALE (n-hg) SSE MSE=SSE/(n-hg) TOTALE (n-1) SST ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

ANOVA a due vie, senza interazione: la tabella (2/3) Il test viene condotto considerando i rapporti: Se l’ultimo rapporto F risulta elevato vuol dire che tra i due fattori vi è una significativa interazione ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 2: “ANOVA a due fattori: Campioni Indipendenti Caso Studio 2: “ANOVA a due fattori: Campioni Indipendenti. Il lancio di un nuovo succo di frutta” Il Problema: Un produttore di succhi di mela sta progettando di sviluppare un nuovo prodotto e il marketing manager deve decidere come promuovere il nuovo prodotto. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Caso Studio 2 Supponiamo che vengono esaminati due fattori: Gli effetti della campagna di marketing sono: L’enfasi sulla convenienza L’enfasi sulla qualità L’enfasi sul prezzo Gli effetti sul media scelto per la campagna: Pubblicità in TV Pubblicità sui giornali Possiamo disegnare l’esperimento come segue: In tre città viene lanciata una campagna pubblicitaria. In ogni città viene sottolineata una sola caratteristica (convenienza, qualità e prezzo) rispetto al tipo di pubblicità condotta.   ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

Fattore A: Strategia di Marketing Convenienza Qualità Prezzo Vendite Città 1 Vendite Città 2 Vendite Città 3 TV Media pubblicitario Fattore B: Vendite Città 1 Vendite Città 2 Vendite Città 3 Giornali Vi sono differenze tra le medie delle vendite dovute alle diverse strategie di marketing? Testiamo se la media delle vendite per “Convenienza”, “Qualità”, “Prezzo” sono significativamente differenti l’una dall’altra.

Fattore A: Strategia di Marketing Convenienza Qualità Prezzo Vendite Città 1 Vendite Città 2 Vendite Città 3 TV Media pubblicitario Fattore B: Vendite Città 1 Vendite Città 2 Vendite Città 3 Giornali Vi sono differenze tra le medie delle vendite dovute alle interazioni tra strategia di marketing e media pubblicitario? Testiamo se la media delle vendite di alcune celle sono differenti rispetto al livello atteso.

Rappresentazione grafica delle possibili relazioni tra A e B Differenza tra i livelli del fattore A e del fattore B senza interazioni Differenza tra i Livelli del fattore A e del fattore B senza interazioni Livello 1 e 2 del fattore B Risposta media Livello 1 del fattore B Livello 2 del fattore B Risposta media Livelli del fattore A Livelli del fattore A 1 2 3 1 2 3 Nessuna differenza tra i livelli del fattore A e del fattore B. Interazione Risposta media Risposta media Livelli del fattore A Livelli del fattore A 1 2 3 1 2 3

Sum of squares

Test F per una two-way ANOVA Test per la differenza tra i Livelli dei fattori principali F= MS(A) MSE F= MS(B) MSE SS(A)/(a-1) SS(B)/(b-1) SSE/(n-ab) Regioni di rifiuto: F > Fa,a-1 ,n-ab F > Fa, b-1, n-ab Test per l’interazione tra i fattori A e B F= MS(AB) MSE SS(AB)/(a-1)(b-1) Regione di rifiuto: F > Fa(,a-1)(b-1),n-ab

I Dati:

Test della differenza della vendita media per i tre approcci di marketing: H0: mconv. = mqualità = mprezzo H1: Almeno due medie sono differenti F = MS(Strategie di Marketing)/MSE = 5.33 Fcritico = Fa,a-1,n-ab = F.05,3-1,60-(3)(2) = 3.15 Le differenze nelle vendite settimanali dovute alle strategie di vendita sono diverse ad un livello di significatività del 5%.

Test della differenza in media tra i due media pubblicitari H0: mTV. = mGiornali H1: Le due medie sono diverse F = MS(Media)/MSE = 1.42 Fcritico = Fa,a-1,n-ab = F.05,2-1,60-(3)(2) = circa 4.00 Non esiste differenza ad un livello di significatività del 5% tra i due media pubblicitari.

Test per l’interazione tra il fattore A e B H0: mTV*conv. = mTV*qualità =…=mgiornali*prezzo H1: Almeno due medie sono diverse F = MS(Marketing*Media)/MSE = .09 Fcritico = Fa,(a-1)(b-1),n-ab = F.05,(3-1)(2-1),60-(3)(2) = circa 3.15 Non esistono differenze dovute alle interazioni tra i due fattori al un livello di significatività del 5%.