La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Corso di Modelli Lineari

Presentazioni simili


Presentazione sul tema: "Corso di Modelli Lineari"— Transcript della presentazione:

1 Corso di Modelli Lineari
ANalysis Of VAriance Corso di Modelli Lineari a.a. 2012/2013 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

2 Carmela Iorio Dipartimento di Scienze Economiche e Statistiche
Origini storiche L’analisi della varianza fu inizialmente proposta da R.A. Fisher negli anni ’20 e ’30 del secolo scorso, ma nella sua forma attuale è dovuta a G.W. Snedecor che ne perfezionò il metodo rispetto alla proposta originale di Fisher. L’analisi della varianza è basata sul rapporto tra varianze, denominato test F in onore di Fisher e utilizza la distribuzione F, ricordata anche come distribuzione di Fisher-Snedecor. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

3 La metodologia L’analisi della varianza è una metodologia:
che permette di valutare gli effetti su una variabile dipendente (quantitativa) di una o più variabili esplicative qualitative, dette fattori di fondamentale importanza per l’analisi di dati sperimentali (ma non solo) in cui le variabili indipendenti sono qualitative ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

4 Carmela Iorio Dipartimento di Scienze Economiche e Statistiche
La terminologia Fattore: variabile qualitativa utilizzata per discriminare un gruppo della popolazione da un altro. Livello: uno dei possibili valori/stati che il fattore può assumere. I fattori che definiscono i gruppi della popolazione possono essere uno o più di uno: Con un solo fattore analisi della varianza ad una via (o ad un fattore). - Con due (o più) fattori analisi della varianza a due vie (o più vie) o due (o più) fattori. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

5 Carmela Iorio Dipartimento di Scienze Economiche e Statistiche
L’obiettivo Obiettivo dell'analisi è misurare se la differenza tra le medie (variabilità tra gruppi) è superiore alla variabilità interna a ciascun gruppo (variabilità entro gruppi) al fine di verificare se la variabilità apporta informazione sulle cause dei fenomeni e sulla loro relazione. In conclusione, siamo interessati a studiare le relazioni tra le medie delle popolazioni (ovvero se esse sono da considerarsi uguali o meno). ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

6 Carmela Iorio Dipartimento di Scienze Economiche e Statistiche
L’utilizzo (1/2) L’analisi della varianza consente di valutare l’importanza relativa, in termini di significatività statistica, delle diverse fonti di variazione* nella variabilità sia in studi osservazionali che sperimentali Sistematiche (sotto il controllo del ricercatore: fattori esplicativi o modelli) * Casuali o accidentali (errori di misurazioni o di numerose cause che producono numerosi effetti impercettibili il cui comportamento è assimilabile ad errori di misura, ecc) Il principio su cui si fonda l’ANOVA e’ quello del rapporto tra due varianze (quella sistematica e quella dovuta all’errore) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

7 Carmela Iorio Dipartimento di Scienze Economiche e Statistiche
L’utilizzo (2/2) La procedura si utilizza quando si è interessati a verificare l’ipotesi di differenza tra due o più medie. Quando le medie sono solo due si può utilizzare il t di Student (dallo pseudonimo del suo inventore William Gosset); Se le medie sono più di due, si usa l’analisi della varianza (ANOVA, ANalisis Of VAriance). ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

8 ANOVA: una breve premessa
L’analisi della varianza, in una prima accezione, estende il test sulla differenza tra medie di due popolazioni a più popolazioni. Essa infatti può essere impiegata per verificare l’ipotesi nulla di uguaglianza di h medie di altrettante popolazioni, discriminate sulla base di un fattore che può essere assimilato ad una variabile qualitativa. Il test dell’ANOVA ad una via è basato sull’analisi della variabilità complessiva (devianza totale) in funzione delle diverse cause della variazione: ￿ devianza entro trattamenti ￿ devianza tra trattamenti da cui il termine Analisi della Varianza. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

9 Carmela Iorio Dipartimento di Scienze Economiche e Statistiche
ANOVA: esempio introduttivo (1/5) Si consideri il caso di una ditta farmaceutica che vuole verificare se tre prodotti volti alla cura della medesima patologia siano o meno ugualmente efficaci. A tale scopo, i farmaci vengono somministrati ad alcune cavie Si misura sulle cavie l’effetto dei tre farmaci Se i tre farmaci sono ugualmente efficaci, le risposte ai trattamenti da parte delle cavie dovrebbero essere in media non troppo diverse. Sintetizzando al massimo, potremmo dire che lo scopo della analisi della varianza è stabilire cosa debba intendersi per “troppo diverse”. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

10 Carmela Iorio Dipartimento di Scienze Economiche e Statistiche
ANOVA: esempio introduttivo (2/5) In caso di uguaglianza degli effetti: le differenze che si riscontrano tra le medie delle risposte ai trattamenti da parte dei tre gruppi di cavie sono dovute alla variabilità sperimentale (o componente accidentale delle risposte sperimentali) che fa si che la risposta differisca da cavia a cavia anche quando queste sono sottoposte al medesimo trattamento. Questo tipo di differenze sono infatti dovute ad un complesso molto ampio di cause che sfuggono al controllo dello sperimentatore e che vengono allora incluse nella componente accidentale, a sua volta rappresentata mediante una variabile casuale, per la quale si ipotizza una distribuzione di tipo normale. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

11 Carmela Iorio Dipartimento di Scienze Economiche e Statistiche
ANOVA: esempio introduttivo (3/5) Dalla normalità della componente accidentale discende che le risposte da parte dei tre gruppi di cavie possono essere riguardate come altrettanti campioni estratti da popolazioni anch’esse normali e con media diversa od uguale a seconda che i farmaci siano o meno parimenti efficaci. L’ipotesi nulla prevede che le risposte ai trattamenti di tutti i gruppi abbiano la stessa origine, ovvero provengano dalla stessa popolazione, e che le differenze osservate tra i gruppi siano solo dovute al caso. L’ipotesi alternativa afferma invece che le risposte ai trattamenti dei tre gruppi provengono da popolazioni diverse, aventi medie diverse ma la stessa varianza. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

12 Carmela Iorio Dipartimento di Scienze Economiche e Statistiche
ANOVA: esempio introduttivo (4/5) Il problema è quello di stabilire se tali differenze tra le medie delle risposte ai trattamenti siano riconducibili agli errori del campionamento (come affermato dall’ipotesi nulla), oppure se riflettano il fatto che tali risposte provengono da popolazioni diverse (come affermato dall’ipotesi alternativa). Per valutare l’ipotesi alternativa contro l’ipotesi nulla è necessario stabilire: quale quota della variabilità complessiva della variabile risposta sia attribuibile alla diversa efficacia del farmaco (varianza tra i gruppi) e quale quota della varianza sia invece attribuibile alle fluttuazioni casuali dovute agli errori (varianza entro i gruppi). ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

13 Carmela Iorio Dipartimento di Scienze Economiche e Statistiche
ANOVA: esempio introduttivo (5/5) Il test è basato sulle seguenti considerazioni: Se è vera l’ipotesi nulla, le risposte ai trattamenti differiscono tra loro per il solo effetto della variabilità casuale. Se è vera l’ipotesi alternativa, entrambe le fonti di variabilità contribuiscono a determinare la variabilità complessiva. Viene scelta l’ipotesi alternativa se la varianza tra i gruppi è più grande della varianza entro i gruppi. Altrimenti viene considerata vera l’ipotesi nulla. Il confronto tra la varianza tra i gruppi e la varianza entro i gruppi viene eseguito mediante il test F di Fisher. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

14 Un solo fattore A ad h modalità
ANOVA ad una via (1/3) Un solo fattore A ad h modalità (la cui efficacia si intende verificare) Una sola v.c. “risposta” Y (cioè il risultato che misuriamo sull’unità statistica j nel gruppo i) Rappresentale medie delle popolazioni da cui si possono ritenere estratti h campioni. Rappresentano la componente casuale o errore i è l’indice per i gruppi (i=1, …, h) j è l’indice per le osservazioni all’interno dei gruppi (j=1, …, ni) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

15 Carmela Iorio Dipartimento di Scienze Economiche e Statistiche
ANOVA ad una via (2/3) Componente causale L’errore εij sintetitizza la variabilità sperimentale. La componente erratica del modello è una v.c. che deve rispettare le solite assunzioni dei modelli lineari: Normalità: le osservazioni appartenenti all’ i-esimo gruppo provengano da una Omoschedasticità: è costante sui h gruppi. 3. Incorrelazione: la variazione casuale di ogni osservazione non deve essere influenzata da quella di un’altra. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

16 ANOVA ad una via (3/3) Componente sistematica
Rappresenta il valore medio della risposta quando agisce il trattamento Ai Rappresenta la media comune delle h popolazioni L’effetto differenziale, rispetto al livello medio generale, della i-esima modalità del fattore sperimentale ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

17 ANOVA ad una via: il modello (1/2)
Si ipotizza che le risposte siano generate da un modello in forma additiva e lineare: j-esima risposta al trattamento con la i-esima modalità del fattore effetto comune e costante per l’intero esperimento effetto dovuto al trattamento con la i-esima modalità del fattore sperimentale effetto erratico (casuale) collegato all’ j-esima unità sottoposta all’ i-esimo trattamento ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

18 ANOVA ad una via: il modello (2/2)
Al fine di identificare gli h + 1 parametri del modello si pone, senza perdere in generalità, il vincolo che Qualora il numero delle osservazioni sperimentali è costante per ciascun trattamento ipotizzato (ni=n/h per ogni i) si definisce un disegno sperimentale bilanciato Il modello può essere ad: effetti fissi: i livelli del fattore sperimentale sono deterministici in quanto si considerano tutti i possibili livelli del fattore. Quindi la conclusione di un’analisi si applica solo ai livelli studiati. effetti casuali (randomizzato): i livelli del fattore discendono da un’estrazione casuale e pertanto sono variabili aleatorie che soddisfano le stesse ipotesi viste per la componente accidentale. Quindi, poiché i livelli inclusi nell’analisi rappresentano un c.c. di tutti i possibili livelli, la conclusione di un’ANOVA ad effetti casuali si applica a tutti i livelli del fattore (non solo a quelli studiati). ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

19 Contro un ipotesi alternativa:
Il TEST Si sottopone a test: o equivalentemente: Contro un ipotesi alternativa: Per effettuare il test si considera la devianza campionaria totale di Y ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

20 Carmela Iorio Dipartimento di Scienze Economiche e Statistiche
Sum of Squares SST (Total Sum of Squares) DEVIANZA CAMPIONARIA TOTALE: misura la variabilità totale nei valori della Y attorno alla media campionaria generale SSA (Sum of Squares Among Groups) DEVIANZA TRA I TRATTAMENTI: rappresenta la parte della devianza campionaria totale spiegata dai livelli del fattore SSW (Sum of Squares Within Groups) DEVIANZA ENTRO I TRATTAMENTI: rappresenta la parte dovuta alla variabilità sperimentale ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

21 Il TEST : cosa ci aspettiamo**
SE E’ VERA L’IPOTESI NULLA: Possiamo attenderci uno scarso contributo della devianza tra i gruppi alla devianza totale SE E’ FALSA L’IPOTESI NULLA: Possiamo attenderci che entrambe le devianze contribuiscano a determinare la devianza totale. A questo livello non è però possibile fare confronti, perché le devianze hanno un numero di addendi diverso. Per rendere possibile il confronto, ciascuna devianza viene divisa per i rispettivi gradi di libertà ottenendo le medie dei quadrati, cioè le varianze : ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

22 ANOVA ad una via: la tabella (1/4)
Source df Sum of Squares Mean Square F AMONG (h-1) SSA MSA= SSA/(h-1) MSA/MSW WITHIN (n-h) SSW MSW= SSW/(n-h) TOTAL (n-1) SST Il migliore stimatore non distorto di della componente erratica è dato da MSW Se si assume l’omogeneità della varianza La varianza campionaria entro i trattamenti può essere interpretata come la media aritmetica ponderata delle varianze campionarie (non distorte) di ciascun trattamento, avente per pesi i rispettivi gradi di libertà. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

23 ANOVA ad una via: la tabella (2/4)
Assumendo la normalità della componente erratica del modello, mediante l’applicazione del teorema di Fisher e Cochran, si dimostra che, se è vera l’ipotesi nulla: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

24 ANOVA ad una via: la tabella (3/4)
Per verificare l’ipotesi di uguaglianza delle medie si utilizza la statistica test che confronta MSA e MSW: la v.c. Tn è il rapporto tra due v.c. Chi-quadrato indipendenti divise per i rispettivi gradi di libertà: ovvero: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

25 ANOVA ad una via: la tabella (4/4)
Il numeratore e il denominatore di Tn sono stimatori indipendenti e non distorti della stessa varianza Se è VERA l’ipotesi nulla Se è FALSA l’ipotesi nulla SSA/(h-1) sarà notevolmente maggiore di SSW(n-h) ed il rapporto Tn sarà largamente superiore ad 1 Saranno molto simili ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

26 Carmela Iorio Dipartimento di Scienze Economiche e Statistiche
ANOVA ad una via: interpretazione Più questo rapporto è elevato, maggiore è il contributo dei livelli del fattore sperimentale alla spiegazione della variabilità del fenomeno osservato: ciò che induce a rigettare l’ipotesi nulla. Se si rigetta l’ipotesi nulla significa che esiste almeno un livello del fattore per il quale l’ipotesi nulla non è verificata ossia la media del gruppo differisce dalla media generale ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

27 Carmela Iorio Dipartimento di Scienze Economiche e Statistiche
ANOVA ad una via: la regola decisionale Si rifiuta H0 se: il valore calcolato della statistica test è maggiore del valore critico della distribuzione di Fisher ad un determinato livello di significatività α del test I valori critici si individuano nelle tavole della distribuzione di Fisher in base ai gradi di libertà e al livello di significatività. Se H0 è falsa ci aspettiamo che la statistica test assuma valori maggiori rispetto ai valori tabulati nella tavola della distribuzione di Fisher la variabilità totale è dovuta soprattutto all’effetto del trattamento Se H0 è vera ci aspettiamo che il valore osservato di F sia minore al valore tabulato. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

28 ANOVA ad una via: dopo il test F
Quali gruppi hanno medie diverse? Dopo aver rilevato qualche differenza nei livelli del fattore che ci ha condotto a rigettare l’ipotesi nulla, si è interessati nel confronto a coppie di trattamenti o combinazione complesse di trattamenti. Si noti che non ha senso chiedersi se un determinato livello è significativo in quanto si pone la questione: "significativamente diverso da cosa?" Ogni test significativo deve prevedere un confronto di qualche tipo. Ci sono una varietà di procedure che comunemente vengono usate per effettuare tutti i confronti simultanei tra coppie di gruppi ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

29 *Confronti a coppie usando la distribuzione t
Supponiamo di sottoporre a test H0: Si costruisce un intervallo di confidenza (c.i.) per la differenza tra ciascuna coppia di medie: dove: LSD (Least Significance Difference)= Se > LSD ( {0 c.i.} allora le medie differiscono significativamente al livello ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

30 *Confronti Multipli: errore del I tipo (1/6)
Quando i livelli del fattore che si studia sono più di due sembrerebbe intuitivo effettuare i confronti a due a due utilizzando il test t di Student e ripetere l’analisi tante volte quanti sono i possibili confronti a coppie tra i trattamenti. La probabilità di commettere un errore del I tipo, cioè la probabilità α di trovare una differenza significativa quando in realtà essa non esiste, è corretta per il singolo confronto tra due medie. Questo tasso d’errore, chiamato comparison-wise, all’aumentare del numero di confronti determina un tasso d’errore per tutto l’esperimento, chiamato experimental-wise, notevolmente maggiore. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

31 *Confronti Multipli: errore del I tipo (2/6)
Se si effettua un singolo test t di Student tra due medie con α=0,05 tale confronto ha una probabilità di (1-α)=0,95 di affermare il vero e una probabilità α=0,05 di commettere l’errore di I tipo: Se vengono effettuate N ripetizioni del test t, la probabilità di commettere l’errore di 1° specie E1 : ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

32 *Confronti Multipli: errore del I tipo (3/6)
Se ci sono h gruppi possiamo effettuare N=h(h-1)/2 confronti Con tre gruppi, per esempio, sono possibili N = 3 confronti e la probabilità complessiva (experiment-wise) di non commettere errori del I tipo: In generale, nel caso di N confronti tra coppie di medie, la probabilità, indicata con G1, di non rifiutare H0 quando è vera: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

33 α =1– P(non rifiutare H0|H0 è vera)=1 – (1 – α)2 = 0,0975
*Confronti Multipli: errore del I tipo (4/6) Di conseguenza, la probabilità di commettere un errore del I tipo è: Quindi: 1 confronto: la probabilità di rifiutare H0 quando è vera è α; 2 confronti indipendenti: la probabilità di rifiutare almeno un’ipotesi nulla se entrambi sono vere è α =1– P(non rifiutare H0|H0 è vera)=1 – (1 – α)2 = 0,0975 3 confronti indipendenti: la probabilità di rifiutare almeno un’ipotesi nulla se tutte e tre sono vere è α=1– P(non rifiutare H0|H0 è vera) = 1 – (1 – α)3 = 0,143 Anche se nominalmente α=0,05 per tre confronti è pari a 0,14 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

34 In generale, per N confronti indipendenti, l’ experiment-wise è
*Confronti Multipli: errore del I tipo (5/6) In conclusione, se si eseguono 3 test t di Student, la probabilità d’errore di I tipo è quasi 3 volte superiore a quella che si realizza quando viene eseguito un singolo test. Se si effettuano più confronti la probabilità di commettere l’errore di primo tipo aumenta proporzionalmente al numero di confronti: il test t di Student non garantisce un adeguato livello di protezione del test. Indichiamo con: α la probabilità dell’errore del I tipo I del singolo test (comparison-wise) - αT la probabilità dell’errore del I tipo per tutto il test (experiment-wise) In generale, per N confronti indipendenti, l’ experiment-wise è ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

35 *Confronti Multipli: errore del I tipo (6/6)
Nel caso di 8 gruppi, per esempio, sono possibili: confronti a coppie. Se tutti questi confronti venissero eseguiti, ponendo α=0,05 per ciascun confronto, la probabilità d’errore del I tipo complessiva sarà: Nei confronti multipli è dunque necessario ricorrere a delle procedure che garantiscono un adeguato livello di protezione nei confronti dell’errore del I tipo ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

36 Confronti Multipli (1/2)
I confronti possono essere svolti prima o dopo l’esame dei dati Se i confronti sono stati decisi PRIMA di esaminare i dati (pianificati nel disegno dello studio): CONFRONTO SINGOLO: si utilizza il t-test standard oppure il test t basato sugli intervalli di confidenza POCHI CONFRONTI: si utilizza la correzione di Bonferroni. MOLTI CONFRONTI: poiché Bonferroni diventa sempre più conservativo al crescere di h, si preferisce utilizzare il metodo di Scheffé o quello di Tukey. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

37 Confronti Multipli (2/2)
Se i confronti sono stati decisi DOPO aver esaminato i dati (generati dall’osservazione dei risultati): E’ necessario “regolare” l’intervallo di confidenza per consentire la possibilità di effettuare tutti i confronti Ci sono due casi importanti: SOLI CONFRONTI A COPPIE: si utilizza il metodo di Tukey. TUTTI I CONTRASTI, CIOÈ COMBINAZIONI LINEARI: si utilizza il metodo Scheffé. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

38 Confronti Multipli: Fisher’ LSD
L’utilizzo dei confronti multipli è preceduto dal test F visto prima Fisher’s LSD o t-protetto: per tutelare l’errore di I specie al livello α, Fisher suggerisce di applicare la procedura LSD solamente se al livello α del test F l’ipotesi nulla di uguaglianza delle medie è rifiutata. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

39 *Confronti Multipli: Bonferroni
Il test di Bonferroni consiste nell’usare il t test per confrontare due trattamenti modificando il livello di protezione (1-α) di ogni singolo confronto, in modo da garantire il livello di protezione complessivo desiderato. In base a tale principio per effettuare N(=h(h-1)/2) volte il test di Student mantenendo costante la probabilità totale αT, la probabilità di ogni confronto deve essere: Per esempio, con 3 confronti e con αT = 0,05 La correzione di Bonferroni richiede che ogni singolo test sia condotto al livello 0,05/3=0,0166, cioè si dichiareranno significativi solo i risultati con p-value < 0,0166 Se costruiamo più di un intervallo di confidenza dobbiamo utilizzare la correzione di Bonferroni per il calcolo dei quantili della t ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

40 *Confronti Multipli: metodo di Scheffé
Supponiamo di sottoporre a test H0: Si costruisce un intervallo di confidenza per la differenza tra ciascuna coppia di medie. Il livello di significatività del test di Scheffé è un multiplo della F di Fisher, dove il multiplo è il numero di gruppi meno 1. Tra i test a posteriori, il test di Scheffé è il più robusto ma anche il più conservativo: garantisce che l’errore campionario dipende da per ciascuna coppia di medie. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

41 I CONTRASTI SONO UTILI PER IL CONFRONTO SIMULTANEO TRA PIÙ MEDIE
I confronti tra coppie di medie rappresentano casi particolari di contrasti Un contrasto è una combinazione lineare delle medie: dove: Due confronti caratterizzati dai coefficienti e tali che per i=1,…, h sono detti CONFRONTI ORTOGONALI I CONTRASTI SONO UTILI PER IL CONFRONTO SIMULTANEO TRA PIÙ MEDIE ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

42 Allora una ipotesi nulla da verificare sarà
Contrasti (2/4) Se si ipotizza che: Allora una ipotesi nulla da verificare sarà Questa ipotesi è un confronto ortogonale con i coefficienti (1/2, -1/2, 1/2, -1/2)* rispettivamente per * Per convenzione i coefficienti hanno somma algebrica pari a 0 e somma dei valori assoluti pari a 2 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

43 Contrasti (3/4) Il metodo di Scheffé per il confronto tra coppie di medie potrà essere esteso al confronto L considerando l’intervallo di confidenza: Si assume che per TUTTI i confronti possibili la proporzione di intervalli che non include lo zero è pari ad se le g medie della popolazione sono uguali, controllando così l’errore di primo tipo del test. Se si rifiuta l’ipotesi nulla allora esisterà un confronto che differirà significativamente da zero. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

44 Contrasti (4/4) sono dati da:
I coefficienti del confronto che darà il più grande valore di: sono dati da: Questo confronto sarà il primo responsabile del rigetto dell’ipotesi nulla che tutte le medie sono uguali tra loro ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

45 Caso Studio 1: “Costo delle Riparazioni”
Il Problema: Una società di trasporto intende verificare l’esistenza di una differenza significativa tra il costo degli interventi di riparazione sul materiale rotabile effettuati da 5 diverse officine ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

46 Caso Studio 1: “Costo delle Riparazioni”
I dati: Sono state osservate le attività svolte da 5 officine di riparazione Per ognuna di esse si è misurato, per alcune settimane, il costo medio unitario degli interventi effettuati nello stesso periodo (costo medio per intervento) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

47 Caso Studio 1: “Costo delle Riparazioni”
I dati: Il costo medio per intervento delle 5 officine: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

48 Caso Studio 1: “Costo delle Riparazioni”
Variabilità del costo d’intervento ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

49 Caso Studio 1: “Costo delle Riparazioni”
ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

50 Caso Studio 1: “Costo delle Riparazioni”
Analisi della Varianza dei Costi Le Ipotesi: H0 : non vi è differenza significativa tra i costi unitari medi delle 5 officine H1 : vi è differenza significativa tra i costi unitari medi delle 5 officine ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

51 Caso Studio 1: “Costo delle Riparazioni”
ANOVA: Regola di Decisione Accetto H0 Rigetto H0 2,606 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

52 Caso Studio 1: “Costo delle Riparazioni”
Analisi della Varianza dei costi dell’intervento Devianza tra i gruppi (tra le officine) Devianza nei gruppi (all’interno del gruppo di interventi effettuati da ogni officina) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

53 Caso Studio 1: “Costo delle Riparazioni”
Analisi della Varianza del costo di intervento Varianza dei trattamenti (tra le officine) Varianza degli errori (all’interno del gruppo di interventi effettuati da ogni officina) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

54 Caso Studio 1: “Costo delle Riparazioni”
ANOVA: Risultato del test Accetto H0 Rigetto H0 2,606 F=12,662 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

55 Caso Studio 1: “Costo delle Riparazioni”
ANOVA - Conclusioni Sulla base del campione raccolto si può concludere, ad un livello di significatività del 5%, che: “esiste una differenza significativa tra i costi medi unitari degli interventi effettuati dalle 5 officine” ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

56 Caso Studio 1: “Costo delle Riparazioni”
Ulteriori investigazioni: Visto che esiste una differenza significativa che porta a rigettare l’ipotesi nulla: “Quale o quali sono le officine che spingono a rigettare l’ipotesi?” ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

57 Caso Studio 1: “Costo delle Riparazioni”
Confronti Multipli (post hoc) Si effettuano confronti tra tutte le officine prese a due a due Si individuano le officine che si differenziano “particolarmente” da tutte le altre al fine di costruire un test migliore ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

58 Caso Studio 1: “Costo delle Riparazioni”
Confronti Multipli con Metodo LSD ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

59 Caso Studio 1: “Costo delle Riparazioni”
Confronti Multipli (post hoc) È certo che l’officina C si differenzia da tutte le altre! È interessante, a questo punto, verificare se le officine A e B si differenziano significativamente da D ed E Gruppi uguali hanno coefficienti uguali (lo zero indica l’esclusione) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

60 Caso Studio 1: “Costo delle Riparazioni”
Confronti Multipli (post hoc) Si effettua un test tra i due gruppi di officine Acc. H0 Rif. H0 t=3,338 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

61 Caso Studio 1: “Costo delle Riparazioni”
Confronti Multipli (post hoc) Si effettua un test tra i due gruppi di officine Si può concludere che: Le officine D ed E hanno una media dei costi di intervento significativamente minore a quella di A e B !!! ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

62 Caso Studio 1: “Costo delle Riparazioni”
Confronti Multipli (post hoc) L’officina D è significativamente migliore di E ? ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

63 Caso Studio 1: “Costo delle Riparazioni”
Confronti Multipli (post hoc) Si effettua un test tra le due officine Acc. H0 Rif. H0 t=0,517 Conclusione: non vi è una differenza significativa tra D ed E ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

64 Caso Studio 1: “Costo delle Riparazioni”
Ulteriori investigazioni (2): E in riguardo alla durata degli interventi? E alla efficienza degli interventi? ….. Per una “valutazione comparata” di tutte le informazioni del fenomeno complesso “prestazione dell’officina” ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

65 ANOVA e Regressione L’analisi di regressione studia come varia in media la variabile dipendente Y al variare di una o più variabile esplicative. L’ANOVA può essere come ottenuto come caso speciale del modello di regressione multipla utilizzando le variabili dummy per rappresentare le variabili qualitative Una variabile dummy è una variabile binaria che assume valore 1 se l’unità statistica possiede una data caratteristica e 0 altrimenti. L’ANOVA ad una via può essere scritta come una regressione multipla definendo h variabili dummy per rappresentare i h gruppi. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

66 Campagna Pubblicitaria
Regressione con variabili dummy: un esempio (1/14) Un’azienda di marketing vuole verificare gli acquisti di prodotti alimentari a base di latte a seguito dell’introduzione di 4 campagne pubblicitarie (AD) Y Campagna Pubblicitaria 8 AD1 7 9 6 5 AD2 4 3 AD3 2 AD4 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

67 Regressione con variabili dummy: un esempio (2/14)
Al fine di ottenere un modello ANOVA-one way, utilizzando la dummy coding occorre costruire tante variabili dummy quante sono le modalita della variabile qualitativa nel seguente modo. Relativamente ai dati del nostro esempio cominciamo con il considerare la seguente tabella: Y AD0 AD1 AD2 AD3 AD4 8 1 7 9 6 5 4 3 2 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

68 Regressione con variabili dummy: un esempio (3/14)
A partire da una variabile che assume h modalità, si possono definire h dummies, ma soltanto h-1 variabili dummies vanno incluse nel modello (altrimenti, in presenza di un termine costante, ci sarebbe perfetta collinearità). Per applicare l’approccio dummy: definiamo le variabili dummy K1, K2, K3 per rappresentare le prime 3 AD; la quarta campagna è scelta come caso base. La colonna X0 codifica la media di riferimento (qui quella del k-esimo gruppo) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

69 Regressione con variabili dummy: un esempio (4/10)
L’equazione per il modello è: I consumo medi per i 4 gruppi di campagne pubblicitarie sono per le campagne 1, 2, 3 e 4 rispettivamente. Questo sistema di codifica implica che la generale matrice X’X assumerà come valori: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

70 Regressione con variabili dummy: un esempio (5/14)
Da cui: Analogamente la matrice X’y diventerà: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

71 Regressione con variabili dummy: un esempio (6/14)
Da cui: Analogamente la matrice X’y diventerà: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

72 Regressione con variabili dummy: un esempio (7/14) (7/10)
Quindi: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

73 Regressione con variabili dummy: un esempio (8/14)
Quindi: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

74 Regressione con variabili dummy: un esempio (9/14)
La codifica dummy stabilisce che il parametro β0 corrisponde alla media della k-esima categoria presa in considerazione: Gli altri parametri corrispondono alla differenza tra le medie dei gruppi e la categoria di riferimento e cioè l’ultima I parametri beta stimati nella codifica dummy permettono di valutare nell’ordine le seguenti ipotesi nulle: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

75 Regressione con variabili dummy: un esempio (10/14)
Poiché: Per ciascuna delle nk osservazioni possiamo riscontrare che Xk = 1 mentre i rimanenti X-k = 0. Pertanto il valore stimato dalla regressione per ogni gruppo di indipendenti osservazioni può essere ricondotto alla media delle osservazioni. Infatti: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

76 Regressione con variabili dummy: un esempio (11/14)
In generale, è possibile scomporre la sommatoria totale dei quadrati (SStot) nella componente attribuita alla regressione (SST) e la componente dovuta all’errore (SSW). ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

77 Regressione con variabili dummy: un esempio (12/14)
ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

78 Regressione con variabili dummy: un esempio (13/14)
Come nella regressione multipla, è possibile verificare l’ipotesi nulla che tutti i coefficienti di regressione siano simultaneamente uguali a zero. Applichiamo il test F totale: contro l’ipotesi che esista almeno un regressore che abbia un effetto significativamente diverso da zero sulla variabile dipendente. La variabile test è definita a partire dalla decomposizione ANOVA della devianza totale SST in devianza di regressione SSR e devianza residua SSE. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

79 Regressione con variabili dummy: un esempio (13/14)
Il convenzionale F-test della regressione multipla è equivalente a testare l’uguaglianza delle 4 medie. Il risultato è: Dal p-value, possiamo concludere che le medie per le campagne pubblicitarie 1,2,3 sono significativamente diverse dalla 4 al livello di significatività del 5%. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

80 Effect Coding (1/10) E’ possibile un’altra codifica dei livelli del fattore: effect coding, che è centrata sulla media generale delle osservazioni: Riprendendo l’esempio di prima: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

81 Effect Coding (2/10) Le variabili sono definite: AD1= 1 per AD1
= 0 per AD2 e AD3 = -1 per AD4 AD2= 1 per AD2 = 0 per AD1 e AD3 AD3= 1 per AD3 = 0 per AD1 e AD2 ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

82 Effect Coding (3/10) La matrice X ottenuta usando l’effetto coding è mostrata a lato. Da notare la colonna X0 per codificare la media generale. L’ultimo gruppo viene ad assumere come valore -1, portando a 0 la sommatoria dei valori presenti in ciascuna colonna. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

83 Effect Coding (4/10) Questo sistema di codifica implica che la generale matrice X’X assumerà come valori: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

84 Effect Coding (5/10) Da cui: Analogamente la matrice X’y diventerà:
ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

85 Effect Coding (6/10) Poiché:
Il coefficiente 5 rappresenta la media nelle 20 celle iniziali. Il coefficiente 2 è ottenuto sottraendo alla media delle celle dell’AD1(k1) che è 7 la media generale….. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

86 il parametro β0 corrisponde alla media generale delle osservazioni:
Effect Coding (7/10) La Effect coding stabilisce che: il parametro β0 corrisponde alla media generale delle osservazioni: gli altri parametri corrispondono alla differenza tra la media del gruppo e la media generale: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

87 Effect Coding (8/10) I parametri beta stimati nella Effect coding permettono di valutare nell’ordine le seguenti ipotesi nulle: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

88 Effect Coding (9/10) Poiché:
Per ciascuna delle nk osservazioni possiamo riscontrare che Xk = 1 mentre i rimanenti X-k = 0. Pertanto il valore stimato dalla regressione per ogni gruppo di indipendenti osservazioni può essere ricondotto alla media delle osservazioni. Infatti: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

89 Effect Coding (10/10) Per il k-esimo gruppo avremo:
Si mostra quindi come la differenza tra le due codifiche consiste nel valore che assume il parametro beta: nella dummy rappresenta la differenza della media rispetto al gruppo di riferimento, nella coding rappresenta la differenza rispetto alla media generale. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

90 ANOVA a due fattori: premessa
L’analisi di un fenomeno non si deve limitare alla valutazione dei singoli fattori in studio, ma molto spesso è importante valutare come tali fattori interagiscono tra di loro: lo studio delle interazioni è fondamentale per capire i diversi effetti di un fattore a seconda della modalità degli altri fattori considerati. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

91 ANOVA a due fattori: un esempio
Valutare l’effetto di un farmaco su un certo sintomo a seconda dell’appartenenza a classi di età diverse o a seconda del sesso. L’effetto del farmaco è diverso nei giovani rispetto agli anziani? L’effetto del farmaco varia a seconda del sesso? Se non c’è interazione allora il farmaco avrà un effetto uguale per tutte le classi di età. L’efficacia sarà la stessa per tutti i soggetti in studio indipendentemente dalla loro età. Se c’è interazione allora il farmaco avrà effetti diversi a seconda della classe di età o del sesso, quindi non si può considerare un effetto medio uguale in tutte le classi ma si dovranno fornire i diversi profili di efficacia. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

92 ANOVA a due fattori (1/4) Introduzione di una seconda variabile qualitativa (fattore) consente lo STUDIO DELLE INTERAZIONI Quando si analizzano due fattori si può essere interessati a verificare: gli effetti principali di un singolo fattore le interazioni tra più fattori per determinare l’effetto congiunto ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

93 ANOVA a due fattori (2/4) 2 fattori: A(con h livelli) e B (con g livelli) Supponiamo di conoscere le medie della popolazione B1 B2 Bk Bg A1 μ11 μ12 μ1g μ1. A2 μ21 μ22 μ2g μ2. Aj μjk Ah μh1 μh2 μhg μh. μ.1 μ.2 μ.g μ.. All’interno della cella (j,k), la variabile di risposta Y ha una popolazione media ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

94 ANOVA a due fattori (3/4) se R e C NON INTERAGISCONO:
i singoli fattori hanno degli effetti che non variano a seconda del livello degli altri fattori (ADDITIVITA’ DEGLI EFFETTI ) se R e C INTERAGISCONO: La presenza contemporanea di determinati livelli dei fattori migliora o peggiora il risultato rispetto alla semplice additività. Graficamente i segmenti non sono paralleli, perché l’effetto di un fattore dipende dal livello dell’altro. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

95 ANOVA a due fattori (4/4) Le medie campionarie mostreranno sempre qualche interazione, anche se le interazioni sono assenti nella popolazione, a causa dell’errore di campionamento Noi dobbiamo determinare se la violazione dell’ipotesi di parallelismo osservata nel campione sia sufficientemente grande da essere statisticamente significativa, o se è casuale. Nei grandi campioni, noi vogliamo determinare se le interazioni statisticamente significative sono sufficientemente grandi da meritare interesse. Potremmo decidere di ignorare le interazioni che sono statisticamente significative, ma piccole. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

96 ANOVA a due fattori: premessa
L’interpretazione dell’ANOVA a due vie dipende dalla presenza o dall’assenza delle interazioni. Cominciamo col testare l’interazione: Gli effetti riga sono gli stessi all’interno dei livelli del fattore colonna Dopo l’interazione, guardiamo agli effetti principali Conviene esprimere l’ipotesi sugli effetti principali in termini di medie marginali: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

97 ANOVA a due fattori: il modello
Senza Interazione Si ipotizza che le risposte siano generate da un modello in forma additiva e lineare: Rappresenta la media generale delle h*g popolazioni Effetto riga (effetto trattamento i del fattore A) Effetto colonna (effetto trattamento j del fattore B) Variabilità sperimentale Si assume senza perdita di generalità che: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

98 ANOVA a due fattori: il test
Senza Interazione Per effettuare il test si considera la devianza campionaria totale di Y ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

99 Sum of Squares _ senza interazione (1/2)
SST (Total Sum of Squares) DEVIANZA CAMPIONARIA TOTALE: misura la variabilità totale nei valori della Y attorno alla media campionaria generale SSA (Sum of Squares dovuta al fattore A) È la media delle risposte campionarie per l’i-esimo livello di A, qualunque sia il livello di B ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

100 Sum of Squares _ senza interazione (2/2)
SSB (Sum of Squares dovuta al fattore B) È la media delle risposte campionarie per il j-esimo livello di B, qualunque sia il livello di A SSE (Sum of Squares dovuta alla variabilità sperimentale)= SST-SSA-SSB ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

101 ANOVA a due vie, senza interazione:
la tabella (1/3) Origine della variabilità df Sum of Squares Mean Square F FATTORE A (h-1) SSA MSA= SSA/(h-1) MSA/MSE FATTORE B (g-1) SSB MSB= SSB/(g-1) MSB/MSE RESIDUALE (h-1)(g-1) SSE MSE=SSE/(h-1)(g-1) TOTALE (n-1) SST ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

102 ANOVA a due vie, senza interazione: la tabella (2/3)
Assumendo la normalità della componente erratica se è vera l’ipotesi nulla: ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

103 ANOVA a due vie, senza interazione:
la tabella (3/3) Il test viene condotto considerando i rapporti: L’ipotesi nulla si rifiuta se il relativo rapporto considerato risulta elevato così che saranno bassi i livelli di significatività ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

104 ANOVA a due fattori: il modello
Con Interazione Si ipotizza che per ciascun trattamento vengono considerate le replicazioni r: Rappresenta la media generale delle h*g popolazioni Effetto riga Effetto colonna Variabilità sperimentale Esprime l’effetto dovuto all’interazione tra i due fattori Il numero delle replicazioni è ipotizzato costante e pari a r per ogni combinazione dei livelli dei due fattori ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

105 ANOVA a due fattori: il test
Con Interazione Per effettuare il test si considera la devianza campionaria totale di Y ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

106 Sum of Squares _ con interazione (1/2)
SST (Total Sum of Squares) SSA (Sum of Squares dovuta al fattore A) SSB (Sum of Squares dovuta al fattore B) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

107 Sum of Squares _ con interazione (2/2)
SSI (Sum of Squares dovuta all’Interazione) È la media campionaria delle risposte al trattamento con l’i-esimo livello di A e con il j-esimo livello di B SSE (Sum of Squares dovuta alla variabilità sperimentale) ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

108 ANOVA a due vie, con interazione: la tabella (1/2)
Origine della variabilità df Sum of Squares Mean Square F FATTORE A (h-1) SSA MSA= SSA/(h-1) MSA/MSE FATTORE B (g-1) SSB MSB= SSB/(g-1) MSB/MSE INTERAZIONE (h-1)(g-1) SSI MSI=SSI/(h-1)(g-1) MSI/MSE SPIEGATA (hg -1) SSL RESIDUALE (n-hg) SSE MSE=SSE/(n-hg) TOTALE (n-1) SST ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

109 ANOVA a due vie, senza interazione:
la tabella (2/3) Il test viene condotto considerando i rapporti: Se l’ultimo rapporto F risulta elevato vuol dire che tra i due fattori vi è una significativa interazione ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

110 Caso Studio 2: “ANOVA a due fattori: Campioni Indipendenti
Caso Studio 2: “ANOVA a due fattori: Campioni Indipendenti. Il lancio di un nuovo succo di frutta” Il Problema: Un produttore di succhi di mela sta progettando di sviluppare un nuovo prodotto e il marketing manager deve decidere come promuovere il nuovo prodotto. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

111 Caso Studio 2 Supponiamo che vengono esaminati due fattori:
Gli effetti della campagna di marketing sono: L’enfasi sulla convenienza L’enfasi sulla qualità L’enfasi sul prezzo Gli effetti sul media scelto per la campagna: Pubblicità in TV Pubblicità sui giornali Possiamo disegnare l’esperimento come segue: In tre città viene lanciata una campagna pubblicitaria. In ogni città viene sottolineata una sola caratteristica (convenienza, qualità e prezzo) rispetto al tipo di pubblicità condotta. ANOVA Carmela Iorio Dipartimento di Scienze Economiche e Statistiche

112 Fattore A: Strategia di Marketing
Convenienza Qualità Prezzo Vendite Città 1 Vendite Città 2 Vendite Città 3 TV Media pubblicitario Fattore B: Vendite Città 1 Vendite Città 2 Vendite Città 3 Giornali Vi sono differenze tra le medie delle vendite dovute alle diverse strategie di marketing? Testiamo se la media delle vendite per “Convenienza”, “Qualità”, “Prezzo” sono significativamente differenti l’una dall’altra.

113 Fattore A: Strategia di Marketing
Convenienza Qualità Prezzo Vendite Città 1 Vendite Città 2 Vendite Città 3 TV Media pubblicitario Fattore B: Vendite Città 1 Vendite Città 2 Vendite Città 3 Giornali Vi sono differenze tra le medie delle vendite dovute alle interazioni tra strategia di marketing e media pubblicitario? Testiamo se la media delle vendite di alcune celle sono differenti rispetto al livello atteso.

114 Rappresentazione grafica delle possibili relazioni tra A e B
Differenza tra i livelli del fattore A e del fattore B senza interazioni Differenza tra i Livelli del fattore A e del fattore B senza interazioni Livello 1 e 2 del fattore B Risposta media Livello 1 del fattore B Livello 2 del fattore B Risposta media Livelli del fattore A Livelli del fattore A 1 2 3 1 2 3 Nessuna differenza tra i livelli del fattore A e del fattore B. Interazione Risposta media Risposta media Livelli del fattore A Livelli del fattore A 1 2 3 1 2 3

115 Sum of squares

116 Test F per una two-way ANOVA
Test per la differenza tra i Livelli dei fattori principali F= MS(A) MSE F= MS(B) MSE SS(A)/(a-1) SS(B)/(b-1) SSE/(n-ab) Regioni di rifiuto: F > Fa,a-1 ,n-ab F > Fa, b-1, n-ab Test per l’interazione tra i fattori A e B F= MS(AB) MSE SS(AB)/(a-1)(b-1) Regione di rifiuto: F > Fa(,a-1)(b-1),n-ab

117 I Dati:

118 Test della differenza della vendita media per i tre approcci di marketing:
H0: mconv. = mqualità = mprezzo H1: Almeno due medie sono differenti F = MS(Strategie di Marketing)/MSE = 5.33 Fcritico = Fa,a-1,n-ab = F.05,3-1,60-(3)(2) = 3.15 Le differenze nelle vendite settimanali dovute alle strategie di vendita sono diverse ad un livello di significatività del 5%.

119 Test della differenza in media tra i due media pubblicitari
H0: mTV. = mGiornali H1: Le due medie sono diverse F = MS(Media)/MSE = 1.42 Fcritico = Fa,a-1,n-ab = F.05,2-1,60-(3)(2) = circa 4.00 Non esiste differenza ad un livello di significatività del 5% tra i due media pubblicitari.

120 Test per l’interazione tra il fattore A e B
H0: mTV*conv. = mTV*qualità =…=mgiornali*prezzo H1: Almeno due medie sono diverse F = MS(Marketing*Media)/MSE = .09 Fcritico = Fa,(a-1)(b-1),n-ab = F.05,(3-1)(2-1),60-(3)(2) = circa 3.15 Non esistono differenze dovute alle interazioni tra i due fattori al un livello di significatività del 5%.


Scaricare ppt "Corso di Modelli Lineari"

Presentazioni simili


Annunci Google