ANALISI della VARIANZA FATTORIALE

Slides:



Advertisements
Presentazioni simili
Test t di Student (Confronto di due medie)
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
L’Analisi della Varianza ANOVA (ANalysis Of VAriance)
LA VARIABILITA’ IV lezione di Statistica Medica.
La sperimentazione clinica
Lanalisi della varianza Obiettivo: studiare le relazioni tra variabili discrete, che definiscono delle categorie e variabili continue. Esempi: Confronti.
Lo schema a Split-Plot Lo schema a split plot si usa quando:
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Presupposti alla lezione
Confronto tra 2 campioni Nella pratica è utilissimo confrontare se 2 campioni provengono da popolazioni con la stessa media: Confronti tra produzioni di.
per Laurea Specialistica e Dottorandi in ricerca
Introduzione alle misure strumentali
Analisi dei dati per i disegni ad un fattore
Il modello di analisi dei dati nei disegni within.
ANALISI DELLA COVARIANZA
Gli errori nell’analisi statistica
ANALISI DELLA VARIANZA
Inferenza statistica per un singolo campione
Iterazione enumerativa (for)
RISOLVERE PROBLEMI CON LUSO DI STRUMENTI MATEMATICI DIFFICOLTA RISCONTRATE : LETTURA FRETTOLOSA DEL TESTO E SCARSA RIFLESSIONE SUL SIGNIFICATO DEI DATI.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Analisi della varianza (a una via)
Appunti di inferenza per farmacisti
Alberi di Ricorrenza Gli alberi di ricorrenza rappresentano un modo conveniente per visualizzare i passi di sostitu- zione necessari per risolvere una.
Corso di biomatematica Lezione 2: Probabilità e distribuzioni di probabilità Davide Grandi.
CORSO DI MODELLI DI SISTEMI BIOLOGICI LAUREA IN INGEGNERIA CLINICA E BIOMEDICA.
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a LA STATISTICA INFERENZIALE
STATISTICA a.a VARIABILITA’ BIOLOGICA E CASO
Analisi della varianza
Regressione Logistica
Da Soliani L., Statistica applicata alla ricerca biologica e ambientale, UNI. NOVA Parma, 2003 QUADRATI LATINI Analizzare contemporaneamente 2 fattori.
Il piano fattoriale a due fattori
L’Analisi della Varianza (o ANOVA)
Le distribuzioni campionarie
Attivazione dei recettori
TRATTAMENTO DEI DATI ANALITICI
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
Anova a due fattori Esempio di piano fattoriale: il caso della progettazione robusta di batterie Tipo di Materiale Temperatura (°F)
PROPAGAZIONE DEGLI ERRORI:
Esame di Analisi Multivariata dei Dati
La verifica d’ipotesi Docente Dott. Nappo Daniela
Lezione B.10 Regressione e inferenza: il modello lineare
IL CAMPIONE.
L’analisi della varianza
Corso di Laurea in Scienze e tecniche psicologiche
Probabilità. Un percorso didattico esperimenti e simulazioni L. Cappello 9 Maggio Didattica probabilità e statistica PAS 2014.
Test basati su due campioni Test Chi - quadro
Analisi discriminante lineare - contesto
Introduzione ai piani fattoriali
“Teoria e metodi della ricerca sociale e organizzativa”
Elementi di statistica Le cifre significative
Analisi della varianza Resistenza di una fibra sintetica: essa è legata alla percentuale di cotone che potrà però variare tra il 10 e il 40% perché il.
La distribuzione campionaria della media
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Corso di Laurea in Scienze e tecniche psicologiche
ANALISI DELLA VARIANZA (ANOVA)
Test dell’ ANOVA L EZIONI III PARTE F ONDAMENTI E METODI PER L ’ ANALISI EMPIRICA NELLE SCIENZE SOCIALI A. A
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
4. Controllo Giulio Vidotto Raffaele Cioffi. Indice: 4.1 Strategie generali 4.2 Strategie specifiche 4.3 Ripetizione 4.4 Metodi per aumentare la validità.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
10 Quasi esperimenti Giulio Vidotto Raffaele Cioffi.
INTRODUZIONE ALL’ANALISI DELLA VARIANZA
Probabilità Definizione di probabilità La definizione di probabilità si basa sul concetto di evento, ovvero sul fatto che un determinato esperimento può.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Il percorso delle discipline scientifiche ۷ Descrizione dei fenomeni ۷ Scoperta di leggi ۷ Costruzione di teorie ۷ Formulazione e test di ipotesi.
Transcript della presentazione:

ANALISI della VARIANZA FATTORIALE Impostazione: E’ conosciuto: L’analisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo schema a blocchi randomizzati. L’argomento non è mai stato trattato in precedenti corsi

ARGOMENTI TRATTATI Vantaggi e svantaggi dell’impostazione fattoriale. Concetto di interazione tra fattori. Impianto in campo dell’esperimento. Randomizzazione completa. Blocchi randomizzati. Esecuzione dei calcoli. Interpretazione dei risultati. Analisi grafica dell’interazione Modelli: a effetti fissi, casuali e misto. Contrasti in un esperimento fattoriale. Confronti multipli in un esperimento fattoriale. Esperimenti fattoriali sbilanciati (cenni). Software disponibile.

ANALISI della VARIANZA FATTORIALE VANTAGGI Si può studiare contemporaneamente l’effetto di 2 (o più) fattori. Si può identificare l’interazione tra fattori maggiore potenza SVANTAGGI difficoltà con esperimenti sbilanciati difficile interpretazione (se i fattori sono più di 2) > complessità calcoli (trascurabile) Da preferire per esperimenti idonei all’identificazione dell’effetto di specifici trattamenti, meno idonea all’analisi di sistemi reali

Tra 2 (o più) fattori applicati contemporaneamente può esservi: L’INTERAZIONE Tra 2 (o più) fattori applicati contemporaneamente può esservi: I fattori esercitano il loro effetto senza variazioni dovute al livello degli altri fattori (comportamento additivo) indifferenza sinergismo antagonismo La presenza contemporanea di determinati livelli dei fattori migliora il risultato rispetto alla semplice additività La presenza contemporanea di determinati livelli dei fattori peggiora il risultato rispetto alla semplice additività Comportamenti sinergici o antagonistici indicano INTERAZIONE tra i fattori

L’interazione Assenza di interazione: i segmenti sono paralleli Presenza di interazione: i segmenti NON sono paralleli, l’effetto di un fattore dipende dal livello dell’altro

Principali applicazioni E’ uno degli strumenti statistici più usati Analisi dei rapporti genotipo-ambiente cultivar x tecnica colturale interazioni tra fertilizzanti COMLETA!!!

Il MODELLO dell’ANOVA a 2 VIE Yijk=  + i + j + ( )ij + ijk 1 2 1 ( )1,2 ( )2,1 ijk Il valore di un dato (Yijk) è la somma dell’effetto di uno specifico livello del 1° fattore (i) , dello specifico livello del 2° fattore (j ), della loro interazione (( )ij ) e di una componente accidentale (ijk)

Assunzioni Le stesse dell’ANOVA a 1 via: omogeneità delle varianze normalità delle popolazioni indipendenza dei dati Proprie dell’ANOVA a 2 vie i=0 j=0 ()ij=0

L’impianto in campo della prova Occorre innanzitutto determinare tutte le combinazioni possibili tra i livelli dei fattori. Esempio (didattico) con 2 fattori a 2 livelli: Livello 1 Livello 2 N (kg ha-1) 0 100 P2O5 (kg ha-1) 0 60 Le combinazioni sono: N1-P1; N1-P2; N2-P1; N2-P2 Vanno considerate come se fossero singoli trattamenti nell’ANOVA a 1 via Si ipotizzano 3 ripetizioni  12 parcelle, con i trattamenti da attribuirsi, secondo lo schema sperimentale adottato, casualmente

La disposizione in campo Schema a randomizzazione completa N1-P2 N2-P1 N1-P1 N2-P2 Schema a blocchi randomizzati N1-P2 N2-P1 N1-P1 N2-P2 Blocco 1 Blocco 2 Blocco 3

Esecuzione dei calcoli Passo 1: stimare la varianza errore eseguire gli stessi calcoli necessari per l’ANOVA a 1 via, considerando le combinazioni come fossero singoli trattamenti Si ottiene: devianza e varianza dei trattamenti nel loro complesso (utile successivamente) e devianza e varianza errore Passo 2: stimare le varianze degli effetti semplici sia: p il numero di livelli del fattore A q il numero di livelli del fattore B nrip il numero di ripetizioni consideriamo l’esperimento come se vi fosse presente un solo fattore. Quindi si hanno nrip*q unità sperimentali che hanno ricevuto un determinato livello del fattore in esame. Per calcolare la devianza del fattore A è allora sufficiente sostituire ogni dato con la media del livello di A a cui appartiene e calcolare la devianza di tutti i dati così ottenuti: Del tutto analogamente si procede per il fattore b I gradi di libertà sono p-1 e q-1

Esecuzione dei calcoli (segue) Passo 3: stimare la varianza dell’interazione La via più semplice è per sottrazione: Dev. Interazione = Dev. Trattamenti - Dev. A -Dev.B si può anche calcolare indipendentemente (utile per ANOVA a 3 o più vie): 1)Porre ogni dato uguale al valore medio della combinazione a cui appartiene 2) sottrarre a ogni dato i valori medi del livello del fattore al quale si riferisce 3) calcolare la devianza dei dati così ottenuti GL = GL trattamenti - GL A - GL B ovvero (p-1)(q-1); infatti (p-1)*(q-1) = pq - p - q + 1 pq = GL trattamenti +1 GL int = GL trattamenti +1 -p - q + 1

Esecuzione dei calcoli (segue) Passo 4: impostare la tabella dell’ANOVA N.B. Se i fattori a e b sono fissi, il test di tutti gli effetti si fa contro l’errore Passo 5: interpretazione osservare innanzitutto la significatività dell’interazione: se l’effetto interattivo è significativo va considerata solo l’interazione e NON E’ LECITA ALCUNA CONCLUSIONE SUGLI EFFETTI SEMPLICI. Infatti con interazione, l’effetto di un fattore è condizionato dal livello dell’altro.

Esempi Interazione e effetti semplici significativi. Interazione e un effetto semplice significativi. Interazione e effetti semplici significativi. L’interazione Puo’ avere valore pratico trascurabile

Un esempio di calcolo

Un esempio di calcolo (segue)

Un esempio di calcolo (segue)

Un esempio di calcolo (segue) Interpretazione: nonostante una apparente divergenza, i due segmenti sono da considerarsi paralleli in senso statistico, P(Fint) = 0,2 non fornisce evidenze sulla presenza di interazione. L’effetto migliorativo del P e dell’N è significativo

La presenza di fattori casuali Nell’analisi della varianza fattoriale uno più fattori possono essere random: (cioè i trattamenti sono un campione di infiniti possibili trattamenti e non interessa studiarli in quanto tali, ma per identificare se costituiscono una fonte di variabilità significativa) Casi tipici: gli anni per i quali è ripetuta una sperimentazione. Si è interessati non agli specifici anni, ma li si considera come un campione di possibili andamenti meteorologici. Le località, se intese solo come possibili campi in cui si ha una certa coltura e NON come rappresentative di areali. In genetica, variablità delle popolazioni di partenza per ottenere incroci.( risponde alla domanda: ha effetto la variabilità genetica del genitore maschile, di quello femminile o la loro interazione nel determinare il risultato dell’incrocio ?) In agronomia sono frequenti esperimenti con 1 fattore random e altri fattori fissi, poco frequenti quelli con più di 1 fattore random e altri fissi, rarissimi quelli con tutti i fattori random.

Trattamento dei dati in presenza di fattori casuali La presenza di fattori casuali non modifica i calcoli di devianze, varianze e gradi di libertà. Sono diversi invece i test F nel caso di modelli MISTI (cioè con presenza di fattori fissi e casuali assieme) o completamente random. Qui viene data una spiegazione intuitiva della diversa struttura dei test F. Per un approccio matematico formale si rimanda a testi specifici (es. Snedecor e Cochran, 1989). Nel caso di schemi fattoriali a 2 vie non ci hanno difficoltà; nel caso di schemi a più vie non si hanno difficoltà se 1 solo fattore è random. I package di calcolo statistico hanno da non molti anni introdotto il trattamento completo dei fattori random, risolvendo il problema. Occorre però riconoscere un fattore random in quanto tale. In generale, in presenza di un fattore random nella stima della varianza di un effetto relativo a un fattore fisso è sempre compresa una quota di varianza attribuibile al fattore casuale: infatti la stima degli i è fatta in funzione di j soggetti a variazione campionaria. Nella stima della varianza di un fattore random non è invece compresa una quota di varianza legata al fattore fisso (gli i sono sempre gli stessi). L’interazione tra un fattore fisso e uno random, essendo attesi effetti diversi se l’esperimento viene ripetuto.

Trattamento dei dati in presenza di fattori casuali (segue) Si può dimostrare che se il fattore a è fisso e b random: E[var(a)] = 2 + nrip 2 +nrip * q 2/(p-1) E[var(b)] = 2 + nrip*p 2 E[var(a x b)] = 2 + nrip 2 E[var(a x b)] = 2 Ne consegue che il test corretto per l’effetto fisso è contro l’interazione, per il fattore random e l’interazione contro l’errore. In presenza di 1 solo fattore random, ogni effetto fisso deve essere testato contro la sua interazione con il fattore random, i fattori random e le interazioni tra un fattore fisso e uno random contro l’errore. Intuitivamente, in presenza di fattori casuali, per dichiarare un effetto fisso significativo, non ci basta che il suo effetto sia superiore a quello della variabilità sperimentale, occorre che sia anche “maggiore” della variabilità indotta dal fattore casuale affinché il suo effetto sia “apprezzabile” anche in presenza di altri valori del fattore casuale. Da questo ne consegue che il test corretto è contro la sua interazione con il fattore casuale, che comprende, oltre a una quota dovuta alla variabilità accidentale (come ogni varianza stimata), anche una quota di interazione tra il fattore fisso e quello random.

Altri tipi di analisi della varianza fattoriale Esperimenti senza ripetizioni in caso di esperimenti fattoriali un esperimento si può impostare senza repliche, assumendo a priori che NON VI SIA INTERAZIONE. Se l’interazione è nulla, allora la varianza dell’interazione stima la varianza errore e può essere usata per calcolare i rapporti F relativi agli effetti semplici. Questa impostazione è però in linea di massima sconsigliabile, essendo uno degli scopi primari dell’ANOVA fattoriale proprio l’analisi dell’interazione. Per il calcolo occorre calcolare le devianze degli effetti semplici e, per sottrazione dalla devianza totale, la devianza errore. Approccio gerarchico In alcuni casi non è possibile un approccio fattoriale pieno: i livelli di un fattore sono diversi a secondo dei livelli dell’altro: Farlo meglio se questa è la lezione