per Laurea Specialistica e Dottorandi in ricerca

Slides:



Advertisements
Presentazioni simili
ANALISI della VARIANZA FATTORIALE
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Come organizzare i dati per un'analisi statistica al computer?
Alcuni aspetti chiave e preliminari:
Proprietà degli stimatori
Lo schema a Split-Plot Lo schema a split plot si usa quando:
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Presupposti alla lezione
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Lez. 3 - Gli Indici di VARIABILITA’
ERRORI L'errore è presente in ogni metodo analitico e può essere dovuto a cause diverse. L’errore può essere definito come la differenza tra il valore.
Progetto Pilota 2 Lettura e interpretazione dei risultati
Valutazione delle ipotesi
LA PROPAGAZIONE DEGLI ERRORI:
Analisi della varianza (a una via)
Matematica e statistica Versione didascalica: parte 8 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 9: test di Student
CORSO DI MODELLI DI SISTEMI BIOLOGICI LAUREA IN INGEGNERIA CLINICA E BIOMEDICA.
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
di cosa si occupa la statistica inferenziale?
Cenni di teoria degli errori
Complementi al Corso di Ecologia - Approfondimenti di statistica
Linee guida per la Chimica Analitica Statistica chemiometrica
Presa DATI e analisi dati esperimento pendolo
Propagazione degli errori
Analisi della varianza
Il test di ipotesi Cuore della statistica inferenziale!
Quale valore dobbiamo assumere come misura di una grandezza?
Da Soliani L., Statistica applicata alla ricerca biologica e ambientale, UNI. NOVA Parma, 2003 QUADRATI LATINI Analizzare contemporaneamente 2 fattori.
Grandezze e Misure.
Le distribuzioni campionarie
La ricerca delle relazioni tra fenomeni
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
Tutte le grandezze fisiche si dividono in
TRATTAMENTO DEI DATI ANALITICI
Introduzione alla Regressione Lineare e alla Correlazione.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Sintesi della lezione Il concetto di variabilità Campo di variazione Differenza interquartile La varianza La deviazione standard Scostamenti medi VARIABILITA’
Le misure sono osservazioni quantitative
Gli indici di dispersione
La verifica d’ipotesi Docente Dott. Nappo Daniela
Lezione B.10 Regressione e inferenza: il modello lineare
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
Il residuo nella predizione
Corso di Laurea in Scienze e tecniche psicologiche
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
ESPERIMENTO DI RÜCHARDT
Elementi di statistica Le cifre significative
Intervalli di confidenza
TRATTAMENTO STATISTICO DEI DATI ANALITICI
ANALISI DELLA VARIANZA (ANOVA)
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Elementi di statistica e probabilità Misure Meccaniche e Termiche - Università di Cassino 2 Eventi aleatori e deterministici Un evento aleatorio può.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Campionamento.
Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.
Campionamento procedimento attraverso il quale si estrae, da un insieme di unità (popolazione) costituenti l’oggetto delle studio, un numero ridotto di.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
INTRODUZIONE ALL’ANALISI DELLA VARIANZA
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Trattamento dei dati sperimentali
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
Gli Indici di VARIABILITA’
Transcript della presentazione:

per Laurea Specialistica e Dottorandi in ricerca Open Lesson Corso di Statistica per Laurea Specialistica e Dottorandi in ricerca Dimensionamento degli esperimenti Marco Acutis & Roberto Confalonieri

L’impostazione degli esperimenti Come va gestito un esperimento ? Quante ripetizioni occorrono ? Come dimensionare l’unità sperimentale ? Quale schema sperimentale adottare ? Gestire la variabilità spaziale Stretto rapporto tra le risposte a queste domande, nessun punto è affrontabile singolarmete

Criteri generali di gestione di un esperimento Finalizzazione L’esperimento deve rispondere a necessità specifiche esattamente definite. Si deve sapere la ragione per ogni dato che si raccoglie Se dei dati si raccolgono “per prassi” occorre essere consci della ragione della prassi. Occorre un equilibrio tra i costi e i risultati ottenibili. L’esperimento inizia a tavolino !

…A Tavolino Quali differenze tra trattamenti consideriamo “rilevanti” per la nostra indagine ? Con che precisione vogliamo stimare un parametro ? (es coefficiente angolare di una retta) Con che precisione vogliamo stimare una Y incognita data una X ? + Stima della variabilità non controllata Abbiamo gli elementi per calcolare il n. di repliche

…Dal tavolino al campo Avere per ogni unità sperimentale un numero di individui (massa campione) sufficienti. Avere un’estensione spaziale dell’esperimento ridotta per ridurre le disomogeneità e non sommare fattori accidentali agli effetti dei trattamenti che stiamo facendo.

…Criterio per il dimensionamento dell’unità sperimentale ?

Un po’ di letteratura su dimensioni del campione

Prove nazionali varietali (Istituto Sperimentale per la Cerealicoltura (S. Angelo Lodigiano) ...è uno standard? Per quanto riguarda la resa granellare: tutta la parcella esclusi i bordi (1.2 x 5 m circa) Per quanto riguarda biomassa aerea, ecc: 0.5 m lineari per due ripetizioni (CV = 25%)

Per la biomassa aerea suggerisce 20 piante per parcella Gomez, 1972 “Techniques for field experiment with rice: layout, sampling, sources of error” ...è uno standard? In base a numerosi set di dati sperimentali trova delle dimensioni del campione (numero di piante) diverse a seconda della variabile che si vuole misurare. Questo perché i metodi per misurare le diverse variabili hanno diversa accuratezza. Per la biomassa aerea suggerisce 20 piante per parcella

Determinazione della biomassa aerea Esempi da letteratura riguardanti metodi alternativi per la determinazione delle dimensioni del campione Wolkowski et al., 1988 Determinazione della biomassa aerea Raccoglie tutte le piante su una fila e ne pesa 1, 5, 10, 15, 20, 25, tutte (estrazione random) Calcola il coefficiente di variazione Guarda quando il CV è più basso (CV più basso = 14%)

La varianza a volte è correlata con la media (non c’è omoscedasticità) Esempi da letteratura riguardanti metodi alternativi per la determinazione delle dimensioni del campione Tirol Padre et al., 1988 metodo analogo (basato sul CV (CV più basso = 12%)) in prova riguardante attività enzimatica La varianza a volte è correlata con la media (non c’è omoscedasticità) meglio lavorare su media e deviazione standard separate che sul CV!!!

Esempi da letteratura riguardanti metodi alternativi per la determinazione delle dimensioni del campione Yonezawa, 1985 Numero di piante da raccogliere per caratterizzazione genotipica Considera tutte le attività necessarie per giungere al dato finale e lo sforzo richiesto in ogni attività ed elabora matematicamente il tutto Conclude che: 1. campioni di sole 10 piante per ogni località o popolazione sono sufficienti 2. è più importante analizzare un largo numero di località o popolazioni Queste conclusioni potrebbero essere estese a prove parcellari considerando le repliche in campo come località => meglio campione “piccolo” per ogni replica ma tante repliche?

Un approccio grafico derivato dal jackknife per la determinazione delle dimensioni del campione http://agrifish.jrc.it/marsstat/warm/archive.htm

Premessa 1. Spesso le caratteristiche della popolazione (μ e σ) sono sconosciute (variano da situazione a situazione) è impossibile conoscere a priori l’errore che può essere ritenuto accettabile (può essere più o meno grande a seconda del particolare campo sperimentale in esame e della sua storia). In questi casi è meglio analizzare la variazione relativa dell’errore dovuto al campionamento al crescere delle dimensioni del campione all’interno del campo in esame piuttosto che basarsi su criteri assoluti per l’accettazione o meno di un certo errore.

Inoltre 2. Con un numero limitato di osservazioni a disposizione (cosa che si verifica spesso nel caso di metodi lunghi o costosi) può essere un azzardo valutare la normalità (requisito per l’applicazione dei metodi classici per la determinazione delle dimensioni del campione) 3. I metodi classici non prendono in considerazione lo sforzo necessario per ottenere il dato

I metodi di ricampionamento I metodi di ricampionamento si sono molto diffusi a partire dagli anni 60. Concettualmente si basano sui metodi Monte Carlo ma si basano sull’uso ripetuto dell’unico campione disponibile. Molto importanti sono il bootstrap e il jackknife

Il visual jackknife N: numero unità campionarie k: numero di unità campionarie appartenenti ad un gruppo : numero di campioni virtuali (combinazioni senza ripetizione) di N-k elementi generati eliminando volte k valori :numero totale di campioni virtuali generati

Il visual jackknife Calcolare, per ogni campione generato di N-k unità campionarie, la media e la deviazione standard Disporre il tutto su due grafici che hanno: in ascissa i valori di N-k (con k da N-2 a 1; ovvero con (N-k) da 2 a (N-1) in ordinata la media e la deviazione standard

Il visual jackknife

Il visual jackknife

Se il campione è piccolo => non generare campioni virtuali è cosa pericolosa Singolo campione 250 campioni generati 140 cm (7 gruppi da 20cm)

..In campo Effetto bordo Uniformità del trattamento Attorno all’appezzamento Entro ogni parcella Uniformità del trattamento I trattamenti comuni all’intero appezzamento sperimentale spesso non sono uniformi Lavorazione del terreno semina Concimazioni Diserbi Trattamenti fitosanitari …….

Come ottenere una stima variabilità non controllata Il presupposto è che non siamo i primi a fare un esperimento con il materiale e nelle condizioni operative che ci interessano Quindi esistono altri esperimenti +/- analoghi Allora una stima della variabilità non controllata è ottenibile dalla bibliografia Che ovviamente avrete letto con la massima attenzione possibile (un ricercatore che non legge e studia NON è un ricercatore) Un ricercatore che non studia è come un muratore che non usa il cemento: fa anche una casa, ma che cade al primo colpo di vento

Come ottenere una stima variabilità non controllata Obbiettivo è ottenere deviazione standard e media La media generale è sempre riportata o facilmente ottenibile Il coefficiente di variazione è riportato in molte prove. Si può ottenere la standard deviation da: Valore della MDS Da anova e contrasti dai confronti multipli (es dal Test di Duncan)

Come ottenere la deviazione standard dalla MDS In genere:

Come ottenere la deviazione standard dall’ANOVA (o dai contrasti) Solo se si conosce il P(F) si può fare il calcolo esatto. Se il livello di significatività è espresso come + e ++ si può solo fare un calcolo approssimato, non sempre utile

Come ottenere la deviazione standard dall’ANOVA (o dai contrasti) Occorre conoscere dell’esperimento da cui vogliamo ottenere l’informazione: Il numero di trattamenti a confronto Il numero di ripetizioni Il valore della media di ogni trattamento Il P(F) o il P(t) nel caso di contrasti Oppure il valore di F, o quello di t nel caso di contrasti Lo schema sperimentale adottato (randomizzazione completa, blocco randomizzato ecc) Non importa se l’esperimento è fattoriale

Come ottenere la deviazione standard dall’ANOVA (o dai contrasti) Un esempio 6 trattamenti a confronto 4 ripetizioni per trattamento Schema a randomizzazione completa P(F)=0.021 Le medie: m1=60; m2=65; m3=70; m4=80; m5=81; m6=84 Ora andiamo all’esempio in excel

Come ottenere la deviazione standard dal test di Duncan Un complicatissimo calcolo approssimato, non sempre utile. Una ragione in più per limitare i confronti post factum quando effettivamente sono da usarsi Non ritengo di spendere 1 ora per farlo qui

Le tavole di Pearson e Hartley Nel caso dell’ANOVA, è possibile dimensionare i singoli gruppi in base a: potenza assegnata al test F differenza minima che si vuole mettere in evidenza Per il calcolo della potenza occorre calcolare il grado di falsità dell’ipotesi nulla: Dove: s2= QM(e) (in esperimenti comparabili o preliminari) p è il numero di gruppi δ0 è la varianza delle medie che dipende dalla differenza minima che si vuole evidenziare n è il n di trattamenti

Le tavole di Pearson e Hartley

Come usare l’abaco dal Dagnelie Lo facciamo in pratica con carta penna e righello….

Come usare l’abaco dal Dagnelie

Usare le utility di Russel Lenth Link locale http://www.stat.uiowa.edu/~rlenth