Corso di biomatematica lezione 9: test di Student

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Le distribuzioni di probabilità continue
I TEST DI SIGNIFICATIVITA' IL TEST DI STUDENT
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
Come organizzare i dati per un'analisi statistica al computer?
LA VARIABILITA’ IV lezione di Statistica Medica.
METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI
Intervalli di confidenza
Confronto tra 2 campioni Nella pratica è utilissimo confrontare se 2 campioni provengono da popolazioni con la stessa media: Confronti tra produzioni di.
Analisi dei dati per i disegni ad un fattore
ANALISI DELLA COVARIANZA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Inferenza statistica per un singolo campione
Valutazione delle ipotesi
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
DALL'INTERVALLO DI PROBABILITÀ
DIFFERENZA TRA LE MEDIE
Analisi della varianza (a una via)
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 5: propagazione degli errori
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 4: La funzione di Gauss
Corso di biomatematica lezione 6: la funzione c2
Corso di biomatematica lezione 7-2: Test di significatività
Corso di biomatematica lezione 7: Test di significatività
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a LA STATISTICA INFERENZIALE
di cosa si occupa la statistica inferenziale?
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
Lezione 8 La valutazione dello scarto per “fuori tolleranza”
Linee guida per la Chimica Analitica Statistica chemiometrica
Corso di biomatematica lezione 3b: applicazioni di probabilità Davide Grandi.
Confronto fra 2 popolazioni
Il test di ipotesi Cuore della statistica inferenziale!
Verifica delle ipotesi su due campioni di osservazioni
Esercitazioni sul calcolo dei valori critici
Le distribuzioni campionarie
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
STATISTICA CHEMIOMETRICA
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Corso di biomatematica lezione 7-3: Test di significatività
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. SIGNIFICATIVITÀ.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
“Teoria e metodi della ricerca sociale e organizzativa”
Intervalli di confidenza
Elaborazione statistica di dati
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
TRATTAMENTO STATISTICO DEI DATI ANALITICI
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Statistica di Base per le Scienze Pediatriche luigi greco D.C.H, M.D., M.Sc.M.C.H., Ph.D. Dipartimento di Pediatria UniFEDERICOII.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Introduzione all’inferenza
Transcript della presentazione:

Corso di biomatematica lezione 9: test di Student Silvia Capelli

Sommario Distribuzione di Student Media osservata e attesa Medie di due campioni Test F

t di Student La distribuzione t di Student Abbiamo già incontrato la distribuzione t di Student come distribuzione campionaria diversa dalla distribuzione normale Z ed espressa dalla formula Vedremo ora come questa distribuzione, che tiene conto oltre che della variazione della media di un campionamento, anche derlla variazione della deviazione standard, e possa essere applicata a piccoli campioni anche con meno di una decina di osservazioni Silvia Capelli - Dottorato in Biologia

t di Student La distribuzione t di Student La forma della distribuzione t di Student è a campana con una dispersione maggiore rispetto alla gaussiana standardizzata, ed esiste un’intera gfamiglia di distribuzioni t in funzione dei gradi di libertà (la distribuzione normale rapresenta una t quando i g.d.l. aumentano…). Valori critici: per l’area in una coda alla probabilità a coinicidono con quelli a probabilità 2a nella distribuzione a due code e viceversa. Con il t di student calcolerò un intervallo fiduciale! Silvia Capelli - Dottorato in Biologia

t di Student La distribuzione t di Student Condizioni di validità: Distribuzione di dati normale Osservazioni indipendenti La t di Student è robusta, ovvero vale anche per una serie di dati che devia dalla normalità.. Applicazioni per il confronto tra: Media campione e media universo Singolo dato e media di un campione Media delle differenze di due campioni dipendenti con differenza attesa Media di due campioni indipendenti Silvia Capelli - Dottorato in Biologia

t di Student Media osservava e media attesa La t di Student con n-1 g.d.l. è data da Con m valore atteso e errore standard, n numero di dati e s la deviazione standard calcolata sui dati del ampione. Silvia Capelli - Dottorato in Biologia

t di Student Media osservava e media attesa -ipotesi Per verificare l’ipotesi relativa alla media nel caso di un test bilaterale avremo: Ipotesi alternativa H1 :m  m0 Ipotesi nulla H0 :m = m0 Mentre nel caso di un test unilaterale l’ipotesi relativa alla media nel caso di un test bilaterale avremo: Ipotesi alternativa H1 :m < (>) m0 Ipotesi nulla H0 :m  () m0 Per verificare se la media è significativamente inferiore a quella attesa Silvia Capelli - Dottorato in Biologia

t di Student Media osservava e media attesa -ipotesi Quindi dalla formula per la differenza tra media attesa e campionaria avremo E da questo posso stimare l’intervallo fiduciale (o intervallo di confidenza) entro il quale è compresa la media reale della popolazione da cui ho estratto il campione (prob a/2). Silvia Capelli - Dottorato in Biologia

t di Student Media osservava e media attesa - esempio Abbiamo un vivaio con pianticelle di tipo A, che dopo due mesi raggiungono un’altezza media di 25 cm (m0), nel terreno vengono versate sostanze tossiche e per verificare l’incidenza negativa sulla crescita delle piante ne vengono seminate 7 che dopo 2 mesi raggiungono le altezze di 22,25, 21,23,24,25,21 cm Voglio sapere: Le sostanze tossiche inibiscono la crescita? Qual è la media reale dell’altezza delle piante nel nuovo terreno? Silvia Capelli - Dottorato in Biologia

t di Student Media osservava e media attesa - esempio Le sostanze tossiche inibiscono la crescita? Questo è un test ad una coda con Ipotesi alternativa H1 :m < m0 Ipotesi nulla H0 :m  m0 Il test ovviamente assume significato solo se la media campionaria assume valore minore della media attesa m0, e serve per verificare se la differenza sia casuale o significativa Scegliamo una probabilità a =0,05 Silvia Capelli - Dottorato in Biologia

t di Student Media osservava e media attesa - esempio Avremo dunque la formula Con i nostri 7 dati abbiamo X =23,0 s =1,732 t0,025;6 =2,447 n=7 m0=25 Silvia Capelli - Dottorato in Biologia

t di Student Media osservava e media attesa - esempio Ed il calcolo di t con 6 g.d.l. mi dà Cioè t(6) =-3,053 Dove il segno meno indica solamente che la differenza è negativa rispetto al valore atteso. Per la significatività prendo il modulo. Per il test ad una coda abbiamo con a =0,05 t0,05;6 =1,943 Accetto dunque H1 e rifiuto H0 con il 5% di prob. di errore Silvia Capelli - Dottorato in Biologia

t di Student Media osservava e media attesa - esempio Qual è la media reale dell’altezza delle piante nel nuovo terreno? L’altezza media reale può essere stimata tramite l’intervallo di confidenza, ovvero Prendendo i dati del nostro campione con la probabilità associata ad a =0,05 per un test a due code t0,025;6 =2,447 Cioè l1= 21,398 e l2= 24,602 Silvia Capelli - Dottorato in Biologia

t di Student Media osservava e media attesa una o due code? Resta da sottolineare che se voglio solamente evidenziare una differenza tra due medie (di cui una attesa) dovrò effettuare un test a due code (come nel caso precedente in cui ad esempio voglio considerare che le piante subiscono una mutazione ma non so se le piante saranno più alte o più basse a priori..) Invece una volta che si vada a stimare un intervallo fiduciale posso effettuare un test a due code (ovvero andro’ a leggere I corrisponenti valori nelle tabelle di test bilaterale), con probabilità ad esempio a =0,01 oppure un test ad una coda (tabelle unilaterali) con probabilità a =0,005 (a/2) Silvia Capelli - Dottorato in Biologia

t di Student Confronto una misura e media di un campione Voglio ora stabilire se una misura (per ragioni non note) si possa considerare errata. Questo può essere effettuatro con un test unilaterale o bilaterale a seconda delle ipotesi mediante la formula: Con nA numero di oservazioni del campione, x1 misura da verificare, xA,media del campione s2A misura varianza del campione A Silvia Capelli - Dottorato in Biologia

t di Student Confronto una misura e media di un campione Ad esempio voglio “rigettare” una misura (x1 =49,7) nel campione A=(40,3 - 38,8 – 33,5 – 38,6 – 31,9 – 37,6) Dove nA =6, xA= 36,873, s2A=12,206, ottenendo Ora dalle tabelle per il test bilaterale abbiamo i valori critici 2,571 per a =0,05 4,032 per a =0,01 Mentre il test unilaterale dà 3,365 per a =0,01 5,893 per a =0,001 Rifuto l’ipotesi nulla con a tra 0,05 e 0,01 (0,01 e 0,001 uni) Silvia Capelli - Dottorato in Biologia

t di Student Confronto le medie di due campioni Posso derivare la distribuzione t di Student dal rapporto tra la differenza delle due medie campionarie ed il suo errore standard, ovvero Dove nell’ipotesi nulla H0 le due medie sono identiche, Ovvero m1 = m2 oppure m1 - m2 =0 Silvia Capelli - Dottorato in Biologia

t di Student Confronto le medie di due campioni DIPENDENTI Se ho due campioni dipendenti, posso accoppiare ogni osservazione di un campione con UNA ed UNA SOLA osservazione dell’altro (senza entrare nello specifico dell’appaiamento). L’analisi dunque è applicata ad una nuova serie di dati, risultanti dalle differenze tra gli elementi di ciascuna coppia. Per il test di Student bilaterale, abbiamo H0 : d =0 mentre H1 : d  0 Il test unilaterale invece è H0 : d < (>) 0 mentre H1 : d  () 0 Silvia Capelli - Dottorato in Biologia

t di Student Confronto le medie di due campioni DIPENDENTI La significatività della media delle differenze viene verificata con: Dove dm è la media delle differenze, è la media attesa (spesso ma non sempre 0), n è il numero di differenze e sd è la deviazione standard delle differenze. L’intervallo di confidenza entro cui è compresa la media reale d è Silvia Capelli - Dottorato in Biologia

t di Student Confronto le medie di due campioni INDIPENDENTI In questo caso aumenta la variabilità tra I due gruppi, ovvero potrò Utilizzare numero diverso di osservazioni Avere dati che sono variabili casualmente Confrontare il proprio campione con quello raccolto da altri Nel caso di due campioni indipendenti i calcoli per il test di significatività vengono effettuati sulle due serie di osservazioni Silvia Capelli - Dottorato in Biologia

t di Student Confronto le medie di due campioni INDIPENDENTI Nel caso di un test bilaterale l’ipotesi nulla H0 è che i due campioni A e B siano estratti dalla stessa popolazione o da due popolazioni diverse ma con media m uguale le due medie sono identiche, ovvero mA = mB oppure mA - mB =0 L’ipotesi alternativa H1 sarà mA  mB oppure mA - mB  0 Mentre nel test unilaterale avremo H0 mA  () mB oppure mA - mB  () 0 H1 mA < (>) mB oppure mA - mB <(>) 0 Silvia Capelli - Dottorato in Biologia

t di Student Confronto le medie di due campioni INDIPENDENTI Per due campioni indipendenti i gradi di libertà di t sono dati da (nA-1) + (nB-1) =(nA+ nB-2) =(N-2) Il valore di t è ottenuto così: Con xAe xB medie dei due campioni, mA+ mb medie attese nAe nB numero di osservazioni e s2p è la varianza pooled Silvia Capelli - Dottorato in Biologia

t di Student Confronto le medie di due campioni INDIPENDENTI s2p la varianza pooled è in pratica una varianza media ponderata calcolata a partire dalle due devianze e dai loro g.d.l. ed è data dalla formula: Questo test si può quindi applicare anche ai risultati di due ricercatori diversi (che saranno ora A e B), al patto di disporre dei dati, delle rispettive varianze, e delle medie Silvia Capelli - Dottorato in Biologia

t di Student Validità del t-di Student Le assunzioni per la validità del test di Student sono essenzialmente tre: Indipendenza dei dati entro i campioni Omogeneità della varianza Dati (o scarti rispetto alla media) distribuiti normalmente E’ importante soprattutto che le varianze dei due campioni siano statisticamente uguali. Infatti la varianza pooled s2p che è una quantità fondamentale ha significato solo se è rappresentativa delle varianze di ogni gruppo. Silvia Capelli - Dottorato in Biologia

t di Student Validità del t-di Student Per applicare il test t , la cosiddetta omoschedasticitrà tra due gruppi A e B è verificata con un test bilaterale, dove làipotesi nulla e l’ipotesi alternativa sono: H0 s2A = s2B e H1 s2A  s2B Esistono vari test per verificare quella che si chiama omoschedasticità bilaterale o unilaterale, in particolare accenneremo solo al test F bilaterale Silvia Capelli - Dottorato in Biologia

t di Student Validità del t-di Student: test F Il test F bilaterale è fondato sul rapporto tra la varianza campionaria (s2) maggiore e quella minore: Dove s21 è la varianza maggiore e s22 è quella minore (e ovviamente i rispettivi numeri di dati). Una volta calcolato il rapporto (che non sarà mai 1) lo si confronta con una tabella di distribuzione F relativa ai due g.d.l. (di solito entro a =0,05) Silvia Capelli - Dottorato in Biologia