La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Corso di biomatematica lezione 9: test di Student Silvia Capelli.

Presentazioni simili


Presentazione sul tema: "Corso di biomatematica lezione 9: test di Student Silvia Capelli."— Transcript della presentazione:

1 Corso di biomatematica lezione 9: test di Student Silvia Capelli

2 Sommario Distribuzione di Student Media osservata e attesa Medie di due campioni Test F

3 t di Student Silvia Capelli - Dottorato in Biologia La distribuzione t di StudentLa distribuzione t di Student Abbiamo già incontrato la distribuzione t di Student come distribuzione campionaria diversa dalla distribuzione normale Z ed espressa dalla formula Vedremo ora come questa distribuzione, che tiene conto oltre che della variazione della media di un campionamento, anche derlla variazione della deviazione standard, e possa essere applicata a piccoli campioni anche con meno di una decina di osservazioni

4 t di Student Silvia Capelli - Dottorato in Biologia La distribuzione t di StudentLa distribuzione t di Student La forma della distribuzione t di Student è a campana con una dispersione maggiore rispetto alla gaussiana standardizzata, ed esiste unintera gfamiglia di distribuzioni t in funzione dei gradi di libertà (la distribuzione normale rapresenta una t quando i g.d.l. aumentano…). Valori critici: per larea in una coda alla probabilità coinicidono con quelli a probabilità 2 nella distribuzione a due code e viceversa. Con il t di student calcolerò un intervallo fiduciale!

5 t di Student Silvia Capelli - Dottorato in Biologia La distribuzione t di StudentLa distribuzione t di Student Condizioni di validità: 1.Distribuzione di dati normale 2.Osservazioni indipendenti La t di Student è robusta, ovvero vale anche per una serie di dati che devia dalla normalità.. Applicazioni per il confronto tra: 1.Media campione e media universo 2.Singolo dato e media di un campione 3.Media delle differenze di due campioni dipendenti con differenza attesa 4.Media di due campioni indipendenti

6 t di Student Silvia Capelli - Dottorato in Biologia Media osservava e media attesaMedia osservava e media attesa La t di Student con n-1 g.d.l. è data da Con valore atteso e errore standard, n numero di dati e la deviazione standard calcolata sui dati del ampione.

7 t di Student Silvia Capelli - Dottorato in Biologia Media osservava e media attesa -ipotesiMedia osservava e media attesa -ipotesi Per verificare lipotesi relativa alla media nel caso di un test bilaterale avremo: Ipotesi alternativa H 1 : 0 Ipotesi nulla H 0 : = 0 Mentre nel caso di un test unilaterale lipotesi relativa alla media nel caso di un test bilaterale avremo: Ipotesi alternativa H 1 : ) 0 Ipotesi nulla H 0 : ( ) 0 Per verificare se la media è significativamente inferiore a quella attesa

8 t di Student Silvia Capelli - Dottorato in Biologia Media osservava e media attesa -ipotesiMedia osservava e media attesa -ipotesi Quindi dalla formula per la differenza tra media attesa e campionaria avremo E da questo posso stimare lintervallo fiduciale (o intervallo di confidenza) entro il quale è compresa la media reale della popolazione da cui ho estratto il campione (prob /2).

9 t di Student Silvia Capelli - Dottorato in Biologia Media osservava e media attesa - esempioMedia osservava e media attesa - esempio Abbiamo un vivaio con pianticelle di tipo A, che dopo due mesi raggiungono unaltezza media di 25 cm ( 0 ), nel terreno vengono versate sostanze tossiche e per verificare lincidenza negativa sulla crescita delle piante ne vengono seminate 7 che dopo 2 mesi raggiungono le altezze di 22,25, 21,23,24,25,21 cm Voglio sapere: 1.Le sostanze tossiche inibiscono la crescita? 2.Qual è la media reale dellaltezza delle piante nel nuovo terreno?

10 t di Student Silvia Capelli - Dottorato in Biologia Media osservava e media attesa - esempioMedia osservava e media attesa - esempio Le sostanze tossiche inibiscono la crescita? Questo è un test ad una coda con 1.Ipotesi alternativa H 1 : < 0 2.Ipotesi nulla H 0 : 0 Il test ovviamente assume significato solo se la media campionaria assume valore minore della media attesa 0, e serve per verificare se la differenza sia casuale o significativa Scegliamo una probabilità =0,05

11 t di Student Silvia Capelli - Dottorato in Biologia Media osservava e media attesa - esempioMedia osservava e media attesa - esempio Avremo dunque la formula Con i nostri 7 dati abbiamo X =23,0 =1,732 t 0,025;6 =2,447 n=7 0 =25

12 t di Student Silvia Capelli - Dottorato in Biologia Media osservava e media attesa - esempioMedia osservava e media attesa - esempio Ed il calcolo di t con 6 g.d.l. mi dà Cioè t (6) =-3,053 Dove il segno meno indica solamente che la differenza è negativa rispetto al valore atteso. Per la significatività prendo il modulo. Per il test ad una coda abbiamo con =0,05 t 0,05;6 =1,943 Accetto dunque H 1 e rifiuto H 0 con il 5% di prob. di errore

13 t di Student Silvia Capelli - Dottorato in Biologia Media osservava e media attesa - esempioMedia osservava e media attesa - esempio Qual è la media reale dellaltezza delle piante nel nuovo terreno? Laltezza media reale può essere stimata tramite lintervallo di confidenza, ovvero Prendendo i dati del nostro campione con la probabilità associata ad =0,05 per un test a due code t 0,025;6 =2,447 Cioè l 1 = 21,398 e l 2 = 24,602

14 t di Student Silvia Capelli - Dottorato in Biologia Media osservava e media attesa una o due code?Media osservava e media attesa una o due code? Resta da sottolineare che se voglio solamente evidenziare una differenza tra due medie (di cui una attesa) dovrò effettuare un test a due code (come nel caso precedente in cui ad esempio voglio considerare che le piante subiscono una mutazione ma non so se le piante saranno più alte o più basse a priori..) Invece una volta che si vada a stimare un intervallo fiduciale posso effettuare un test a due code (ovvero andro a leggere I corrisponenti valori nelle tabelle di test bilaterale), con probabilità ad esempio =0,01 oppure un test ad una coda (tabelle unilaterali) con probabilità =0,005 (

15 t di Student Silvia Capelli - Dottorato in Biologia Confronto una misura e media di un campioneConfronto una misura e media di un campione Voglio ora stabilire se una misura (per ragioni non note) si possa considerare errata. Questo può essere effettuatro con un test unilaterale o bilaterale a seconda delle ipotesi mediante la formula: Con n A numero di oservazioni del campione, x 1 misura da verificare, x A,media del campione A misura varianza del campione A

16 t di Student Silvia Capelli - Dottorato in Biologia Confronto una misura e media di un campioneConfronto una misura e media di un campione Ad esempio voglio rigettare una misura (x 1 =49,7) nel campione A=(40,3 - 38,8 – 33,5 – 38,6 – 31,9 – 37,6) Dove n A =6, x A = 36,873, A =12,206, ottenendo Ora dalle tabelle per il test bilaterale abbiamo i valori critici 2,571 per =0,05 4,032 per =0,01 Mentre il test unilaterale dà 3,365 per =0,01 5,893 per =0,001 Rifuto lipotesi nulla con tra 0,05 e 0,01 (0,01 e 0,001 uni)

17 t di Student Silvia Capelli - Dottorato in Biologia Confronto le medie di due campioniConfronto le medie di due campioni Posso derivare la distribuzione t di Student dal rapporto tra la differenza delle due medie campionarie ed il suo errore standard, ovvero Dove nellipotesi nulla H 0 le due medie sono identiche, Ovvero 1 = 2 oppure =0

18 t di Student Silvia Capelli - Dottorato in Biologia Confronto le medie di due campioni DIPENDENTIConfronto le medie di due campioni DIPENDENTI Se ho due campioni dipendenti, posso accoppiare ogni osservazione di un campione con UNA ed UNA SOLA osservazione dellaltro (senza entrare nello specifico dellappaiamento). Lanalisi dunque è applicata ad una nuova serie di dati, risultanti dalle differenze tra gli elementi di ciascuna coppia. Per il test di Student bilaterale, abbiamo H 0 =0 mentre H 1 0 Il test unilaterale invece è H 0 ) 0 mentre H 1 ( ) 0

19 t di Student Silvia Capelli - Dottorato in Biologia Confronto le medie di due campioni DIPENDENTIConfronto le medie di due campioni DIPENDENTI La significatività della media delle differenze viene verificata con: Dove d m è la media delle differenze, è la media attesa (spesso ma non sempre 0), n è il numero di differenze e d è la deviazione standard delle differenze. Lintervallo di confidenza entro cui è compresa la media reale è

20 t di Student Silvia Capelli - Dottorato in Biologia Confronto le medie di due campioni INDIPENDENTIConfronto le medie di due campioni INDIPENDENTI In questo caso aumenta la variabilità tra I due gruppi, ovvero potrò 1.Utilizzare numero diverso di osservazioni 2.Avere dati che sono variabili casualmente 3.Confrontare il proprio campione con quello raccolto da altri Nel caso di due campioni indipendenti i calcoli per il test di significatività vengono effettuati sulle due serie di osservazioni

21 t di Student Silvia Capelli - Dottorato in Biologia Confronto le medie di due campioni INDIPENDENTIConfronto le medie di due campioni INDIPENDENTI Nel caso di un test bilaterale lipotesi nulla H 0 è che i due campioni A e B siano estratti dalla stessa popolazione o da due popolazioni diverse ma con media uguale le due medie sono identiche, ovvero A = B oppure A - B =0 Lipotesi alternativa H 1 sarà A B oppure A - B 0 Mentre nel test unilaterale avremo H 0 A ( ) B oppure A - B ( ) 0 H 1 A ) B oppure A - B ) 0

22 t di Student Silvia Capelli - Dottorato in Biologia Confronto le medie di due campioni INDIPENDENTIConfronto le medie di due campioni INDIPENDENTI Per due campioni indipendenti i gradi di libertà di t sono dati da (n A -1) + (n B -1) =(n A + n B -2) =(N-2) Il valore di t è ottenuto così: Con x A e x B medie dei due campioni, A + b medie attese n A e n B numero di osservazioni e p è la varianza pooled

23 t di Student Silvia Capelli - Dottorato in Biologia Confronto le medie di due campioni INDIPENDENTIConfronto le medie di due campioni INDIPENDENTI p la varianza pooled è in pratica una varianza media ponderata calcolata a partire dalle due devianze e dai loro g.d.l. ed è data dalla formula: Questo test si può quindi applicare anche ai risultati di due ricercatori diversi (che saranno ora A e B), al patto di disporre dei dati, delle rispettive varianze, e delle medie

24 t di Student Silvia Capelli - Dottorato in Biologia Validità del t-di StudentValidità del t-di Student Le assunzioni per la validità del test di Student sono essenzialmente tre: 1.Indipendenza dei dati entro i campioni 2.Omogeneità della varianza 3.Dati (o scarti rispetto alla media) distribuiti normalmente E importante soprattutto che le varianze dei due campioni siano statisticamente uguali. Infatti la varianza pooled p che è una quantità fondamentale ha significato solo se è rappresentativa delle varianze di ogni gruppo.

25 t di Student Silvia Capelli - Dottorato in Biologia Validità del t-di StudentValidità del t-di Student Per applicare il test t, la cosiddetta omoschedasticitrà tra due gruppi A e B è verificata con un test bilaterale, dove làipotesi nulla e lipotesi alternativa sono: H 0 A = B e H 1 A B Esistono vari test per verificare quella che si chiama omoschedasticità bilaterale o unilaterale, in particolare accenneremo solo al test F bilaterale

26 t di Student Silvia Capelli - Dottorato in Biologia Validità del t-di Student: test FValidità del t-di Student: test F Il test F bilaterale è fondato sul rapporto tra la varianza campionaria ( ) maggiore e quella minore: Dove 1 è la varianza maggiore e 2 è quella minore (e ovviamente i rispettivi numeri di dati). Una volta calcolato il rapporto (che non sarà mai 1) lo si confronta con una tabella di distribuzione F relativa ai due g.d.l. (di solito entro =0,05)


Scaricare ppt "Corso di biomatematica lezione 9: test di Student Silvia Capelli."

Presentazioni simili


Annunci Google