UNIVERSITA’ DEGLI STUDI DI PERUGIA

Slides:



Advertisements
Presentazioni simili
Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Advertisements

Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI
Passo 1: trasformare tutte le percentuali in frequenze (senza sapere la numerosità sulla quale sono state calcolate, non si può fare il confronto tra %)
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Confronto tra 2 campioni Nella pratica è utilissimo confrontare se 2 campioni provengono da popolazioni con la stessa media: Confronti tra produzioni di.
Il chi quadro indica la misura in cui le
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Analisi dei dati per i disegni ad un fattore
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Corso di Calcolo delle Probabilità e Statistica II Parte – STATISTICA
Inferenza statistica per un singolo campione
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Analisi della varianza (a una via)
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 7: Test di significatività
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a LA STATISTICA INFERENZIALE
Lezioni per Insegnanti mod 4 Prof. Giovanni Raho 1 I metodi della ricerca sociale Corso S. I. S. S Mod. 4.
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Il test di ipotesi Cuore della statistica inferenziale!
Verifica delle ipotesi su due campioni di osservazioni
Regressione Logistica
Un buon latinista è anche un bravo matematico? I.S. Artemisia Gentileschi - NAPOLI Convegno finale Progetto Lauree Scientifiche – Matematica Università
Corso di POPOLAZIONE TERRITORIO E SOCIETA’ 1 AA
Le distribuzioni campionarie
Teorie e Tecniche di Psicometria
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
Test parametrici I test studiati nelle lezioni precedenti (test- t, test-z) consentono la verifica di ipotesi relative al valore di specifici parametri.
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Corso di biomatematica lezione 7-3: Test di significatività
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
La verifica d’ipotesi Docente Dott. Nappo Daniela
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Strumenti statistici in Excell
La statistica F Permette di confrontare due varianze, per stabilire se sono o no uguali. Simile al valore t di Student o al chi quadrato, l’F di Fisher.
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
“Teoria e metodi della ricerca sociale e organizzativa”
Intervalli di confidenza
Accenni di analisi monovariata e bivariata
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
Dalmine, 26 Maggio 2004 Esercitazioni di Statistica con Matlab Dott. Orietta Nicolis fttp:\ingegneria.unibg.it.
ANALISI E INTERPRETAZIONE DATI
Correlazione e regressione lineare
TEST STATISTICI PER SCALE NOMINALI, TASSI E PROPORZIONI Non sempre la variabile aleatoria (risultato sperimentale) è un numero ma è spesso un esito dicotomico.
Accademia europea dei pazienti sull'innovazione terapeutica Lo scopo e i fondamenti della statistica negli studi clinici.
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
DIPENDENZA STATISTICA TRA DUE CARATTERI Per una stessa collettività può essere interessante studiare più caratteri presenti contemporaneamente in ogni.
Accenni di analisi monovariata e bivariata. ANALISI MONOVARIATA Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
1111 Università di Napoli Federico II, Dipartimento di Scienze Economiche e Statistiche S. BalbiI test non parametrici.
L’ecologia è oggi sempre più una disciplina che enfatizza lo studio olistico del sistema. Anche se il concetto che l’intero possa essere più della somma.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Implementazione.
Statistica di Base per le Scienze Pediatriche luigi greco D.C.H, M.D., M.Sc.M.C.H., Ph.D. Dipartimento di Pediatria UniFEDERICOII.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

UNIVERSITA’ DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 02 dicembre 2014

9° LEZIONE

Statistica inferenziale Probabilità Campione Popolazione Statistica inferenziale

Basi dei test statistici

LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE

La verifica di ipotesi Verifica di ipotesi: metodologia per fare inferenza sui parametri della popolazione alla luce dell’analisi delle differenze tra i risultati osservati (statistica campionaria) e quelli che ci aspetteremmo se una qualche ipotesi sulla popolazione fosse vera. La verifica di ipotesi ha inizio con la formulazione del sistema di ipotesi sottoposto a verifica. Il sistema di ipotesi fa sempre riferimento a qualche parametro della popolazione. Consiste sempre in due ipotesi contrapposte.

Test Z per la media (s noto) Per verificare l’ipotesi che la media della popolazione sia uguale ad un certo valore m, contro l’ipotesi alternativa che la media differisca da tale valore, conoscendo s, si ricorre alla statistica Z: X è distribuita come una normale => sotto H0 Z è distribuita come una normale standardizzata Se Z assume valori vicini allo zero siamo portati ad accettare H0, altrimenti si propende per rifiutare H0 (test a due code).

L’approccio del p-value Negli ultimi anni, anche grazie all’ampia diffusione di pacchetti statistici e fogli elettronici, si è affermato un altro approccio alla verifica di ipotesi: l’approccio del p-value. Il p-value è anche chiamato livello di significatività osservato. Regola decisionale: se il p-value è maggiore o uguale ad a, l’ipotesi nulla viene accettata se il p-value è minore di a, l’ipotesi nulla è rifiutata

ANALIZZARE le FREQUENZE

Confronto tra proporzioni Test Chi-quadrato Confronto tra proporzioni

I TESTS del CHI-QUADRATO sono utilizzati per valutare l’omogeneità, la casualità, l’associazione, l’indipendenza e la bontà di adattamento

TABELLE di CONTINGENZA Frequenze di dati nominali raggruppati in categorie sono spesso organizzate in forma di tabella di contingenza. Il caso più semplice implica due variabili casuali dicotomiche; le righe della tabella rappresentano i risultati di una variabile e le colonne i risultati dell'altra, i numeri all'interno della tabella sono le frequenze di una particolare combinazione di categorie.

Test Chi-quadrato per la differenza tra due proporzioni Il problema della verifica di ipotesi sulla differenza tra due proporzioni può essere affrontato anche con una procedura basata su una statistica test la cui distribuzione tende ad approssimarsi con una distribuzione chi-quadrato (χ2). Se siamo interessati a confrontare le proporzioni di casi che presentano una certa caratteristica in due gruppi indipendenti possiamo costruire una tabella a doppia entrata (o di contingenza) di dimensioni 2×2 nella quale sono riportati il numero (o le percentuali) di successi e insuccessi nei due gruppi

I risultati ottenuti nei campioni non sempre concordano esattamente con i risultati teorici attesi secondo le regole di probabilità, anzi, è ben raro che questo si verifichi. considerazioni teoriche ci portino ad attenderci 50 teste e 50 croci da 100 lanci di una moneta, è raro che questi risultati siano ottenuti esattamente, ma nonostante questo non si deve per forza dedurre che la moneta sia truccata. Supponiamo che in un particolare campione si sia osservato che un insieme di possibili eventi E1, E2, …, Ek si presenta con frequenze o1, o2, …, ok dette frequenze osservate, e che, secondo le regole della probabilità, ci si attenda che si presenti con frequenze e1, e2, …, ek dette frequenze teoriche o attese:

Lo scopo del test χ² è quello di conoscere se le frequenze osservate differiscono significativamente dalle frequenze teoriche. χ² = (O-E)2 E χ² = (O-E)2 E

Test Chi‑quadrato per Tabelle 2x2 Si consideri la tabella, che illustra i risultati di uno studio di validità del test da sforzo positivo (ST-2) nel predire eventi cardiovascolari CV nei 5 anni seguenti in soggetti non sintomatici(1). I dati si riferiscono ad un campione casuale di 514 soggetti sani arruolati in uno studio eseguito nel CPA di Milano. SFORZO Esito Negativo ST-2 Totale Eventi CV 13 21 34 Nessuno 366 114 480 379 135 514 CV: (morte improvvisa,infarto mortale, infarto semplice, angina) ST-2:Presenza di anomalie nel tratto ST dell’ECG eseguito sotto sforzo

514 soggetti sono stati arruolati nello studio 135 soggetti hanno avuto esito positivo; 379 soggetti hanno avuto esito negativo; Dei 379 con esito negativo, 13 svilupparono eventi CV e 366 no; Dei 135 con esito positivo, 21 svilupparono eventi CV e 114 no. SFORZO Esito Negativo ST-2 Totale Eventi CV 13 21 34 Nessuno 366 114 480 379 135 514 I numeri all'interno della tabella 13 21 366 e 114 sono le frequenze osservate

IL TEST D'IPOTESI: Scopo: valutare capacità predittiva della risposta ST-2 al test da sforzo H0: la frazione di soggetti ST-2 all’ECG da sforzo che sviluppano eventi CV è uguale alla frazione di soggetti che sviluppano eventi CV essendo NEGATIVI all’ECG da sforzo H1: la frazione di soggetti ST-2 all’ECG da sforzo che sviluppano eventi CV è diversa dalla frazione di soggetti che sviluppano eventi CV essendo NEGATIVI all’ECG da sforzo Il livello di significatività è posto α=0,05

Tra i 135 esiti positivi, ci aspettiamo che gli eventi CV Si calcolano le frequenze attese sotto l’ipotesi nulla H0: La proporzione di soggetti con eventi CV = 34/514 = 6.61% Tra i 135 esiti positivi, ci aspettiamo che gli eventi CV Presenza di eventi CV nel 6.61% dei casi 135 (0.0661) = 8.93 Assenza di eventi CV nel 93.39% dei casi 135 (0.9339)= 126.07 Tra i 379 esiti negativi, ci aspettia-mo Presenza di eventi CV nel 6.61% dei casi 379 (0.0661) = 25.05 Assenza di eventi CV nel93.39% 379 (0.9339) = 353.95

LE FREQUENZE ATTESE SFORZO Esito Negativo ST-2 Totale Eventi CV 34 La frequenza attesa per una della tabella è calcolata dal prodotto dei totali di riga e di colonna diviso dal totale di tabella. SFORZO Esito Negativo ST-2 Totale Eventi CV 379 ( 34/514)= 25.07 13 135 ( 34/514) = 8.93 21 34 Nessuno 379 (480/514)= 353.93 366 135 (480/514) = 126.07 114 480 379 135 514 I conteggi osservati erano 13 21 366 e 114

IL TEST CHI‑QUADRATO Il test chi‑quadrato confronta le frequenze osservate in ciascuna categoria, rappresentate da O, con le frequenze attese sotto l'ipotesi nulla, indicate con E. Il test saggia se le differenze (O‑E) tra frequenze osservate e attese siano troppo grandi perché siano attribuite al caso. Il test controlla le differenze in tutte le celle. Per eseguire il test per una tabella di contingenza con (r) righe e (c) colonne, si calcola la somma: dove rc è il numero di celle nella tabella. La distribuzione di probabilità di questa somma è approssimata una distribuzione chi-quadrato con gradi di libertà (gdl)= (r‑1)(c‑1). Importante calcolare i gradi di libertà

test chi quadrato Si intende uno dei test di verifica d'ipotesi usati in statistica che utilizzano la variabile casuale Chi Quadrato per verificare se l'ipotesi nulla è probabilisticamente compatibile con i dati. A seconda delle ipotesi di partenza usate per costruire il test, tali test vengono considerati a volte parametrici e altre volte non parametrici

Affinché si possa utilizzare il chi quadro e' indispensabile: che i dati siano indipendenti, cioe' nessun soggetto puo' apparire in piu' di una cella della tabella; che non piu' del 20 % delle frequenze attese nella tabella puo' essere < 5 (altrimenti si deve usare il test esatto di Fisher); nessuna cella deve avere una frequenza attesa < 1 (altrimenti si deve usare il test esatto di Fisher). Non c’è alcuna ipotesi di normalità sulla distribuzione della popolazione di provenienza del campione. Per questo fa parte della famiglia dei test non parametrici