CONFRONTO TRA DUE MEDIE:

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
8) GLI INTERVALLI DI CONFIDENZA
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
I TEST DI SIGNIFICATIVITA' IL TEST DI STUDENT
Alcuni aspetti chiave e preliminari:
Intervalli di confidenza
Proprietà degli stimatori
Cifre significative e arrotondamento Regole per la determinazione il numero delle cifre significative Conteggio delle cifre significative Tutti i valori.
Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento.
Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita.
Analisi dei dati per i disegni ad un fattore
ERRORI L'errore è presente in ogni metodo analitico e può essere dovuto a cause diverse. L’errore può essere definito come la differenza tra il valore.
Definizioni Chiamiamo esperimento aleatorio ogni fenomeno del mondo reale alle cui manifestazioni può essere associata una situazione di incertezza. Esempi:
Progetto Pilota 2 Lettura e interpretazione dei risultati
redditività var. continua classi di redditività ( < 0 ; >= 0)
Distribuzione degli Errori di Misura
Inferenza statistica per un singolo campione
Valutazione delle ipotesi
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
Esercizi x1=m-ts x2=m+ts
intervallo di confidenza e test di significatività per una proporzione
Innanzitutto divertiamoci
DALL'INTERVALLO DI PROBABILITÀ
Esercitazione su test d’ipotesi
ISTOGRAMMI E DISTRIBUZIONI:
DIFFERENZA TRA LE MEDIE
Analisi della varianza (a una via)
1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 9: test di Student
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 4: La funzione di Gauss
Corso di biomatematica lezione 6: la funzione c2
STATISTICA a.a PARAMETRO t DI STUDENT
ISTOGRAMMI E DISTRIBUZIONI : i xixi
Esercizi x1=m-ts x2=m+ts
di cosa si occupa la statistica inferenziale?
Lezione 8 Numerosità del campione
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 7 i Test statistici
Lezione 8 La valutazione dello scarto per “fuori tolleranza”
Lezione 7 i Test statistici
Verifica delle ipotesi su due campioni di osservazioni
Quale valore dobbiamo assumere come misura di una grandezza?
Le distribuzioni campionarie
STATISTICA CHEMIOMETRICA
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Massimo comun divisore
PROPAGAZIONE DEGLI ERRORI:
Gli indici di dispersione
Calcolo letterale.
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
IL CAMPIONE.
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
Intervalli di confidenza
Elementi di statistica La stima del valore vero
Elaborazione statistica di dati
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Introduzione all’inferenza
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

CONFRONTO TRA DUE MEDIE: CAMPIONI INDIPENDENTI

CAMPIONI INDIPENDENTI Esempio: Di due metodi analitici per la determinazione dell'uricemia, l'uno già in uso (V) e l'altro nuovo (N), sono note la forma della distribuzione degli errori (gaussiana) e l'entità della imprecisione ( = 0.3 mg/dl), ma non l'accuratezza. Al fine di valutare quest'ultima, si eseguono su uno stesso "standard" 14 misure con il metodo V, ed altre 14 con il metodo N. A causa della scarsa dimestichezza con l'uso del metodo nuovo, il tecnico di laboratorio è riuscito ad eseguire correttamente il procedimento analitico solo in 12 casi. I risultati sono compendiati come segue: Metodo V: nV = 14 μV  = 5.41 Metodo N: nN = 12 μN = 5.03

Uricemia nuova e vecchia Prefissato un rischio d'errore di I° tipo =0.01, si vuole saggiare se i due metodi hanno il medesimo grado di inaccuratezza. Ciò significa scegliere tra le due ipotesi: H0: N = V =  (le vere medie delle distribuzioni delle misure coincidono per i due metodi) H1 :  N   V (le vere medie delle distribuzioni delle misure differiscono tra i due metodi)

Pertanto il rapporto è una deviata gaussiana standard, poiché il denominatore è l'errore standard del numeratore. Nel nostro esempio, Si può concludere che il metodo V tende a dare misure significativamente più elevate rispetto al metodo N

L'intervallo di confidenza contiene lo zero ? Se il fine è quello di stimare quanto i due metodi analitici differiscono per inaccuratezza, anziché eseguire il test posso calcolare l'intervallo di confidenza per la vera differenza tra le medie dei due metodi (  = V - N ): Nel nostro esempio, la confidenza corrispondente ad un rischio d'errore di tipo I =0.01 è (1-)=0.99:I.C.99% = 0.38  2.58  0.118 = [0.08; 0.68]

Posso pertanto affermare che la vera differenza () di inaccuratezza tra i due metodi è un qualunque valore incluso tra 0.08 e 0.68 o, in altri termini, che la differenza non è minore di 0.08 ma non è maggiore di 0.68 mg/dl. Non sono certissimo che tale affermazione corrisponda a verità, ma la probabilità che l'affermazione corrisponda a verità è per me sufficientemente alta (99%): sono proprio io che ho scelto il livello di confidenza! Si noti che l'intervallo di confidenza non contiene lo 0: la probabilità che la differenza  sia nulla è inferiore all' 1%, in coerenza con l'esito del test di ipotesi.

LA DIMENSIONE DEL CAMPIONE Nella programmazione dello studio illustrato nel nostro esempio, ci eravamo propo-sti di eseguire un totale di 28 misurazioni (14 con il metodo V e 14 con il metodo N): in questo modo si fa l'uso più efficiente del lavoro del tecnico, nel senso che si ottiene l'errore standard minimo possibile per la differenza tra i metodi N e V Se il tecnico avesse eseguito 7 misurazioni col metodo V e 21 col metodo N, avrebbe fatto la stessa quantità di lavoro ma avrebbe ottenuto un errore standard maggiore: Nel caso le due medie poste a confronto siano calcolate su campioni di numerosità uguale si ha che In questo caso è assai semplice ricavare la dimensione del campione necessaria a rico-noscere, con la potenza (1-) desiderata, una specifica ipotesi alternativa, in presenza di una data dispersione (), e per un prefissato rischio d'errore di tipo I ().

LA DIMENSIONE DEL CAMPIONE Dalla figura si ricava che la soglia d* può essere espressa sia rispetto alla media dell'ipotesi nulla H0 d* = 0 + z/2  sia rispetto alla media della specifica ipotesi alternativa H1 d* =  - z  Dalle due precedenti espressioni si può ricavare che la dimensione del campione richiesta è

LA DIMENSIONE DEL CAMPIONE Nel nostro esempio, la dimensione campionaria n=14 era stata calcolata in base alle seguenti specifiche:  imprecisione di entrambi i metodi:  = 0.30 mg/dl  rischio di errore di tipo I :  = 0.01  rischio di errore di tipo II:  = 0.10  minima differenza tecnicamente rilevante:  = 0.45 mg/dl n = 2(z/2+z)2 (/)2 = 2(2.58+1.28)2  (0.30/0.45)2  14 Due campioni di 14 misure garantiscono quanto segue:  Riconoscerò equivalenti per accuratezza i metodi V e N se N = V. Livello della garanzia: pari al 99%.  riconoscerò differenze di accuratezza pari o superiori al minimo valore tecnicamente rilevante. Livello della garanzia: almeno il 90%.  una differenza di accuratezza inferiore al minimo valore rilevante sarà ignorata con una probabilità che eccede il prefissato rischio  in misura tanto maggiore quanto minore sarà la sua entità.