DALL'INTERVALLO DI PROBABILITÀ

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
8) GLI INTERVALLI DI CONFIDENZA
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Le distribuzioni di probabilità continue
CALCOLO DELLA GAUSSIANA
STATISTICA A – K (60 ore) Esercizi di riepilogo al corso
Intervalli di confidenza
Proprietà degli stimatori
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
LA DISTRIBUZIONE NORMALE
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Campione e campionamento
Esercitazione di Statistica
Intervalli di Confidenza
CAMPIONE E CAMPIONAMENTO
Progetto Pilota 2 Lettura e interpretazione dei risultati
STATISTICA A – K (60 ore) Marco Riani
Distribuzione degli Errori di Misura
Inferenza statistica per un singolo campione
Valutazione delle ipotesi
CAMPIONAMENTO Estratto dal Cap. 5 di:
CONFRONTO TRA DUE MEDIE:
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
Esercizi x1=m-ts x2=m+ts
intervallo di confidenza e test di significatività per una proporzione
Esercitazione su test d’ipotesi
Varianza campionaria Errore standard della varianza campionaria
La distribuzione normale e normale standardizzata
Campionamento casuale semplice
ISTOGRAMMI E DISTRIBUZIONI:
DIFFERENZA TRA LE MEDIE
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Matematica e statistica Versione didascalica: parte 7 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste.
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 9: test di Student
Corso di biomatematica lezione 10: test di Student e test F
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
STATISTICA a.a PARAMETRO t DI STUDENT
ISTOGRAMMI E DISTRIBUZIONI : i xixi
Esercizi x1=m-ts x2=m+ts
Valutazione della stima: gli intervalli di confidenza
Concetti legati all’incertezza statistica
Lezione 8 Numerosità del campione
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
Lezione 6 Inferenza statistica
Lezione 6 Inferenza statistica
Lezione 7 i Test statistici
PROBABILITÀ La probabilità è un giudizio che si assegna ad un evento e che si esprime mediante un numero compreso tra 0 e 1 1 Evento con molta probabilità.
Verifica delle ipotesi su due campioni di osservazioni
Esercitazioni sul calcolo dei valori critici
Le distribuzioni campionarie
PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
STATISTICA CHEMIOMETRICA
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Intervalli di fiducia.
Esercizi Due gruppi di studenti effettuano la misura della densità di un oggetto, trovando rispettivamente i valori 13.7 ± 0.9 g/cm3 e ± 1300 kg/m3.
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
IL CAMPIONE.
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
Intervalli di confidenza
Elaborazione statistica di dati
Esercitazioni di Statistica con Matlab Dott
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Introduzione all’inferenza
Transcript della presentazione:

DALL'INTERVALLO DI PROBABILITÀ ALL'INTERVALLO DI CONFIDENZA

INTERVALLO DI PROBABILITÀ Poiché, per campioni di numerosità suffi-ciente, lo stimatore media campionaria ha distribuzione gaussiana N~ (, 2/n), possiamo calcolare la probabilità che una data media campionaria ( ) ha di apparte-nere ad un certo intorno della media vera della variabile casuale . L'intervallo zα/2 σ/n , simmetrico attorno alla media vera (μ), include una frazione (1- α) delle possibili medie campionarie. Quindi la probabilità di ottenere una media campionaria ap-partenente a tale intervallo è (1-α).

dall'intervallo di probabilità all'intervallo di confidenza Quanto detto può essere espresso nei seguenti termini: dall'intervallo di probabilità all'intervallo di confidenza Questo intervallo ha ampiezza nota (se si suppone nota la dispersione ), ed è centrato sull'ignoto parametro . Tale intervallo viene detto intervallo di probabilità. La precedente espressione può essere riarrangiata, con un poco di algebra, come segue: Questo intervallo ha ampiezza nota ed è centrato su una media campionaria nota. Tale intervallo viene detto :  intervallo di confidenza per il parametro . 

 intervallo di confidenza per il parametro .  La posizione dell'intervallo di confidenza sull'asse reale dipende dalla variabile casuale media campionaria : L'intervallo di confidenza varia casualmente attorno al parametro, ed ha probabilità pari a (1-a) di includere il parametro della variabile Ciò significa che, benché sia impossibile risa-lire da una stima campionaria al vero valore del parametro di un universo, è però possibile determinare attorno a tale stima un intervallo che ha una prefissata probabilità (1-α) di includere il parametro  di quell'universo.

ampiezza dell’intervallo di confidenza L’ampiezza confidenza esprime l'indeterminazione con cui è noto il valore del parametro. Tale ampiezza dipende dall'errore standard che a sua volta dipende dalla dimensione (n) del campione. Pertanto, per una data dispersione (s) tipica dell'universo da cui voglio estrarre un campione, è possibile calcolare la dimensione del campione necessaria per ottenere un intervallo di prefissata confidenza (1-a) e ampiezza 2D:

Esempio: Si vuole stimare il vero valore medio dell'uricemia in una popolazione maschile: è noto che in tale popolazione la dispersione dell'uricemia è s = 1.1 mg/dl. Si richiede che la confidenza sia del 95% e che l'indeter-minazione non ecceda 0.35 mg/dl. La dimensione necessaria a soddisfare tali specifiche è n = ( 1.96 × 1.1 / 0.35)2 = 37.9 … quindi … n = 40 soggetti

 intervallo di confidenza per il parametro .  Si supponga ora di estrarre un campione casuale di 40 soggetti dalla popolazione, di determinare il valore di uricemia di ognuno dei 40 soggetti, e di calcolare la media di tali valori (ad es. =5.55 mg/dl). Si ricava che l'intervallo di confidenza della media al 95% vale I.C.95% = 5.55 ± 1.96 x 1.1/√40 = 5.55 ± 0.34 = (5.21 , 5.89) Cosa posso concludere? Posso affermare che il parametro ignoto  è compreso tra 5.21 e 5.89 mg/dl, ed ho la quasi certezza (cioè la confidenza del 95%) che l'affermazione sia vera. Nel contempo, so bene che l'affermazione potrebbe anche essere falsa (vi è infatti la probabilità del 5% che l'intervallo non includa il parametro ), ma ritengo che tale deprecabile eventualità sia così poco probabile da non capitare proprio a me.

Esempio Domanda: Qual è la pressione arteriosa di maschi di età 45-64 maschi ? Si è misurata la pressione arteriosa a 36 uomini di età compresa tra i 45 e i 64 anni selezionati a caso a partire dalla lista dei pazienti di un medico di base. Si è trovato che la pressione sistolica calcolata sul campione è 144 mmHg. a) Calcolare l’intervallo di confidenza al 95% per la pressione sistolica media, sapendo che σ=24.0 mmHg. b) Utilizzate il risultato ottenuto per saggiare se la pressione sistolica media degli uomini della fascia di età 45-64 anni può essere considerata pari a 150 mmHg DATI … =144 mmHg. ; σ=24 mmHg ; (1-α)=0.95 ; z0.025=1.96

Risposta: La pressione arteriosa di maschi di età 45-64 maschi I.C. (μ) =1441.9624/36 = 1441.964 = 1447.84 = [136.16;151.84] b) Per quanto osservato in questo campione di 36 uomini di età compresa tra 45 e 64 anni, possiamo inferire quanto segue: la pressione sitolica media degli uomini nella fascia di età 45-64 anni è un valore qualunque compreso tra 136.16 e 151.84 mmHg. La probabilità che tale affermazione sia vera è pari al 95%. Ne consegue che 150 mmHg può essere considerato uno dei valori plausibili per la pressione sistolica medlia degli uomini in quella fascia di età.

Di seguito sono riportati i valori di colesterolo (mg/100ml) di un campione di 11 uomini estratti a caso da un’ampia popolazione: «265, 208, 361, 143, 310, 252, 239, 225, 184, 220, 332» COLESTEROLO Calcolate l’intervallo di confidenza al 99% per il valore medio del colesterolo nella popolazione sapendo che σ= 65 mg/100ml (ed assumendo che il livello di colesterolo abbia distribuzione gaussiana). DATI : = 249 mg/100ml; σ=65 mg/100ml;  (1-α)=0.99; z0.005=2.58 I.C. = 249  2.5865/11 = = 249  2.5819.60 = 249  50.56  [198.44;299.56]

IMA Dati: =240 mg/dl =40mg/dl n=100 In una popolazione di uomini che ha avuto un in-farto al miocardio, il livello di colesterolo media-mente è 240 mg/dl con una deviazione standard di 40 mg/dl. Estraendo casualmente un campione di 100 soggetti si è trovata una media di 235 mg/dl. IMA 1 Quale è la probabilità che il livello medio di colesterolo sia maggiore o uguale a 260 mg/dl? 2. Qual è l’intervallo di confidenza per la media  della popolazione ad un livello del 95%? Dati: =240 mg/dl =40mg/dl n=100 1. 2. I.C(μ) = 2351.9640/100= 235  1.964 = 235  7.84 [227.16;242.84]

L'indice di massa corporea, BMI, (Kg/m2) misura il grado di sovrappeso di un soggetto. Per la popolazione di uomini di mezza età che svilupperanno diabete mellito, la distribuzione di BMI ha forma approssimativamente gaussiana con media  non nota e deviazione standard =2.7 kg/m². Un campione casuale di 58 soggetti selezionati da questo gruppo ha fornito una media =25kg/m². BMI a) Calcolare l’intervallo di confidenza al 95% per la media della popolazione. =2.7kg/m² =0.05 n=58 =25 kg/m² b) Se si richiedesse una confidenza del 99%, quale dimensione del campione garantirebbe una ampiezza dell’intervallo pari a quella trovata al punto a)? n =(6.291/0.69)2  83