Intervalli di confidenza

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
8) GLI INTERVALLI DI CONFIDENZA
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
I TEST DI SIGNIFICATIVITA' IL TEST DI STUDENT
STATISTICA A – K (60 ore) Esercizi di riepilogo al corso
STATISTICA DESCRITTIVA
Proprietà degli stimatori
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
2.VARIABILI CONTINUE A. Federico ENEA; Fondazione Ugo Bordoni Scuola estiva di fonetica forense Soriano al Cimino 17 – 21 settembre 2007.
Fondamenti della Misurazione
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Analisi dei dati per i disegni ad un fattore
Intervalli di Confidenza
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
STATISTICA A – K (60 ore) Marco Riani
Inferenza statistica per un singolo campione
Valutazione delle ipotesi
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
CONFRONTO TRA DUE MEDIE:
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
Esercizi x1=m-ts x2=m+ts
intervallo di confidenza e test di significatività per una proporzione
DALL'INTERVALLO DI PROBABILITÀ
DIFFERENZA TRA LE MEDIE
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 4: La funzione di Gauss
STATISTICA a.a PARAMETRO t DI STUDENT
Esercizi x1=m-ts x2=m+ts
Valutazione della stima: gli intervalli di confidenza
Lezione 8 Numerosità del campione
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 6 Inferenza statistica
Lezione 7 i Test statistici
Verifica delle ipotesi su due campioni di osservazioni
Esercitazioni sul calcolo dei valori critici
Le distribuzioni campionarie
STATISTICA INFERENZIALE
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –
La verifica d’ipotesi Docente Dott. Nappo Daniela
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
IL CAMPIONE.
“Teoria e metodi della ricerca sociale e organizzativa”
ANALISI STATISTICA DI DATI CAMPIONARI
Le distribuzioni campionarie
Test basati su due campioni Test Chi - quadro
Def : uno stimatore è una statistica T n le cui determinazioni servono a fornire delle stime del parametro ignoto  della v.c. X in cui sono state effettuate.
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
“Teoria e metodi della ricerca sociale e organizzativa”
Intervalli di confidenza
La distribuzione campionaria della media
Elaborazione statistica di dati
Esercitazioni di Statistica con Matlab Dott
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
Corso di Laurea Magistrale in Economia e Professioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Implementazione.
Introduzione all’inferenza
L’INFERENZA STATISTICA
Transcript della presentazione:

Intervalli di confidenza

Stima per intervallo Sia X una v.c. che rappresenta un carattere osservato su una popolazione. Supponiamo che la v.c. sia definita da una funzione di probabilità dipendente dal parametro incognito. Sia un campione di dimensione e il corrispondente campione osservato. Obiettivo: Determinare due statistiche campionarie: tali che per ogni possibile campione e che l’intervallo contenga il parametro con probabilità

Stima per intervallo L’intervallo casuale si definisce intervallo di confidenza di livello per il parametro se contiene con probabilità il parametro ignoto della popolazione, ossia: In genere si fissano valori di pari a 0,99; 0,95; 0,90 e viene detto livello di confidenza. Una volta estratto il campione si ottiene l’intervallo di confidenza stimato. Nota: Non è possibile sapere se l’intervallo stimato contenga o meno il valore vero del parametro; d’altra parte se si estraesse dalla popolazione un numero sufficientemente elevato di campioni e calcolassimo i corrispondenti intervalli di confidenza, circa il di questi conterrebbe il parametro ignoto.

Stima per intervallo - esempio Esempio (continua) Nella seguente figura si mostrano, in corrispondenza di 6 campioni osservati, gl’intervalli di confidenza stimati per la media della popolazione a un livello di confidenza 0,95. Osserviamo che dal campione 5 si ottiene un intervallo stimato che non contiene il vero parametro della popolazione.

Intervallo di confidenza per la media (varianza nota) Sia X una v.c. che rappresenta un carattere osservato su una popolazione. Supponiamo che la v.c. sia distribuita come una Normale con varianza nota. Allora sappiamo che:

Intervallo di confidenza per la media (varianza nota) Dato un campione casuale estratto da una popolazione Normale con media ignota e varianza nota, l’intervallo di confidenza per la media della popolazione al livello di confidenza è: Esempio Siano Dalle tavole della Normale standardizzata si ottiene Se si ottiene:

Stima per intervallo - esempio Sia Si consideri un campione di dimensione n=10 La media campionaria è una v.c. che si distribuisce come è una v.c. Normale standardizzata da cui possiamo ricavare che Se dal campione estratto si osserva un valore della media pari a , l’intervallo stimato risulta:

Intervallo di confidenza per la media (varianza nota) La lunghezza dell’intervallo di confidenza si ricava dalla differenza tra estremo superiore e estremo inferiore: Lunghezza= Dipende da: la dimensione del campione il livello di confidenza la varianza della popolazione Intervenendo sulla dimensione del campione o sul livello di confidenza si può aumentare o diminuire la lunghezza dell’intervallo. Una volta fissati questi due elementi, al variare dei campioni estratti, la lunghezza degli intervalli corrispondenti rimane costante.

Intervallo di confidenza per la media (varianza nota) La lunghezza dell’intervallo di confidenza si ricava dalla differenza tra estremo superiore e estremo inferiore: Lunghezza= Esempio: Fissato

Intervallo di confidenza per la media (varianza ignota) Sia X una v.c. che rappresenta un carattere osservato su una popolazione. Supponiamo che la v.c. sia distribuita come una Normale con media e varianza ignota. Per stimare la varianza della popolazione si utilizza lo stimatore varianza campionaria corretta: Pertanto la v.c. si distribuisce come una v.c. t-Student con gradi di libertà.

Intervallo di confidenza per la media (varianza ignota) Dato un campione casuale di dimensione estratto da una popolazione Normale con media e varianza entrambe ignote, l’intervallo di confidenza per la media a livello è dato da: La lunghezza dell’intervallo di confidenza è data in questo caso da: Lunghezza= Nota Al variare dei campioni estratti, la lunghezza degli intervalli corrispondenti non rimane costante poiché varia il valore di S.

Intervallo di confidenza per la media (popolazioni non Normali) Quando non è nota la popolazione ma il campione ha una dimensione sufficientemente grande, possiamo considerare un’approssimazione dell’intervallo di confidenza per la media ottenuta attraverso il teorema del limite centrale. Per sufficientemente grande possiamo utilizzare il seguente intervallo di confidenza a livello :

Intervallo di confidenza per una proporzione (campioni di dimensione elevata) Quando la popolazione è riferita a un carattere che può assumere solo due modalità (popolazione Bernoulliana), siamo interessati all’intervallo di confidenza per una proporzione , ad esempio, la proporzione di maschi nella popolazione. Come sappiamo un buon stimatore per è la media campionaria . Si ha: inoltre, dal teorema del limite centrale sappiamo che al crescere della dimensione campionaria la distribuzione della tende alla Normale, pertanto

Intervallo di confidenza per una proporzione (campioni di dimensione elevata) Tuttavia gli estremi dell’intervallo dipendono ancora dal parametro incognito e dunque devono essere sostituiti con degli stimatori, ottenendo il seguente intervallo di confidenza al livello : Una regola pratica: e

Esempio Si vuole ottenere una stima intervallare della proporzione di fumatori presenti in una certa regione. A tal fine viene osservato un campione casuale di 120 persone, di cui 78 sono fumatori. Quindi la stima puntuale della proporzione è data da: quindi l’intervallo di confidenza al livello è: In questo caso:

Se la varianza è incognita, si utilizza lo stimatore S2 e la distribuzione di campionamento della media è la t di Student. Si ha il seguente intervallo di confidenza 95%CI= Dove tα/2 è tale che Prob

Intervallo di confidenza per una frequenza

Intervallo di confidenza per la differenza tra due medie Varianze incognite ma uguali Varianze note Varianze incognite ma diverse: campioni grandi Varianze incognite ma diverse: campioni piccoli (Problema di Beherens Fisher)

Varianze incognite ma diverse: campioni piccoli (Problema di Beherens Fisher) con

Intervallo di confidenza per la differenza tra due frequenze

Determinare la dimensione del campione per la stima della Media n deve essere calcolato in modo da ottenere un intervallo di ampiezza piccola con alta attendibilità Se desideriamo un’ampiezza dell’intervallo 2d (errore assoluto) e un livello di attendibilità 1-α, si ha la seguente equazione: Nel campionamento in blocco:

Come si arriva a questa formula? L’ampiezza dell’Intervallo di confidenza deve essere uguale a 2d. Quindi:

Esempio Si vuole stimare la numerosità necessaria per ottenere un intervallo di confidenza per p (ad es. la proporzione di persone propense a dare la preferenza a un certo candidato) in modo tale che la semi-lunghezza dell’intervallo di confidenza al livello 0,95 non sia superiore a 0,05.

Esempio Occorre un campione di almeno 62 pz. Si vuole stimare il livello di pressione sistolica ottenuto con il farmaco sperimentale. Qual è la numerosità campionaria necessaria per ottenere un intervallo di confidenza al 95% di ampiezza inferiore o uguale a 5 mmHg? (Ricorda che 5=2d) Occorre un campione di almeno 62 pz.

Determinare la dimensione del campione per la stima della proporzione n deve essere calcolato in modo da ottenere un intervallo di ampiezza piccola con alta attendibilità Se desideriamo un’ampiezza dell’intervallo 2d (errore assoluto) e un livello di attendibilità 1-α, si ha la seguente equazione: Ipotesi prudenziale: p=1-p=0.5 Nel campionamento in blocco: