La distribuzione campionaria: principi generali

Slides:



Advertisements
Presentazioni simili
STATISTICA DESCRITTIVA
Advertisements

STATISTICA DESCRITTIVA
La distribuzione normale e normale standardizzata
Appunti di inferenza per farmacisti
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
STATISTICA INFERENZIALE
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
Corso di Analisi Statistica per le Imprese
LA MISURA IN PSICOLOGIA. Scopo del corso Il corso si propone di offrire allo studente:  un’introduzione alle tematiche connesse alla misura in psicologia.
IL GIOCO D’AZZARDO PATOLOGICO ANALISI DELLE ATTIVITÀ SVOLTE DAI SERT NEL CORSO DEL 2013 Milano, 09 Luglio 2014.
Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.
Consentono di descrivere la variabilità all’interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche.
Corso di Analisi Statistica per le imprese
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
Precorso di Statistica per le Lauree Magistrali
INTRODUZIONE ALLA STATISTICA
Precorso di Statistica
Distribuzioni limite La distribuzione normale
Introduzione a Statistica e Probabilità
Precorso di Statistica per le Lauree Magistrali
Valutazione dell’incertezza associata alla mappa acustica dinamica di Milano Giovanni Zambon; Roberto Benocci; Maura Smiraglia; H. Eduardo Roman.
Qualità dei dati Fabio Murena.
RICHIAMI DI INFERENZA:
STATISTICA Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo.
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
Algoritmi di stima con perdita di pacchetti in reti di sensori wireless: modellizzazione a catene di Markov, stima e stima distribuita Chiara Brighenti,
Misure Meccaniche e Termiche - Università di Cassino
Confronto fra 2 popolazioni
La dimensione del campione
DISTRIBUZIONI TEORICHE DI PROBABILITA’
PIANIFICAZIONE DEI TRASPORTI Regressione lineare
Psicologia generale Laboratorio Titolo del lavoro Nome studente
Precorso di Statistica per le Lauree Magistrali
APPUNTI DI STATISTICA INFERENZIALE
Intervalli di Fiducia Introduzione Intervalli di fiducia per la media – Caso varianza nota Intervalli di fiducia per la media – Caso varianza non nota.
Precorso di Statistica
Introduzione a Statistica e Probabilità
Classificazione dei dati
Precorso di Statistica per le Lauree Magistrali
Alcuni richiami e definizioni (1)
La dimensione del campione
Indici di variabilità La variabilità è la ragione dell’esistenza della psicologia. Le persone hanno dei comportamenti diversi che non possono essere predetti.
Esercitazione di Statistica
Un esempio Una casa farmaceutica dichiara che un nuovo antidolorifico che sta per immettere sul mercato fa effetto mediamente in un tempo pari a 12,75.
La standardizzazione dei punteggi
Università degli Studi di Modena e Reggio Emilia
Intervalli di confidenza
PROCEDURA per la misura e la relativa stima
Statistica descrittiva bivariata
Corso di Laurea Magistrale in Economia e Professioni
Statistica descrittiva bivariata
Interpretare la grandezza di σ
ANALISI DI REGRESSIONE
Statistica inferenziale
Test per campioni appaiati
Esercizio La popolazione di adulti presenta una media di ansia pari a 4. Ad un campione di 35 soggetti con disturbo ossessivo compulsivo è stato somministrato.
Confronto tra medie di due popolazioni
Precorso di Statistica per le Lauree Magistrali
Corso di Analisi Statistica per le imprese
Precorso di Statistica
RICHIAMI DI INFERENZA:
RICHIAMI DI INFERENZA:
Corso di Analisi Statistica per le Imprese
Precorso di Statistica per le Lauree Magistrali
Test per campioni indipendenti
La dimensione del campione
MODELLO DI REGRESSIONE LINEARE SEMPLICE
Corso di Analisi Statistica per le Imprese
L’Analisi della Varianza ANOVA (ANalysis Of VAriance)
Transcript della presentazione:

La distribuzione campionaria: principi generali Corso di Statistica Medica La distribuzione campionaria: principi generali Lezione 4 Dr.ssa Sara Balduzzi

Argomenti Il concetto di popolazione e di campione Il comportamento dei campioni

La popolazione, il campione e l’inferenza Lo scopo della statistica inferenziale è di ottenere, attraverso lo studio di un campione, conoscenze sulla popolazione oggetto di studio da cui il campione è stato estratto Popolazione Estrazione di un campione rappresentativo Campione Processo inferenziale

Le caratteristiche della popolazione Le caratteristiche della popolazione oggetto di studio sono di solito espresse attraverso: Medie Percentuali Tassi Deviazione standard (varianza) Rapporti Differenze Confronto tra due o più popolazioni

Esempi di caratteristiche Il livello medio di bilirubina nel sangue nei pazienti affetti da cirrosi epatica primaria () La percentuale di pazienti affetti da una determinata neoplasia che muore dopo un anno dall’inizio del trattamento ()

Le statistiche campionarie Le caratteristiche della popolazione di interesse (parametri) possono essere stimate nel campione attraverso le statistiche campionarie, o stimatori

Pazienti affetti da cirrosi biliare primaria Sconosciuta Popolazione Esempio1: Qual è il livello medio di albumina nel sangue nei pazienti affetti da cirrosi biliare primaria? Pazienti affetti da cirrosi biliare primaria Sconosciuta Popolazione Parametro  Media Incognito Estrazione di un campione rappresentativo della popolazione Campione Esempio: Vengono misurati i livelli di albumina nel sangue di n=100 pazienti affetti da cirrosi biliare primaria. La media campionaria è 34.5 Stimatore x=media campionaria

… un po' di domande Possiamo dire con certezza che: 34.5 è il livello medio di albumina nel sangue nella popolazione di pazienti affetti da cirrosi biliare primaria ? Otterremmo le stesse stime se utilizzassimo altri campioni ?

Il comportamento dei campioni Esempio Una popolazione è composta da 5 valori 2, 3, 4, 5, 6. Considerando tutti i campioni di ampiezza 2 che possono essere estratti con ripetizione dalla popolazione, determinare: la media dei valori della popolazione la deviazione standard la media della distribuzione della media campionaria la deviazione standard della distribuzione della media campionaria

I valori della popolazione: 2, 3, 4, 5, 6 a) Media =(2+3+4+5+6)/5=20/5=4.0 b) Deviazione standard SD=[(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2]/5= =  4+1+0+1+4/5=  2=1,41 c) Campioni di dimensione 2 (2,2) (2,3) (2,4) (2,5) (2,6) (3,2) (3,3) (3,4) (3,5) (3,6) (4,2) (4,3) (4,4) (4,5) (4,6) (5,2) (5,3) (5,4) (5,5) (5,6) (6,2) (6,3) (6,4) (6,5) (6,6)

I valori della popolazione: 2, 3, 4, 5, 6 c) Le medie corrispondenti (2.0) (2.5) (3.0) (3.5) (4.0) (2.5) (3.0) (3.5) (4.0) (4.5) (3.0) (3.5) (4.0) (4.5) (5.0) (3.5) (4.0) (4.5) (5.0) (5.5) (4.0) (4.5) (5.0) (5.5) (6.0) La media della distribuzione della media campionaria= 4.0 (2.0+2.5+3.0+3.5+4.0+2.5+3.0+3.5+4.0+4.5+3.0+3.5+4.0+4.5+5.0+3.5+4.0+4.5+5.0+5.5+4.0+4.5+5.0+5.5+6.0)/25=4.0 La deviazione standard della distribuzione della media campionaria, chiamata standard error (SE)= 1 [(2.0-4.0)2+(2.5-4.0)2+(3.0-4.0)2+(3.5-4.0)2+(4.0-4.0)2+(2.5-4.0)2+(3.0-4.0)2+(3.5-4.0)2+(4.0-4.0)2+ (4.5-4.0)2+(3.0-4.0)2+(3.5-4.0)2+(4.0-4.0)2+(4.5-4.0)2+(5.0-4.0)2+(3.5-4.0)2+(4.0-4.0)2+(4.5-4.0)2+ (5.0-4.0)2+(5.5-4.0)2+(4.0-4.0)2+(4.5-4.0)2+(5.0-4.0)2+(5.5-4.0)2+(6.0-4.0)2]/25= 1

Si dimostra che estraendo tutti i possibili campioni di dimensione sufficientemente grande da una popolazione (normale e non): a) la distribuzione delle medie campionarie si distribuirà normalmente b) la media delle medie campionarie sarà uguale alla media della popolazione c) la deviazione standard delle medie (errore standard) sarà pari a:

L’errore standard (ES) E’ una misura della variabilità delle stime intorno al valore del parametro. Ovvero, è una misura dell’imprecisione della stima del parametro. L’ES dipende da due fattori: Dalla deviazione standard (ovvero dalla variabilità delle singole osservazioni nella popolazione intorno al parametro) Dalla dimensione del campione

Campioni (n=3) (2,2,2) (2,2,3) (2,2,4) (2,2,5) (2,2,6) (2,2,2) (2,2,3) (2,2,4) (2,2,5) (2,2,6) (2,3,2) (2,3,3) (2,3,4) (2,3,5) (2,3,6) (2,4,2) (2,4,3) (2,4,4) (2,4,5) (2,4,6) (2,5,2) (2,5,3) (2,5,4) (2,5,5) (2,5,6) (2,6,2) (2,6,3) (2,6,4) (2,6,5) (2,6,6) (3,2,2) (3,2,3) (3,2,4) (3,2,5) (3,2,6) (3,3,2) (3,3,3) (3,3,4) (3,3,5) (3,3,6) (3,4,2) (3,4,3) (3,4,4) (3,4,5) (3,4,6) (3,5,2) (3,5,3) (3,5,4) (3,5,5) (3,5,6) (3,6,2) (3,6,3) (3,6,4) (3,6,5) (3,6,6) (4,2,2) (4,2,3) (4,2,4) (4,2,5) (4,2,6) (4,3,2) (4,3,3) (4,3,4) (4,3,5) (4,3,6) (4,4,2) (4,4,3) (4,4,4) (4,4,5) (4,4,6) (4,5,2) (4,5,3) (4,5,4) (4,5,5) (4,5,6) (4,6,2) (4,6,3) (4,6,4) (4,6,5) (4,6,6) (5,2,2) (5,2,3) (5,2,4) (5,2,5) (5,2,6) (5,3,2) (5,3,3) (5,3,4) (5,3,5) (5,3,6) (5,4,2) (5,4,3) (5,4,4) (5,4,5) (5,4,6) (5,5,2) (5,5,3) (5,5,4) (5,5,5) (5,5,6) (5,6,2) (5,6,3) (5,6,4) (5,6,5) (5,6,6) (6,2,2) (6,2,3) (6,2,4) (6,2,5) (6,2,6) (6,3,2) (6,3,3) (6,3,4) (6,3,5) (6,3,6) (6,4,2) (6,4,3) (6,4,4) (6,4,5) (6,4,6) (6,5,2) (6,5,3) (6,5,4) (6,5,5) (6,5,6) (6,6,2) (6,6,3) (6,6,4) (6,6,5) (6,6,6)

Medie corrispondenti

Aumentando la dimensione del campione da 2 a 3 l’ES passa da 1 ad 0.81 La media della distribuzione della media campionaria= 4.0 Media=(2.0+2.3+2.7+…+5.3+5.7+6)/125=4.0 La deviazione standard della distribuzione della media campionaria, chiamata standard error (SE)= 0.81 SE=[(2.0-4.0)2+(2.3-4.0)2+(2.7-4.0)2+…2+(5.3-4.0)2+(5.7-4.0)2+(6.0-4.0)2]/125=0.81 Aumentando la dimensione del campione da 2 a 3 l’ES passa da 1 ad 0.81 Aumentando la dimensione del campione si riduce l’errore campionario

Il comportamento dei campioni Punti essenziali I valori stimati variano intorno il valore del parametro (popolazione) Per n grande i valori campionari hanno un andamento campanulare Tale variabilità può essere ridotta aumentando la dimensione del campione

… le risposte NO NO Possiamo dire con certezza che: 34.5 è il livello medio di albumina nel sangue nella popolazione di pazienti affetti da cirrosi biliare primaria ? NO Otterremmo le stesse stime se utilizzassimo altri campioni ? NO