La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Stat 01 - 1 / 48 Lezione 5 Strumenti statistici: campioni e stimatori.

Presentazioni simili


Presentazione sul tema: "Stat 01 - 1 / 48 Lezione 5 Strumenti statistici: campioni e stimatori."— Transcript della presentazione:

1 Stat / 48 Lezione 5 Strumenti statistici: campioni e stimatori

2 Stat / 48 Nella lezione precedente, parte 1... La definizione frequentista della probabilità: P La definizione classica della probabilità: P La definizione assiomatica della probabilità P P P P A

3 Stat / 48 Nella parte 2...

4 Stat / 48 Nella parte 2...

5 Stat / 48 Nella parte 3... Le variabili casuali X La funzione distribuzione cumulativa La funzione densità di probabilità Le funzioni di probabilità della variabile casuale X

6 Stat / 48 Nella parte 3... Le variabili casuali X I parametri della distribuzione della variabile casuale X

7 Stat / 48 dalla caratteristica comune di una popolazione al suo modello probabilistico … 1,61m < h < 1,63m X = 162 1,59m < h < 1,61m X = 160 1,57m < h < 1,59m X = 158 una popolazione (distribuita in modo) normale su cui viene definita una variabile casuale continua X con media e varianza 2 può essere modellata mediante una funzione di densità di probabilità f X ( x ) espressa nella forma:

8 Stat / 48 dalla caratteristica comune di una popolazione al suo modello probabilistico …

9 Stat / 48 dalla caratteristica comune di una popolazione al suo modello probabilistico …

10 Stat / 48 dalla caratteristica comune di una popolazione al suo modello probabilistico: la distribuzione di probabilità

11 Stat / 48 dalla caratteristica comune di una popolazione al suo modello probabilistico: la distribuzione di probabilità

12 Stat / 48 dalla caratteristica comune di una popolazione al suo modello probabilistico: la distribuzione di probabilità

13 Stat / 48 dalla caratteristica comune di una popolazione al suo modello probabilistico …

14 Stat / 48 Distribuzione normale al variare del valore della media la f X ( x ) trasla indeformata la media e varianza 2 ( o la sua radice quadrata che viene indicata come scarto quadratico medio ) costituiscono i parametri di forma della distribuzione normale in quanto landamento della densità f X ( x ) viene condizionato dai valori di tali parametri:

15 Stat / 48 Distribuzione normale al variare del valore della varianza 2 la f X ( x ) si deforma la media e varianza 2 ( o la sua radice quadrata che viene indicata come scarto quadratico medio ) costituiscono i parametri di forma della distribuzione normale in quanto landamento della densità f X ( x ) viene condizionato dai valori di tali parametri:

16 Stat / 48 Dalla distribuzione normale alla normale standard se X è una variabile casuale con distribuzione normale, media e varianza 2, allora la variabile casuale Z ha distribuzione normale, con media nulla e varianza unitaria. La densità della Z è pertanto espressa dalla:

17 Stat / 48 Dalla distribuzione normale alla normale standard se X è una variabile casuale con distribuzione normale, media e varianza 2, allora la variabile casuale Z ha distribuzione normale, con media nulla e varianza unitaria.

18 Stat / 48 Dalla distribuzione normale alla normale standard se X è una variabile casuale con media, varianza 2 ed ha distribuzione normale allora la nuova variabile casuale Z che assume valore risulta avere: –media Z = 0,

19 Stat / 48 Dalla distribuzione normale alla normale standard se X è una variabile casuale con media, varianza 2 ed ha distribuzione normale allora la nuova variabile casuale Z che assume valore risulta avere: –media Z = 0,

20 Stat / 48 Dalla distribuzione normale alla normale standard se X è una variabile casuale con media, varianza 2 ed ha distribuzione normale allora la nuova variabile casuale Z che assume valore risulta avere: –media Z = 0, varianza var [ Z ] = 1,

21 Stat / 48 Dalla distribuzione normale alla normale standard se X è una variabile casuale con media, varianza 2 ed ha distribuzione normale allora la nuova variabile casuale Z che assume valore risulta avere: –media Z = 0, varianza var [ Z ] = 1,

22 Stat / 48 parte 1 Campioni, campionamento, stimatori campionari

23 Stat / 48 Parte I - sommario Prove a tappeto ed a campione Tecniche di campionamento –Campionamento sistematico –Campionamento a strati –Campionamento con il metodo delle quote –Campionamento a grappolo Momenti campionari Stimatori Caratteristiche degli stimatori –Correttezza –Consistenza –Efficienza

24 Stat / 48 Misurazione della caratteristica comune Il valore della caratteristica che accomuna gli elementi della popolazione oggetto può essere determinato con le più diverse procedure di misurazione: quando le misure non sono tali da procurare danni agli elementi misurati si può ipotizzare una prova a tappeto.

25 Stat / 48 Campione Non è sempre possibile esaminare lintera popolazione (per problemi di tempo, per problemi economici, per problemi pratici) pertanto uno degli scopi delle ricerche statistiche è quello di inferire, cioè di fare previsioni sulla intera popolazione mediante lesame di un suo sottoinsieme che viene chiamato campione. Uno dei pionieri della statistica applicata, William Sealy Gosset ( ) che operava con lo pseudonimo di Student, era responsabile del Laboratorio Prove e Ricerche presso la birreria Guinness a Dublino, Irlanda.

26 Stat / 48 Campionamento La scelta del campione è fondamentale per evitare di trarre delle conclusioni incomplete o, addirittura, errate sulla popolazione. Per evitare distorsioni provocate da un campione non rappresentativo della popolazione, si deve dare ad ogni elemento della popolazione oggetto la stessa probabilità di venire estratto a far parte del campione. Le principali tecniche con le quali operare il campionamento, cioè la composizione del campione, sono indicate come: –campionamento sistematico; –campionamento stratificato; –campionamento con il metodo delle quote; –campionamento a grappolo.

27 Stat / 48 Campionamento sistematico Nel campionamento sistematico si sceglie ciascun elemento che andrà a costituire il campione in base ad una regola prefissata. Ad esempio: si preleva ogni 30-esimo pezzo prodotto da una macchina o da una catena di montaggio. Il rischio insito in questa procedura è quello di incorrere in periodicità nascoste nel prodotto: se si producesse, sistematicamente, un pezzo difettoso ogni 29 pezzi sani, un campionamento sistematico del tipo uno ogni 30 potrebbe risultare fatale. Anche il caso di un pezzo difettoso ogni 14 pezzi sani porterebbe a fallire il campionamento.

28 Stat / 48 Campionamento sistematico Nel campionamento sistematico si sceglie ciascun elemento che andrà a costituire il campione in base ad una regola prefissata. Ad esempio: si preleva ogni 30-esimo pezzo prodotto da una macchina o da una catena di montaggio.

29 Stat / 48 Campionamento stratificato Nel campionamento stratificato si divide preliminarmente la popolazione in un numero prestabilito si sottopopolazioni o strati dalle quali si estraggono delle unità che andranno a comporre il campione totale. Ad esempio: la suddivisione in strati potrebbe venire effettuata tenendo conto dei turni di lavoro oppure tenendo conto della linea produttiva, ecc.

30 Stat / 48 Campionamento stratificato Nel campionamento stratificato si divide preliminarmente la popolazione in un numero prestabilito si sottopopolazioni o strati dalle quali si estraggono delle unità che andranno a comporre il campione totale. Ad esempio: la suddivisione in strati potrebbe venire effettuata tenendo conto dei turni di lavoro oppure tenendo conto della linea produttiva, ecc.

31 Stat / 48 Campionamento con il metodo delle quote Si divide la popolazione in gruppi sulla base della caratteristica (oggetto dello studio) per i quali sono noti i pesi percentuali di ciascuno nei confronti della popolazione. A questo punto vengono definite le quote, cioè il numero di elementi da prelevare da ciascun gruppo e si procede con unestrazione casuale delle unità da ciascun gruppo. Il campione sarà linsieme costituito da tutte le unità estratte. Ad esempio: nel caso di unindagine che riguarda una azienda con penetrazione sul mercato che cambia da regione a regione, si chiede alle persone incaricate di allestire il campione intervistando in ciascuna regione un numero di individui legato alla penetrazione della azienda nella regione stessa.

32 Stat / 48 Campionamento con il metodo delle quote Si divide la popolazione in gruppi sulla base della caratteristica (oggetto dello studio) per i quali sono noti i pesi percentuali di ciascuno nei confronti della popolazione. A questo punto vengono definite le quote, cioè il numero di elementi da prelevare da ciascun gruppo e si procede con unestrazione casuale delle unità da ciascun gruppo. Il campione sarà linsieme costituito da tutte le unità estratte. Ad esempio: nel caso di unindagine che riguarda una azienda con penetrazione sul mercato che cambia da regione a regione, si chiede alle persone incaricate di allestire il campione intervistando in ciascuna regione un numero di individui legato alla penetrazione della azienda nella regione stessa.

33 Stat / 48 Campionamento a grappolo Questa procedura è utile quando si è nella impossibilità di estrarre il campione dalla intera popolazione. La popolazione viene allora vista come un insieme di grappoli non ricoprentesi e sono i grappoli ad essere scelti in modo casuale per poi costituire il campione mediante le singole unità costituenti i grappoli prescelti. Si noti che, se i grappoli non sono composti di un ugual numero di unità, la numerosità del campione è nota solamente al termine del campionamento. Ad esempio: nel caso di unindagine che riguarda lo studio della fruizione del servizio di trasporto pubblico in una estesa area urbana si possono considerare come grappoli le famiglie residenti, fra le quali si estraggono a sorte alcuni grappoli: il campione sarà costituito da tutti i componenti delle famiglie estratte.

34 Stat / 48 Campionamento a grappolo

35 Stat / 48 Statistiche definizione 5.1: Si definisce statistica g ( X 1, X 2, X 3, …, X n ) una funzione di variabili casuali che non contiene parametri della popolazione. Una statistica è a sua volta una variabile casuale. esempio: sono statistiche: e mentre non è una statistica perché contiene la media della X sulla intera popolazione (che è un parametro incognito)

36 Stat / 48 Principali statistiche: momento campionario Definizione ?! dato un campione { X 1, X 2, …, X n } proveniente da una popolazione avente densità f X ( x ), si definiscemomento campionario di ordine p la statistica :

37 Stat / 48 Principali statistiche: momento campionario … dato un campione { X 1, X 2, …, X n } proveniente da una popolazione avente densità f X ( x ), …

38 Stat / 48 definizione: dato un campione { X 1, X 2, …, X n } proveniente da una popolazione avente densità f X ( x ), si definiscemomento campionario di ordine p la statistica: definizione 5.2: estraendo da una popolazione per cui è definita la variabile casuale X un campione di n elementi a cui corrisponde linsieme di variabili casuali { X 1, X 2, …, X n } si chiamamomento campionario di ordine p la statistica: Principali statistiche: momento campionario

39 Stat / 48 Principali statistiche: momento campionario … estraendo da una popolazione per cui è definita la variabile casuale X un campione di n elementi a cui corrisponde linsieme di v.c. { X 1, X 2, …, X n } …

40 Stat / 48 Principali statistiche: momento campionario di ordine 1 Fra i momenti campionari riveste particolare interesse quello di ordine 1 ( p = 1 ). E chiamato media campionaria e coincide con la media della X per il campione: per questo motivo lo indicheremo con per richiamare il suo significato.

41 Stat / 48 Principali statistiche: momento campionario di ordine 1 Della media campionaria si tratterà in dettaglio nelle prossime lezioni: per ora si segnalano due sue caratteristiche. Estraendo diversi campioni di n elementi da una popolazione per cui è definita la variabile casuale X che ha media e varianza 2 si ha: e, nel caso di popolazione infinita o di campionamento con ripetizione, si ha:

42 Stat / 48 Principali statistiche: momento campionario rispetto a definizione 5.3: estraendo da una popolazione per cui è definita la variabile casuale X un campione di n elementi a cui corrisponde linsieme di variabili casuali { X 1, X 2, …, X n } si chiama momento campionario di ordine p rispetto a la statistica:

43 Stat / 48 Principali statistiche: momento campionario di ordine 2 rispetto a Il momento campionario di ordine 2 rispetto a riveste interesse particolare in quanto esso coincide con la varianza del campione:

44 Stat / 48 Stimatori definizione 5.4: Si definiscono stimatori quelle statistiche che vengono usate per stimare un parametro o una sua funzione. –I valori ottenuti mediante gli stimatori si dicono stime del parametro. esempio: estraendo da una popolazione per cui è definita la variabile casuale X un campione di n elementi a cui corrisponde linsieme di v.c. { X 1, X 2, …, X n } si può affermare che: la media campionaria: è uno stimatore della media della popolazione:

45 Stat / 48 Caratteristiche degli stimatori: correttezza definizione 5.5: Uno stimatore V = v ( X 1, X 2, …, X n ) del parametro si definiscecorretto se e solo se il suo valore atteso è uguale al parametro che deve stimare. –Se lo stimatore risulta corretto solamente quando n tende allinfinito si dice che lo stimatore è asintoticamente corretto. Per popolazioni finite la definizione deve essere intesa nel senso: quando n risulta sufficientemente grande. –La media campionaria è uno stimatore corretto della media della popolazione in quanto:

46 Stat / 48 Caratteristiche degli stimatori: consistenza definizione 5.6: Uno stimatore V = v ( X 1, X 2, …, X n ) del parametro si definisceconsistente se converge in probabilità al parametro che deve stimare. Nel caso di uno stimatore corretto o asintoticamente corretto del parametro si può affermare che esso è consistente se: –La media campionaria è uno stimatore consistente in quanto:

47 Stat / 48 Nel caso di stimatori corretti il rapporto Eff ( V 1 / V 2 ) coincide con il rapporto delle varianze dei due stimatori pertanto lo stimatore più efficiente è quello che ha varianza minore. Caratteristiche degli stimatori: efficienza definizione 5.7: La misura della efficienza tra due stimatori è definita come: Se Eff ( V 1 / V 2 ) > 1 la stima fornita da V 1 è più efficiente.

48 Stat / 48 La prossima volta… Lo stimatore media campionaria e la sua distribuzione


Scaricare ppt "Stat 01 - 1 / 48 Lezione 5 Strumenti statistici: campioni e stimatori."

Presentazioni simili


Annunci Google