La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Lezione 6 Inferenza statistica

Presentazioni simili


Presentazione sul tema: "Lezione 6 Inferenza statistica"— Transcript della presentazione:

1 Lezione 6 Inferenza statistica

2 parte 1 Stime per punti e per intervalli della media

3 la media campionaria come strumento di inferenza
Si definiscono “stimatori” quelle statistiche che vengono usate per stimare un parametro o una sua funzione. I valori ottenuti mediante gli stimatori si dicono “stime” del parametro. La media campionaria può essere usata come stimatore della media m dell’intera popolazione essendo uno stimatore corretto e consistente.

4 media campionaria e stima puntuale di m
estraendo da una popolazione per cui è definita la variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } si può usare la media campionaria per stimare il valore del parametro m relativo all’intera popolazione. il valore ottenuto viene indicato come “stima puntuale di m ”

5 Strumenti di misura e strumenti di inferenza

6 incertezza dello stimatore campionario
estraendo da una popolazione per cui è definita la variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } si può usare la media campionaria per stimare il valore del parametro m relativo all’intera popolazione. come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta un’incertezza che deve essere quantificata.

7 incertezza dello strumento di misura
Fascia di valore (a meno di 60 ppm)

8 incertezza dello strumento di misura

9 incertezza dello strumento di misura

10 incertezza dello stimatore campionario
Qual è la probabilità che, estraendo a caso un campione di n elementi dalla popolazione, il valore della media m della variabile X per la intera popolazione sia compreso nell’intervallo

11 incertezza dello stimatore campionario
Qual è la probabilità che, estraendo a caso un campione di n elementi dalla popolazione, l’intervallo casuale contenga il valore della media m della variabile X per la intera popolazione?

12 incertezza dello stimatore campionario
Con quale “confidenza”, dopo aver estratto a caso un campione di n elementi dalla popolazione e calcolato il valore della corrispondente media campionaria, si può affermare che il valore della media m della variabile X per la intera popolazione è compreso nell’intervallo

13 incertezza dello stimatore campionario
La “probabilità” dell’evento: è uguale alla “confidenza” con cui posso affermare: “ Intervallo di confidenza ”

14 incertezza dello stimatore campionario
La determinazione dell’incertezza degli stimatori campionari si conduce tramite lo studio della distribuzione di probabilità della variabile casuale costituita dallo stimatore.

15 Distribuzione della media campionaria

16 distribuzione della media campionaria
estraendo da una popolazione per cui è definita la variabile casuale X avente densità f (x) qualsiasi, media m e varianza s2, un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn }, se n è sufficientemente grande la media campionaria fornisce una variabile casuale distribuita in modo normale, con media m e varianza s2 / n

17 distribuzione della media campionaria
Avendo una popolazione per cui è definita la variabile casuale X con densità f (x) qualsiasi, media m e varianza s2 ed estraendo da essa un campione di n elementi a cui corrisponde l’insieme di vc. { X1, X2, …, Xn }, qual è la probabilità che la media campionaria differisca da m per una quantità minore di ?

18 distribuzione della media campionaria
La risposta al quesito si ottiene individuando la probabilità dell’evento: Tale probabilità è rappresentata dall’area della regione evidenziata in verde nel grafico sopra riportato.

19 distribuzione della media campionaria
il valore ricercato si ottiene da: in cui:

20 distribuzione della media campionaria
il valore ricercato si ottiene da: in cui:

21 distribuzione della media campionaria
sviluppando i calcoli si ottiene: con:

22 distribuzione della media campionaria
esplicitando l’espressione dell’evento si ottiene: è quindi possibile fare la seguente affermazione:

23 distribuzione della media campionaria
estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale X con densità f (x) qualsiasi, media m e varianza s2, c’è una probabilità pari a 0,68 che la media campionaria appartenga all’intervallo

24 distribuzione della media campionaria
Ricordiamo che: la “probabilità” dell’evento: è uguale alla “confidenza” con cui posso affermare:

25 distribuzione della media campionaria
che può essere tradotta nelle seguenti affermazioni: estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale X con distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a 0,68 che un intervallo di ampiezza centrato sul valore della variabile casuale “media campionaria” contenga il valore della media m della popolazione.

26 intervallo di confidenza per la media
estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale X con distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a 0,68 che l’intervallo casuale contenga il valore della media m . questo intervallo viene chiamato: intervallo di confidenza allo 0,68 per la media

27 intervallo di confidenza allo ( 1 – a ) per la media
in generale, se sono i quantili a/2 e 1 – a/2 per la media campionaria

28 intervallo di confidenza allo ( 1 – a ) per la media
con una confidenza pari a 1 – a possiamo affermare che

29 Proprietà della media campionaria
teorema 4.4: dato un campione di n elementi prelevato senza ripetizione da una popolazione composta da N elementi per cui è deifinita la variabile casuale X, posto : si ha:

30 Distribuzione della media campionaria se n ≈ N
se il numero n degli elementi del campione non è molto minore della numerosità N (finita) della popolazione.

31 Attenzione alla numerosità del campione !!!

32 Dalla lezione 4: Distribuzione della media campionaria

33 Dalla lezione 4: Distribuzione della media campionaria
teorema 4.3: Sia data una popolazione su cui è definita una variabile causale X con densità f (x) ed avente media m e varianza s 2 finite. Detta: la media campionaria di un campione casuale di dimensione n estratto da essa, allora, al tendere di n ad infinito, la media campionaria - segue una distribuzione normale - con media m e varianza s 2 / n - qualunque sia la distribuzione della popolazione

34 Dalla lezione 4: Distribuzione della media campionaria
La possibilità di costruire un campione di dimensione n che tende all’infinito è ovviamente solo teorica, ma l’enunciato del teorema deve essere inteso nel senso che: quanto più il campione è numeroso, tanto meglio la distribuzione della media campionaria approssima una distribuzione normale con media m e con varianza s 2 / n in pratica si può ritenere che un valore di n non inferiore a 30 sia già sufficiente per approssimare la distribuzione della media campionaria con quella normale con media m e con varianza s 2 / n.

35 la caratteristica comune di una popolazione e il suo modello probabilistico: la distribuzione “normale”

36 la caratteristica comune di una popolazione e il suo modello probabilistico: la distribuzione “normale”

37 la caratteristica comune di una popolazione e il suo modello probabilistico: la distribuzione “normale” Il modello basato sulla distribuzione “normale” può essere usato per descrivere l’andamento della caratteristica comune di una popolazione quando i valori assunti da tale caratteristica sono determinati dalla azione di molteplici cause che agiscono indipendentemente le une dalle altre

38 Distribuzione della media campionaria
Sia data una popolazione su cui è definita una variabile causale X con distribuzione normale, media m e varianza s 2 finite. Detta: la media campionaria di un campione casuale di dimensione n estratto da essa, allora, per qualsiasi n, la media campionaria - segue una distribuzione normale - con media m e varianza s 2 / n

39 dalla media campionaria alla media campionaria standardizzata

40 intervallo di confidenza per la media
Ricordiamo che: la “probabilità” dell’evento: è uguale alla “confidenza” con cui posso affermare:

41 Dalla media campionaria alla media campionaria standardizzata
nota: La determinazione del valore della probabilità di un evento analogo a quelli studiati richiede il calcolo di un integrale definito in cui figurano, oltre agli estremi di integrazione, tre parametri variabili in funzione della popolazione e del campione che ne viene estratto: i valori della media m e della varianza s2 della popolazione e la numerosità n del campione estratto. Ciò rende di fatto impossibile fornire in forma tabulare i valori di probabilità degli eventi. Per questi motivi si introduce la versione standardizzata della media campionaria.

42 Dalla media campionaria alla media campionaria standardizzata
Considerazioni già fatte ci permettono di affermare che la media campionaria, sotto determinate ipotesi, segue una distribuzione normale con media m e varianza s2 / n è quindi facile costruire una variabile casuale con distribuzione normale standard, cioè con media nulla e varianza unitaria.

43 Dalla media campionaria alla media campionaria standardizzata
Considerazioni già fatte ci permettono di affermare che la media campionaria, sotto determinate ipotesi, segue una distribuzione normale con media m e varianza s2 / n è quindi facile costruire una variabile casuale con distribuzione normale standard, cioè con media nulla e varianza unitaria.

44 Dalla media campionaria alla media campionaria standardizzata
La probabilità che il valore della variabile Z sia compreso fra gli estremi a e b: si può facilmente ricavare dalle tabelle che ogni libro di probabilità e statistica riporta.

45 Intervallo di confidenza a (1 – a ) : media campionaria standardizzata
se indichiamo con z1-a/2 il quantile 1 - a/2 della variabile Z : pertanto :

46 Intervallo di confidenza a (1 – a ) : media campionaria standardizzata
Per la simmetria della distribuzione della variabile Z : da cui :

47 Intervalli di confidenza a (1 – a ) : media campionaria standardizzata
se esplicitiamo la variabile Z:

48 Intervalli di confidenza a (1 – a ) : media campionaria standardizzata
da cui:

49 Intervalli di confidenza a (1 – a ) : media campionaria standardizzata
Esaminiamo l’evento di cui abbiamo determinato la probabilità:

50 Intervalli di confidenza a (1 – a ) : media campionaria standardizzata
da cui, con passaggi algebrici:

51 Intervalli di confidenza a (1 – a ) : media campionaria standardizzata
La probabilità: è uguale alla confidenza con cui possiamo affermare che:

52 Intervalli di confidenza a (1 – a ) : media campionaria standardizzata
possiamo quindi sostenere che: estraendo a caso un campione di n elementi da una popolazione per cui è definita una variabile casuale X con distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a 1 - a che l’intervallo casuale con Z variabile normale standard e con z1-a/2 il valore del suo quantile (1 - a/2) contenga il valore della media m per l’intera popolazione. I1-a è l’intervallo di confidenza allo 1 - a per la media

53 Attenzione alla numerosità del campione !!!

54 Dalla lezione 4: Distribuzione della media campionaria

55 Dalla lezione 4: Distribuzione della media campionaria
teorema 4.3: Sia data una popolazione distribuita con densità f (x) ed avente media m e varianza s 2 finite. Detta: la media campionaria di un campione casuale di dimensione n estratto da essa, allora, al tendere di n ad infinito, la media campionaria - segue una distribuzione normale - con media m e varianza s 2 / n - qualunque sia la distribuzione della popolazione

56 Dalla lezione 4: Distribuzione della media campionaria
La possibilità di costruire un campione di dimensione n che tende all’infinito è ovviamente solo teorica, ma l’enunciato del teorema deve essere inteso nel senso che: quanto più il campione è numeroso, tanto meglio la distribuzione della media campionaria approssima una distribuzione normale con media m e con varianza s 2 / n in pratica si può ritenere che un valore di n non inferiore a 30 sia già sufficiente per approssimare la distribuzione della media campionaria con quella normale con media m e con varianza s 2 / n.

57 Campioni con bassa numerosità n < 30
W.S.Gosset – “ Student ” Campioni con bassa numerosità n < 30

58 Distribuzione t di Student con n-1 g.d.l.
La variabile casuale in cui: Z è una variabile casuale normale standardizzata, c2 è una variabile chi-quadro con n-1 gradi di libertà, Z e c2 sono indipendenti l’una dall’altra, segue una distribuzione t di Student con n-1 gradi di libertà

59 Distribuzione t di Student con n-1 g.d.l.

60 Distribuzione t di Student con n-1 g.d.l.

61 Distribuzione t di Student con n-1 g.d.l.
segue una distribuzione t di Student con n-1 gradi di libertà

62 Distribuzione t di Student con n g.d.l.

63 Distribuzione della media campionaria standardizzata per n finito
teorema 5.1: estraendo a caso un campione di numerosità n finita da una popolazione su cui è definita una variabile casuale X con distribuzione normale e media m, la variabile casuale segue una distribuzione t di Student con n-1 gradi di libertà

64 Intervalli di confidenza: media campionaria standardizzata con n finito
La distribuzione t di Student è simmetrica rispetto allo 0, pertanto gli intervalli di confidenza sono centrati sul valore dello stimatore

65 Intervalli di confidenza: media campionaria standardizzata con n finito
se indichiamo con t1-a/2 il quantile 1-a/2 della variabile T :

66 Intervalli di confidenza: media campionaria standardizzata con n finito
se esplicitiamo la variabile T:

67 Intervalli di confidenza: media campionaria standardizzata con n finito
da cui:

68 Intervalli di confidenza: media campionaria standardizzata con n finito
dall’evento sopra riportato, con passaggi algebrici, si ricava:

69 Intervalli di confidenza: media campionaria standardizzata con n finito
La probabilità: è uguale alla confidenza con cui possiamo affermare che:

70 Intervalli di confidenza: media campionaria standardizzata con n finito
possiamo quindi sostenere che: estraendo a caso un campione con n finito da una popolazione per cui è definita una variabile casuale X con distribuzione normale c’è una probabilità pari a 1 - a che l’intervallo casuale in cui t1-a/2 è il valore del quantile (1 - a/2) di una variabile T distribuita secondo la t di Student con n -1 g.d.l contenga il valore della media m della popolazione.

71 Intervalli di confidenza: media campionaria standardizzata con n finito
è l’intervallo di confidenza allo 1 - a per la media m nel caso di campioni di ridotta numerosità estratti da popolazioni con distribuzione normale!

72 Distribuzione t di Student con n-1 g.d.l.
La variabile casuale in cui: Z è una variabile casuale normale standardizzata, c2 è una variabile chi-quadro con n-1 gradi di libertà, Z e c2 sono indipendenti l’una dall’altra, segue una distribuzione t di Student con n-1 gradi di libertà

73 Stime per punti e per intervalli della varianza
La prossima puntata… Stime per punti e per intervalli della varianza


Scaricare ppt "Lezione 6 Inferenza statistica"

Presentazioni simili


Annunci Google