La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Infe 01 - 1 / 71 Lezione 6 Inferenza statistica. Infe 01 - 2 / 71 parte 1 Stime per punti e per intervalli della media.

Presentazioni simili


Presentazione sul tema: "Infe 01 - 1 / 71 Lezione 6 Inferenza statistica. Infe 01 - 2 / 71 parte 1 Stime per punti e per intervalli della media."— Transcript della presentazione:

1 Infe / 71 Lezione 6 Inferenza statistica

2 Infe / 71 parte 1 Stime per punti e per intervalli della media

3 Infe / 71 la media campionaria come strumento di inferenza Si definiscono stimatori quelle statistiche che vengono usate per stimare un parametro o una sua funzione. –I valori ottenuti mediante gli stimatori si dicono stime del parametro. La media campionaria può essere usata come stimatore della media dellintera popolazione essendo uno stimatore corretto e consistente.

4 Infe / 71 il valore ottenuto viene indicato come stima puntuale di estraendo da una popolazione per cui è definita la variabile casuale X avente densità f ( x ) qualsiasi con media e varianza 2 un campione di n elementi a cui corrisponde linsieme di variabili casuali { X 1, X 2, …, X n } si può usare la media campionaria per stimare il valore del parametro relativo allintera popolazione. media campionaria e stima puntuale di

5 Infe / 71 Strumenti di misura e strumenti di inferenza

6 Infe / 71 come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta unincertezza che deve essere quantificata. estraendo da una popolazione per cui è definita la variabile casuale X avente densità f ( x ) qualsiasi con media e varianza 2 un campione di n elementi a cui corrisponde linsieme di variabili casuali { X 1, X 2, …, X n } si può usare la media campionaria per stimare il valore del parametro relativo allintera popolazione. incertezza dello stimatore campionario

7 Infe / 71 incertezza dello strumento di misura Fascia di valore (a meno di 60 ppm)

8 Infe / 71 incertezza dello strumento di misura

9 Infe / 71 incertezza dello strumento di misura

10 Infe / 71 Qual è la probabilità che, estraendo a caso un campione di n elementi dalla popolazione, il valore della media della variabile X per la intera popolazione sia compreso nellintervallo incertezza dello stimatore campionario

11 Infe / 71 Qual è la probabilità che, estraendo a caso un campione di n elementi dalla popolazione, lintervallo casuale contenga il valore della media della variabile X per la intera popolazione? incertezza dello stimatore campionario

12 Infe / 71 Con quale confidenza, dopo aver estratto a caso un campione di n elementi dalla popolazione e calcolato il valore della corrispondente media campionaria, si può affermare che il valore della media della variabile X per la intera popolazione è compreso nellintervallo incertezza dello stimatore campionario

13 Infe / 71 La probabilità dellevento: è uguale alla confidenza con cui posso affermare: incertezza dello stimatore campionario Intervallo di confidenza

14 Infe / 71 incertezza dello stimatore campionario La determinazione dellincertezza degli stimatori campionari si conduce tramite lo studio della distribuzione di probabilità della variabile casuale costituita dallo stimatore.

15 Infe / 71 Distribuzione della media campionaria

16 Infe / 71 estraendo da una popolazione per cui è definita la variabile casuale X avente densità f ( x ) qualsiasi, media e varianza 2, un campione di n elementi a cui corrisponde linsieme di variabili casuali { X 1, X 2, …, X n }, se n è sufficientemente grande la media campionaria fornisce una variabile casuale distribuita in modo normale, con media e varianza 2 / n distribuzione della media campionaria

17 Infe / 71 Avendo una popolazione per cui è definita la variabile casuale X con densità f ( x ) qualsiasi, media e varianza 2 ed estraendo da essa un campione di n elementi a cui corrisponde linsieme di vc. { X 1, X 2, …, X n }, qual è la probabilità che la media campionaria differisca da per una quantità minore di ? distribuzione della media campionaria

18 Infe / 71 La risposta al quesito si ottiene individuando la probabilità dellevento: distribuzione della media campionaria Tale probabilità è rappresentata dallarea della regione evidenziata in verde nel grafico sopra riportato.

19 Infe / 71 il valore ricercato si ottiene da: in cui: distribuzione della media campionaria

20 Infe / 71 distribuzione della media campionaria il valore ricercato si ottiene da: in cui:

21 Infe / 71 sviluppando i calcoli si ottiene: con: distribuzione della media campionaria

22 Infe / 71 esplicitando lespressione dellevento si ottiene: è quindi possibile fare la seguente affermazione: distribuzione della media campionaria

23 Infe / 71 estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale X con densità f ( x ) qualsiasi, media e varianza 2, cè una probabilità pari a 0,68 che la media campionaria appartenga allintervallo distribuzione della media campionaria

24 Infe / 71 distribuzione della media campionaria Ricordiamo che: la probabilità dellevento: è uguale alla confidenza con cui posso affermare:

25 Infe / 71 che può essere tradotta nelle seguenti affermazioni: estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale X con distribuzione qualsiasi, media e varianza 2, cè una probabilità pari a 0,68 che un intervallo di ampiezza centrato sul valore della variabile casuale media campionaria contenga il valore della media della popolazione. distribuzione della media campionaria

26 Infe / 71 intervallo di confidenza per la media estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale X con distribuzione qualsiasi, media e varianza 2, cè una probabilità pari a 0,68 che lintervallo casuale contenga il valore della media. questo intervallo viene chiamato: intervallo di confidenza allo 0,68 per la media

27 Infe / 71 intervallo di confidenza allo ( 1 – ) per la media in generale, se sono i quantili /2 e 1 – /2 per la media campionaria

28 Infe / 71 intervallo di confidenza allo ( 1 – ) per la media con una confidenza pari a 1 – possiamo affermare che

29 Infe / 71 Proprietà della media campionaria teorema 4.4: dato un campione di n elementi prelevato senza ripetizione da una popolazione composta da N elementi per cui è deifinita la variabile casuale X, posto : si ha:

30 Infe / 71 se il numero n degli elementi del campione non è molto minore della numerosità N (finita) della popolazione. Distribuzione della media campionaria se n N

31 Infe / 71 Attenzione alla numerosità del campione !!!

32 Infe / 71 Dalla lezione 4: Distribuzione della media campionaria

33 Infe / 71 Dalla lezione 4: Distribuzione della media campionaria teorema 4.3: Sia data una popolazione su cui è definita una variabile causale X con densità f ( x ) ed avente media e varianza 2 finite. Detta: la media campionaria di un campione casuale di dimensione n estratto da essa, allora, al tendere di n ad infinito, la media campionaria - segue una distribuzione normale - con media e varianza 2 / n - qualunque sia la distribuzione della popolazione

34 Infe / 71 Dalla lezione 4: Distribuzione della media campionaria La possibilità di costruire un campione di dimensione n che tende allinfinito è ovviamente solo teorica, ma lenunciato del teorema deve essere inteso nel senso che: –quanto più il campione è numeroso, –tanto meglio la distribuzione della media campionaria approssima una distribuzione normale con media e con varianza 2 / n –in pratica si può ritenere che un valore di n non inferiore a 30 sia già sufficiente per approssimare la distribuzione della media campionaria con quella normale con media e con varianza 2 / n.

35 Infe / 71 la caratteristica comune di una popolazione e il suo modello probabilistico: la distribuzione normale

36 Infe / 71 la caratteristica comune di una popolazione e il suo modello probabilistico: la distribuzione normale

37 Infe / 71 la caratteristica comune di una popolazione e il suo modello probabilistico: la distribuzione normale Il modello basato sulla distribuzione normale può essere usato per descrivere landamento della caratteristica comune di una popolazione quando i valori assunti da tale caratteristica sono determinati dalla azione di molteplici cause che agiscono indipendentemente le une dalle altre

38 Infe / 71 Distribuzione della media campionaria Sia data una popolazione su cui è definita una variabile causale X con distribuzione normale, media e varianza 2 finite. Detta: la media campionaria di un campione casuale di dimensione n estratto da essa, allora, per qualsiasi n, la media campionaria - segue una distribuzione normale - con media e varianza 2 / n

39 Infe / 71 dalla media campionaria alla media campionaria standardizzata

40 Infe / 71 intervallo di confidenza per la media Ricordiamo che: la probabilità dellevento: è uguale alla confidenza con cui posso affermare:

41 Infe / 71 Dalla media campionaria alla media campionaria standardizzata nota: La determinazione del valore della probabilità di un evento analogo a quelli studiati richiede il calcolo di un integrale definito in cui figurano, oltre agli estremi di integrazione, tre parametri variabili in funzione della popolazione e del campione che ne viene estratto: i valori della media e della varianza 2 della popolazione e la numerosità n del campione estratto. Ciò rende di fatto impossibile fornire in forma tabulare i valori di probabilità degli eventi. Per questi motivi si introduce la versione standardizzata della media campionaria.

42 Infe / 71 Considerazioni già fatte ci permettono di affermare che la media campionaria, sotto determinate ipotesi, segue una distribuzione normale con media e varianza 2 / n Dalla media campionaria alla media campionaria standardizzata è quindi facile costruire una variabile casuale con distribuzione normale standard, cioè con media nulla e varianza unitaria.

43 Infe / 71 Considerazioni già fatte ci permettono di affermare che la media campionaria, sotto determinate ipotesi, segue una distribuzione normale con media e varianza 2 / n Dalla media campionaria alla media campionaria standardizzata è quindi facile costruire una variabile casuale con distribuzione normale standard, cioè con media nulla e varianza unitaria.

44 Infe / 71 Dalla media campionaria alla media campionaria standardizzata La probabilità che il valore della variabile Z sia compreso fra gli estremi a e b : si può facilmente ricavare dalle tabelle che ogni libro di probabilità e statistica riporta.

45 Infe / 71 Intervallo di confidenza a (1 – ) : media campionaria standardizzata se indichiamo con z 1- il quantile 1 - /2 della variabile Z : pertanto :

46 Infe / 71 Intervallo di confidenza a (1 – ) : media campionaria standardizzata da cui : Per la simmetria della distribuzione della variabile Z :

47 Infe / 71 Intervalli di confidenza a (1 – ) : media campionaria standardizzata se esplicitiamo la variabile Z :

48 Infe / 71 Intervalli di confidenza a (1 – ) : media campionaria standardizzata da cui:

49 Infe / 71 Intervalli di confidenza a (1 – ) : media campionaria standardizzata Esaminiamo levento di cui abbiamo determinato la probabilità:

50 Infe / 71 Intervalli di confidenza a (1 – ) : media campionaria standardizzata da cui, con passaggi algebrici:

51 Infe / 71 Intervalli di confidenza a (1 – ) : media campionaria standardizzata è uguale alla confidenza con cui possiamo affermare che: La probabilità:

52 Infe / 71 possiamo quindi sostenere che: estraendo a caso un campione di n elementi da una popolazione per cui è definita una variabile casuale X con distribuzione qualsiasi, media e varianza 2, cè una probabilità pari a 1 - che lintervallo casuale con Z variabile normale standard e con z 1- / 2 il valore del suo quantile ( 1 - /2) contenga il valore della media per lintera popolazione. I 1- è lintervallo di confidenza allo 1 - per la media Intervalli di confidenza a (1 – ) : media campionaria standardizzata

53 Infe / 71 Attenzione alla numerosità del campione !!!

54 Infe / 71 Dalla lezione 4: Distribuzione della media campionaria

55 Infe / 71 Dalla lezione 4: Distribuzione della media campionaria teorema 4.3: Sia data una popolazione distribuita con densità f ( x ) ed avente media e varianza 2 finite. Detta: la media campionaria di un campione casuale di dimensione n estratto da essa, allora, al tendere di n ad infinito, la media campionaria - segue una distribuzione normale - con media e varianza 2 / n - qualunque sia la distribuzione della popolazione

56 Infe / 71 Dalla lezione 4: Distribuzione della media campionaria La possibilità di costruire un campione di dimensione n che tende allinfinito è ovviamente solo teorica, ma lenunciato del teorema deve essere inteso nel senso che: –quanto più il campione è numeroso, –tanto meglio la distribuzione della media campionaria approssima una distribuzione normale con media e con varianza 2 / n –in pratica si può ritenere che un valore di n non inferiore a 30 sia già sufficiente per approssimare la distribuzione della media campionaria con quella normale con media e con varianza 2 / n.

57 Infe / 71 W.S.Gosset – Student Campioni con bassa numerosità n < 30

58 Infe / 71 Distribuzione t di Student con n-1 g.d.l. La variabile casuale in cui: – Z è una variabile casuale normale standardizzata, – 2 è una variabile chi-quadro con n-1 gradi di libertà, – Z e 2 sono indipendenti luna dallaltra, segue una distribuzione t di Student con n - 1 gradi di libertà

59 Infe / 71 Distribuzione t di Student con n-1 g.d.l.

60 Infe / 71 Distribuzione t di Student con n-1 g.d.l.

61 Infe / 71 Distribuzione t di Student con n-1 g.d.l. segue una distribuzione t di Student con n-1 gradi di libertà

62 Infe / 71 Distribuzione t di Student con n g.d.l.

63 Infe / 71 Distribuzione della media campionaria standardizzata per n finito teorema 5.1: estraendo a caso un campione di numerosità n finita da una popolazione su cui è definita una variabile casuale X con distribuzione normale e media, la variabile casuale segue una distribuzione t di Student con n-1 gradi di libertà

64 Infe / 71 Intervalli di confidenza: media campionaria standardizzata con n finito La distribuzione t di Student è simmetrica rispetto allo 0, pertanto gli intervalli di confidenza sono centrati sul valore dello stimatore

65 Infe / 71 Intervalli di confidenza: media campionaria standardizzata con n finito se indichiamo con t 1- il quantile 1- /2 della variabile T :

66 Infe / 71 Intervalli di confidenza: media campionaria standardizzata con n finito se esplicitiamo la variabile T :

67 Infe / 71 Intervalli di confidenza: media campionaria standardizzata con n finito da cui:

68 Infe / 71 Intervalli di confidenza: media campionaria standardizzata con n finito dallevento sopra riportato, con passaggi algebrici, si ricava:

69 Infe / 71 Intervalli di confidenza: media campionaria standardizzata con n finito è uguale alla confidenza con cui possiamo affermare che: La probabilità:

70 Infe / 71 possiamo quindi sostenere che: estraendo a caso un campione con n finito da una popolazione per cui è definita una variabile casuale X con distribuzione normale cè una probabilità pari a 1 - che lintervallo casuale in cui t 1- / 2 è il valore del quantile ( 1 - /2) di una variabile T distribuita secondo la t di Student con n -1 g.d.l contenga il valore della media della popolazione. Intervalli di confidenza: media campionaria standardizzata con n finito

71 Infe / 71 è lintervallo di confidenza allo 1 - per la media nel caso di campioni di ridotta numerosità estratti da popolazioni con distribuzione normale! Intervalli di confidenza: media campionaria standardizzata con n finito

72 Infe / 71 Distribuzione t di Student con n-1 g.d.l. La variabile casuale in cui: – Z è una variabile casuale normale standardizzata, – 2 è una variabile chi-quadro con n-1 gradi di libertà, – Z e 2 sono indipendenti luna dallaltra, segue una distribuzione t di Student con n - 1 gradi di libertà

73 Infe / 71 La prossima puntata… Stime per punti e per intervalli della varianza


Scaricare ppt "Infe 01 - 1 / 71 Lezione 6 Inferenza statistica. Infe 01 - 2 / 71 parte 1 Stime per punti e per intervalli della media."

Presentazioni simili


Annunci Google