La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Matematica e statistica Versione didascalica: parte 6 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste.

Presentazioni simili


Presentazione sul tema: "Matematica e statistica Versione didascalica: parte 6 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste."— Transcript della presentazione:

1

2 Matematica e statistica Versione didascalica: parte 6 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste

3 1.6. Variabili aleatorie finite Esperimento E Spazio campionario In ogni prova, osservata (misurata) una variabile X Il valore osservato di X dipende da quale degli eventi elementari si verifica nella prova in questione: X è una variabile aleatoria. Nel caso più semplice X assume un numero finito di valori : con corrispondenti probabilità

4 1.6. Variabili aleatorie finite: esempio Nel caso dei due dadi X assume un numero finito di valori : con corrispondenti probabilità

5 1.6. Variabili aleatorie finite: esempio Esperimento E = lancio di due dadi Spazio campionario La v.a. X in questione è nullaltro che una applicazione reale X : R definita sulle coppie = (r, v) dalla formula X( ) = r + v.

6 come massa della controimagine X -1 ({8}) = { in tali che se si attribuisce la massa 1 = 100% a tutto lo spazio Si noti che è possibile interpretare

7 Valore atteso e varianza 80 lanci di un dado truccato: x = {1, 1, 1, 2, 4, 1, 5, 3, 1, 2, 5, 1, 1, 2, 1, 5, 1, 2, 3, 4, 4, 2, 1, 1, 4, 1, 1, 6, 1, 6, 1, 1, 3, 2, 2, 6, 2, 1, 1, 1, 1, 2, 3, 1, 2, 1, 1, 6, 3, 6, 1, 1, 3, 6, 5, 4, 1, 2, 2, 4, 2, 2, 1, 3, 1, 5, 2, 1, 4, 4, 1, 2, 1, 5, 1, 2, 2, 5, 1, 3} calcolo la media aritmetica: m = ( )/80 = 196/80 = 2.45 x <- floor(1+6*runif(80)^2)

8 (continua) m = ( ) / 80 = ( ) / 80 = circa

9 (continua) In generale il valore atteso (baricentro) Deviazione standard Varianza (momento di inerzia)

10 4.1. Stime dei parametri Popolazione: X Numero di prove: n Campione aleatorio: Valori osservati: Non confondere con i valori possibili Media campionaria: Il valore osservato della media campionaria viene usato come stimatore della media vera

11 (continua) Stimatore T n di un parametro corretto (unbiased) : E[T n ] = coerente (consistent): lim Var[T n ] = 0 La media campionaria è uno stimatore corretto e coerente della media vera: vedremo che (è un teorema: cf. diapositiva 26) Stimatore o consuntivo: statistic Statistica come scienza: statistics

12 Stima della media di 2 dadi = 7. Facciamo 8 osservazioni m della media campionaria, con diverse dimensioni del campione: n = 5, 10, 50, 200 n = 5 m osservati: 7.60, 6.00, 8.00, 4.60, 7.80, 6.40, 6.80, 8.20 n = 10 m osservati: 6.60, 7.70, 8.70, 5.60, 6.40, 6.80, 7.40, 7.00 n = 50 m osservati: 6.68, 6.42, 7.28, 7.40, 6.96, 6.86, 6.96, 7.48 n = 200 m osservati: 7.15, 6.80, 7.23, 6.98, 7.08, 7.08, 7.07, 6.88 n = 1000 m osservati: 6.94, 6.86, 7.12, 7.01, 6.91, 6.93, 7.02, 7.06

13 n = 25 n = 200n = 100 n = 50 Qui invece rappresentiamo 250 osservazioni m della media campionaria M n, con dimensioni del campione: I valori osservati m della media campionaria M n sono centrati su e tanto meno dispersi quanto più n è grande, …

14 Quindi se n è grande, abbiamo una buona probabilità che un singolo valore osservato m della media campionaria M n (ossia la media aritmetica dei valori osservati del campione) sia una buona stima per La stima è migliore tanto più grande è n (la dimensione del campione).

15 4.2.1 La varianza campionaria Consuntivo varianza campionaria: La varianza campionaria è uno stimatore corretto e coerente della varianza vera (è un teorema: cf. diapositive 27, 28, 29): Se si dividesse per n si otterrebbe uno stimatore distorto (biased = non corretto) in quanto

16 = m n = stima della media Sx = stima della deviazione standard non distorta x = stima della deviazione standard distorta minX, Q 1, Med, Q 3, maxX = riassunto a 5 numeri [ box plot ] minimo primo quartile mediana (almeno il 50%... e almeno il 50%....) terzo quartile massimo [ NB animazione delle schermate ] Stime sulla TI-82 Popolazione X = -ln(rand) n (max 99) valori osservati in L 1 Comando 1-Var Stats L 1 Sulla calcolatrice

17 > x <- -log(runif(99)) > x [1] [7] [13] [19] [25] [31] [37] [43] [49] [55] [61] [67] [73] [79] [85] [91] [97] > summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max Stesso esempio con R

18 BoxPlot (riassunto a 5 numeri) Min 1Quart. Mediana 3Quart. Max dati anomali

19 Media vs Mediana Centralità & Dispersione Scale a rapporti: usare preferibilmente Media & Deviazione standard Scale qualitative: usare preferibilmente Mediana & Quartili (riassunto a 5 numeri) (nel Curriculum Vitae inserire boxplot dei voti)

20 Formule per E[X] e Var[X] Valore atteso di aX+b

21 Formule per E[X] e Var[X] Varianza come valore atteso

22 Formule per E[X] e Var[X] Varianza di aX+b Poniamo aX+b al posto di X nella formula precedente

23 Formule per E[X] e Var[X] Valore atteso di X+Y P{ {X = x k } {Y = y j } } = p kj

24 Formule per E[X] e Var[X] Valore atteso di XY per variabili indipendenti P{ {X = x k } {Y = y j } } = p kj = P{X = x k } P{Y = y j } = p k q j

25 Formule per E[X] e Var[X] Varianza di X+Y Per variabili indipendenti: Cov[X,Y] = 0 Varianza di X+Y per variabili indipendenti

26 Formule per E[X] e Var[X] Covarianza zero non implica indipendenza! Lanciamo i due dadi R e V per 100 volte. Valutiamo : La variabile doppia (R, V) La variabile doppia (X,Y) = (R + V, R – V ):

27 Formule per E[X] e Var[X] X = R + V e Y = R – V sono evidentemente v.a. dipendenti (ad esempio se X=12 non puo' che essere Y=0, e se X=11 non puo' che essere Y=1 oppure Y=-1), ma la covarianza è nulla. In generale applicare funzioni X = f(R,V) e Y = g(R,V) a due variabili R e V indipendenti fornisce due variabili dipendenti X e Y con dipendenza di tipo talvolta inaspettato (cf. CD).

28 Formule per E[X] e Var[X]... la covarianza è nulla:

29 Standardizzazione

30 Standardizzazione della media La media campionaria è uno stimatore corretto e coerente

31 La varianza campionaria è uno stimatore corretto

32 La varianza campionaria è uno stimatore corretto

33 La varianza campionaria è uno stimatore coerente Per lo sviluppo del binomio questo richiede il calcolo di Il risultato : Dove si assume finito.


Scaricare ppt "Matematica e statistica Versione didascalica: parte 6 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste."

Presentazioni simili


Annunci Google