La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Matematica e statistica Versione didascalica: parte 6 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste.

Presentazioni simili


Presentazione sul tema: "Matematica e statistica Versione didascalica: parte 6 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste."— Transcript della presentazione:

1

2 Matematica e statistica Versione didascalica: parte 6 Sito web del corso http://www.labmat.it Docente: Prof. Sergio Invernizzi, Università di Trieste e-mail: inverniz@units.it

3 1.6. Variabili aleatorie finite Esperimento E Spazio campionario In ogni prova, osservata (misurata) una variabile X Il valore osservato di X dipende da quale degli eventi elementari si verifica nella prova in questione: X è una variabile aleatoria. Nel caso più semplice X assume un numero finito di valori : con corrispondenti probabilità

4 1.6. Variabili aleatorie finite: esempio Nel caso dei due dadi X assume un numero finito di valori : con corrispondenti probabilità

5 1.6. Variabili aleatorie finite: esempio Esperimento E = lancio di due dadi Spazio campionario La v.a. X in questione è nullaltro che una applicazione reale X : R definita sulle coppie = (r, v) dalla formula X( ) = r + v.

6 come massa della controimagine X -1 ({8}) = { in tali che se si attribuisce la massa 1 = 100% a tutto lo spazio Si noti che è possibile interpretare

7 1.6.1. Valore atteso e varianza 80 lanci di un dado truccato: x = {1, 1, 1, 2, 4, 1, 5, 3, 1, 2, 5, 1, 1, 2, 1, 5, 1, 2, 3, 4, 4, 2, 1, 1, 4, 1, 1, 6, 1, 6, 1, 1, 3, 2, 2, 6, 2, 1, 1, 1, 1, 2, 3, 1, 2, 1, 1, 6, 3, 6, 1, 1, 3, 6, 5, 4, 1, 2, 2, 4, 2, 2, 1, 3, 1, 5, 2, 1, 4, 4, 1, 2, 1, 5, 1, 2, 2, 5, 1, 3} calcolo la media aritmetica: m = (1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 3 + 3 + 3 + 3 + 3 + 3 + 3 + 3 + 4 + 4 + 4 + 4 + 4 + 4 + 4 + 4 + 5 + 5 + 5 + 5 + 5 + 5 + 5 + 6 + 6 + 6 + 6 + 6 + 6)/80 = 196/80 = 2.45 x <- floor(1+6*runif(80)^2)

8 (continua) m = (1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 3 + 3 + 3 + 3 + 3 + 3 + 3 + 3 + 4 + 4 + 4 + 4 + 4 + 4 + 4 + 4 + 5 + 5 + 5 + 5 + 5 + 5 + 5 + 6 + 6 + 6 + 6 + 6 + 6) / 80 = (33 1 + 18 2 + 8 3 + 8 4 + 7 5 + 6 6) / 80 = circa

9 (continua) In generale il valore atteso (baricentro) Deviazione standard Varianza (momento di inerzia)

10 4.1. Stime dei parametri Popolazione: X Numero di prove: n Campione aleatorio: Valori osservati: Non confondere con i valori possibili Media campionaria: Il valore osservato della media campionaria viene usato come stimatore della media vera

11 (continua) Stimatore T n di un parametro corretto (unbiased) : E[T n ] = coerente (consistent): lim Var[T n ] = 0 La media campionaria è uno stimatore corretto e coerente della media vera: vedremo che (è un teorema: cf. diapositiva 26) Stimatore o consuntivo: statistic Statistica come scienza: statistics

12 Stima della media di 2 dadi = 7. Facciamo 8 osservazioni m della media campionaria, con diverse dimensioni del campione: n = 5, 10, 50, 200 n = 5 m osservati: 7.60, 6.00, 8.00, 4.60, 7.80, 6.40, 6.80, 8.20 n = 10 m osservati: 6.60, 7.70, 8.70, 5.60, 6.40, 6.80, 7.40, 7.00 n = 50 m osservati: 6.68, 6.42, 7.28, 7.40, 6.96, 6.86, 6.96, 7.48 n = 200 m osservati: 7.15, 6.80, 7.23, 6.98, 7.08, 7.08, 7.07, 6.88 n = 1000 m osservati: 6.94, 6.86, 7.12, 7.01, 6.91, 6.93, 7.02, 7.06

13 n = 25 n = 200n = 100 n = 50 Qui invece rappresentiamo 250 osservazioni m della media campionaria M n, con dimensioni del campione: I valori osservati m della media campionaria M n sono centrati su e tanto meno dispersi quanto più n è grande, …

14 Quindi se n è grande, abbiamo una buona probabilità che un singolo valore osservato m della media campionaria M n (ossia la media aritmetica dei valori osservati del campione) sia una buona stima per La stima è migliore tanto più grande è n (la dimensione del campione).

15 4.2.1 La varianza campionaria Consuntivo varianza campionaria: La varianza campionaria è uno stimatore corretto e coerente della varianza vera (è un teorema: cf. diapositive 27, 28, 29): Se si dividesse per n si otterrebbe uno stimatore distorto (biased = non corretto) in quanto

16 = m n = stima della media Sx = stima della deviazione standard non distorta x = stima della deviazione standard distorta minX, Q 1, Med, Q 3, maxX = riassunto a 5 numeri [ box plot ] minimo primo quartile mediana (almeno il 50%... e almeno il 50%....) terzo quartile massimo [ NB animazione delle schermate ] Stime sulla TI-82 Popolazione X = -ln(rand) n (max 99) valori osservati in L 1 Comando 1-Var Stats L 1 Sulla calcolatrice

17 > x <- -log(runif(99)) > x [1] 0.442406779 1.520114323 0.359739819 1.196004366 1.142232603 0.066834102 [7] 0.948137321 4.632340154 0.122841389 0.725634687 1.002278314 0.731509306 [13] 0.439984155 0.087883367 0.327555402 1.131393955 0.412639758 1.432809035 [19] 0.468903451 2.481204484 0.346950869 0.073592979 0.549544999 0.796314267 [25] 0.237981589 0.432601672 2.591373233 0.273996105 0.268526137 0.031064219 [31] 3.709382632 1.710685905 0.186195443 0.915975775 0.065707763 0.097969750 [37] 1.010956427 1.277979394 0.047300276 1.085035943 0.069276794 1.654436531 [43] 1.046182539 0.991990006 0.314767995 2.068547432 0.120096882 0.478522417 [49] 1.356679765 0.251157440 0.137009917 0.417083051 0.307458761 0.390503350 [55] 1.220112306 1.397272292 1.359575045 3.397626651 0.270470772 0.303111629 [61] 0.586604401 0.419796978 0.586009376 1.145115010 0.472123723 0.531094403 [67] 1.432247566 0.241009211 0.218992103 0.876719352 0.281467705 0.492258877 [73] 2.223455853 0.269832732 0.060091875 0.398964894 1.157393991 2.870695956 [79] 0.115486534 0.255647427 0.556714480 4.165507832 1.140225430 1.054656225 [85] 0.718340727 0.597733568 0.603395773 0.795164795 0.839431267 0.009448098 [91] 0.089948549 0.452019811 0.226443560 2.096750485 2.878146447 1.253159978 [97] 0.756498358 1.250687755 1.910004276 > summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 0.009448 0.272200 0.586000 0.898600 1.177000 4.632000 Stesso esempio con R

18 BoxPlot (riassunto a 5 numeri) Min 1Quart. Mediana 3Quart. Max dati anomali

19 Media vs Mediana Centralità & Dispersione Scale a rapporti: usare preferibilmente Media & Deviazione standard Scale qualitative: usare preferibilmente Mediana & Quartili (riassunto a 5 numeri) (nel Curriculum Vitae inserire boxplot dei voti)

20 1.6.2. Formule per E[X] e Var[X] Valore atteso di aX+b

21 1.6.2. Formule per E[X] e Var[X] Varianza come valore atteso

22 1.6.2. Formule per E[X] e Var[X] Varianza di aX+b Poniamo aX+b al posto di X nella formula precedente

23 1.6.2. Formule per E[X] e Var[X] Valore atteso di X+Y P{ {X = x k } {Y = y j } } = p kj

24 1.6.2. Formule per E[X] e Var[X] Valore atteso di XY per variabili indipendenti P{ {X = x k } {Y = y j } } = p kj = P{X = x k } P{Y = y j } = p k q j

25 1.6.2. Formule per E[X] e Var[X] Varianza di X+Y Per variabili indipendenti: Cov[X,Y] = 0 Varianza di X+Y per variabili indipendenti

26 1.6.2. Formule per E[X] e Var[X] Covarianza zero non implica indipendenza! Lanciamo i due dadi R e V per 100 volte. Valutiamo : La variabile doppia (R, V) La variabile doppia (X,Y) = (R + V, R – V ):

27 1.6.2. Formule per E[X] e Var[X] X = R + V e Y = R – V sono evidentemente v.a. dipendenti (ad esempio se X=12 non puo' che essere Y=0, e se X=11 non puo' che essere Y=1 oppure Y=-1), ma la covarianza è nulla. In generale applicare funzioni X = f(R,V) e Y = g(R,V) a due variabili R e V indipendenti fornisce due variabili dipendenti X e Y con dipendenza di tipo talvolta inaspettato (cf. CD).

28 1.6.2. Formule per E[X] e Var[X]... la covarianza è nulla:

29 Standardizzazione

30 Standardizzazione della media La media campionaria è uno stimatore corretto e coerente

31 La varianza campionaria è uno stimatore corretto

32 La varianza campionaria è uno stimatore corretto

33 La varianza campionaria è uno stimatore coerente Per lo sviluppo del binomio questo richiede il calcolo di Il risultato : Dove si assume finito.


Scaricare ppt "Matematica e statistica Versione didascalica: parte 6 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste."

Presentazioni simili


Annunci Google