Esercitazioni su testi d’esame A cura di Gabriella della Pietra
Esame di statistica di base di Giugno 2010 Argomenti: Variabilità assoluta Variabilità relativa(concentrazione) Regressione Applicazioni della curva normale
Tempo x raggiungere facoltà Esercizio: variabilità assoluta Si è svolta un'indagine sulla classe degli studenti di statistica per sapere quanto impiegano a raggiungere la facoltà dalla propria abitazione. I dati sono raccolti nella tabella sottostante.Studiare con gli opportuni strumenti gli indici di posizione,la variabilità e la forma della distribuzione. Tempo x raggiungere facoltà n. studenti v.c. vc*ni vc2 vc2*ni freq. cum. 0-20 84 10 840 7056 592704 20-40 81 30 2430 6561 531441 165 40-60 44 50 2200 1936 85184 209 60-80 18 70 1260 324 5832 227 tot. 6730 15877 1215161 Q1 1/4N 56,75 Lq1 Σfq1 Fq1 84 c 20 13,5 mediana 1/2N 113,5 Lq1 20 Σfq1 84 Fq1 81 c Med. 27,3 Q3 3/4N 170,25 Lq1 40 Σfq1 165 Fq1 44 c 20 42,4 Moda L1 IΔ1I 84 IΔ2I 3 IΔ1I+IΔ2I 87 c 20 19,3 media 29,65 media dei quad. 5353,13 sqm 66,89 media2 878,98 Var Media dei quad.- media2 4474,15 C.V. Sqm/media 0,44 Sk (Media-mo)/sqm 0,15 asimmetria positiva
Introiti pubblicitari Esercizio: la concentrazione Valutare attraverso l'indice più opportuno la variabilità relativa degli introiti pubblicitari per emittente suddivisi come nella seguente tabella Emittenti Tv Introiti pubblicitari freq.rel. int. Rel pi qi pi-qi pi-pi-1 qi+qi-1 prodotti 1 339 0,11 0,03 0,08 0,003 2 461 0,04 0,22 0,07 0,15 0,10 0,0105 3 697 0,06 0,33 0,13 0,20 0,19 0,0213 4 1320 0,44 0,24 0,36 0,040 5 1524 0,56 0,37 0,12 0,60 0,072 6 1798 0,67 0,52 0,88 0,098 7 1857 0,16 0,78 1,19 0,131 8 1889 0,89 0,83 1,51 0,166 9 1994 0,17 1,00 0,00 1,83 0,201 tot 11879 3,85 1,15 0,742 Σpj 4,00 2,85 Σqj Rgini =0,288366024 Rtrapezi =0,257736341
Esercizio: la regressione La tabella seguente riporta la distribuzione delle età di 10 nonni e dei rispettivi 10 nipoti estratti da una data popolazione Calcolare i coefficienti di regressione e l’intercetta della retta di regressione per y dipendente da x e per x dipendente da y; determinare l’indice di determinazione lineare ed il coefficiente di correlazione Tot.
Esercizio: la curva normale Si assume che la lunghezza del petalo, in una popolazione di piante appartenenti alla specie x, sia una variabile distribuita normalmente con media di 3,2 cm e deviazione standard di 1,8 cm. Qual è sarà la proporzione di piante con una lunghezza del petalo: a) Maggiore di 4,5 cm? b) Maggiore di 1,78 cm? c) Tra 2,9 e 3,6 cm? A)Z=(4,5-3,2)/1,8=0,72 ; area =0,77 da cui p=1-0,77=0,23 x 3,2 4,5 z -∞ (x-μ)/σ=0,72 +∞ B) Z=(1,78-3,2)/1,8=-1,78; Area=0,78 per la simmetria della curva p=0,78 x 1,78 3,2 z -∞ +∞ (x-μ)/σ=-1,78 C) Z1=(2,9-3,2)/1,8=-0,16; area=0,56 Z2=(3,6-3,2)/1,8=0,22; area=0,59 P=0,59-0,56=0,03 x 2,9 3,2 3,6 z -∞ (x-μ)/σ=0,22 +∞ (x-μ)/σ=-0,16
Esame di Statistica - Luglio2010 Argomenti: Indipendenza assoluta Regressione Variabilità assoluta e relativa Curva normale
blu verdi castani neri tot Esercizio: indipendenza assoluta (chi quadro) Su una popolazione di 140 individui si sono rivlevate le distribuzioni congiunte delle modalità dei caratteri colore degli occhi e colore dei capelli.mediante l'indice più opportuno studiare l'associazione fra questi ultimi. Commentare i risultati blu verdi castani neri tot biondi 10 16 8 1 35 rossi 12 12 16 7 47 mori 8 2 22 26 58 tot 30 30 46 34 140 frequenze teoriche blu verdi castani neri tot biondi 7,50 11,50 8,50 35 rossi 10,07 15,44 11,41 47 mori 12,43 19,06 14,09 58 30 46 34 140 contingenze blu verdi castani neri biondi 2,50 8,50 -3,50 -7,50 rossi 1,93 0,56 -4,41 mori -4,43 -10,43 2,94 11,91 CONTINGENZE2 blu verdi castani neri biondi 6,25 72,25 12,25 56,25 rossi 3,72 0,31 19,49 mori 19,61 108,76 8,66 141,95 CONTINGENZE2/nij blu verdi castani neri tot biondi 0,83 9,63 1,07 6,62 18,15 rossi 0,37 0,02 1,71 2,47 mori 1,58 8,75 0,45 10,08 20,86 2,78 18,75 1,54 18,40 41,48 χ2=41,48 φ2= 0,30 Esiste un basso grado di associazione
Esercizio: la regressione Volendo costruire un modello che spieghi il Peso (espresso in kg) in funzione dell’Altezza (espressa in cm) si è osservato un campione di n = 10 studenti della facoltà di Economia; i dati ottenuti sono riportati nella tabella seguente 1)Individuare la retta di regressione con x esplicativa e y dipendente; 2)calcolare l’indice di determinazione lineare; 3)calcolare il coefficiente di correlazione. Commentare brevemente i risultati Covxy=-3,22 varx=39,56 vary=64,94 bxy=-0,0814 axy=94,9 Y=94,9-0,0814X; byx=-0,05; R2=0,004; r=-0,063
Esercizio: variabilità assoluta e relativa Si consideri la seguente distribuzione delle industrie tessili secondo il fatturato annuo in milioni di vecchie lire Fatturato Aziende a.c. vc vc*fr vc2 vc2*fr fr.cum d.f. 300 500 20 200 400 8000 160000 3200000 4000 800 45 650 29250 422500 19012500 65 13500 1500 56 700 1150 64400 1322500 74060000 121 39200 2000 50 1750 87500 3062500 153125000 171 25000 tot 189150 4967500 249397500 Studiare attraverso gli opportuni strumenti la forma, la variabilità assoluta e la variabilità relativa della distribuzione.Commentare brevemente i risultati. media 1106,14 media2 1223546,48 σ 484,68 media quad 1458464,91 σ2 234918,44 c.v. 0,44 Q1 1/4N 42,75 Lq1 500 Σfq1 20 Fq1 45 a 300 651,33 mediana 1/2N 85,5 Lq1 800 Σfq1 65 Fq1 56 a 700 me 1050 Q3 3/4N 128,25 Lq1 1500 Σfq1 121 Fq1 50 a 500 1572,5 Moda L1 500 Δ1 25 Δ2 11 Δ1+Δ2 36 a 300 708,33 sk 0,82 ASIMMETRIA POSITIVA Classi fattur. Freq. v.c. fr.rel Pi intensità intens.rel. Qi Pi-Qi Pi-Pi-1 Qi+Qi-1 prodotti 300 500 20 400 0,12 8000 0,04 0,07 0,00495 800 45 650 0,26 0,38 29250 0,15 0,20 0,18 0,24 0,06295 1500 56 1150 0,33 0,71 64400 0,34 0,54 0,17 0,73 0,24048 2000 50 1750 0,29 1,00 87500 0,46 0,00 1,54 0,44953 tot 171 2,20 189150 0,43 2,55 0,75792 Rgini 0,36 Rtrapezi 0,24208 Esiste un basso grado di concentrazione
-∞ +∞ -∞ +∞ -∞ +∞ Esercizio: applicazioni della curva normale Supponendo che i quozienti d’intelligenza (Q.I.) siano distribuiti normalmente in una popolazione definita con media 100 e deviazione standard 15. Quale proporzione della popolazione avrà un Q.I a)minore di 90? b) maggiore di145? c)compreso tra 120 e 140? a) z=(90-100)/15 P(x<90)= P(z<0,666)=0,2524 25,24% x 90 100 z -∞ +∞ (x-μ)/σ=-0,66 b) z=(145-100)/15 P(x>145)= P(z>3)=0,00135 0,13% x 100 145 z -∞ +∞ (x-μ)/σ=3 c) z1=(120-100)/15=1,333 z2=(140-100)/15=2,666 P(120<QI<140)= P(1,333<z<2,666)=(0,0912-0,0038)=0,0873; 8,73% x 100 120 140 z -∞ +∞ (x-μ)/σ=2,666 (x-μ)/σ=1,333
Esame di statistica di base- sessione di novembre 2009 Argomenti Variabilità assoluta e relativa Regressione Applicazioni della curva normale Domande di teoria a risposta chiusa
Esercizio: variabilità assoluta e relativa Si consideri la seguente distribuzione delle industrie tessili secondo il fatturato annuo in milioni di euro Fatturato Aziende vc vc*nì vc² vc² * ni fr.rel fr. cum fr.dec I D.F xi ni 300 800 50 550 27.500 302.500 15.125.000 0,25 200 500,00 0,10 1500 80 1.150 92.000 1.322.500 105.800.000 0,40 130 150 700,00 0,11 3000 40 2.250 90.000 5.062.500 202.500.000 0,20 170 70 1.500,00 0,03 5000 30 4.000 120.000 16.000.000 480.000.000 0,15 2.000,00 0,02 tot 329.500 803.425.000 1,00 Misurare la variabilità assoluta e relativa con gli opportuni strumenti; determinare la percentuale di aziende con un fatturato superiore a 800 milioni e inferiore a 3 miliardi annui. Moda 1.100 L1 800 Δ1 30 Δ2 40 Δ1+Δ2 70 c 700 Media 1.647,50 Media² 2.714.256,25 Media dei quad. 4.017.125,00 Var 1.302.868,75 Sqm 1.141,43 c.v. 0,69 mediana 1237,50 Q1 550 Q3 2.250 N/2 100 N/4 50 3/4N 150 L1 800 1.500 Σni 130 Fr.mediana 80 Fr.q1 Fr.Q3 40 c 700 500 classi aziende fr.rel Pi valori Intens. Int. Parz. Qi Qi+Qi-1 Pi-Pi-1 (Pi-Pi-1)* centrali parziali relative (Qi+Qi-1) 300 800 50 0,25 550 27.500 0,08 0,27 0,02 1.500 80 0,40 0,65 1.150 92.000 0,28 0,36 0,45 0,16 3.000 40 0,20 0,85 2.250 90.000 0,64 1,08 0,13 0,14 5.000 30 0,15 1,00 4.000 120.000 1,64 0,00 2,00 0,09 0,18 Tot. 200 329.500 0,75 R trapezi= 1 - 0,75= 0,25
Determinare la percentuale di aziende con un fatturato superiore a 800 milioni e quella inferiore a 3 miliardi annui. MEDIA 1.647,50 SQM 1.141,43 X1 800,00 X2 3.000,00 z1==-0,74 Area corrispondente= 0,2704 %= area a sinistra di -0,74 = 0,5 - 0,2714= 0,2296 Area corrispondente a z su tavola area cercata Area da sottrarre x 800 1647,50 Utilizzo la tavola che attraverso la funzione di densità, indica l’area sottesa alla curva compresa fra 0 e z. Prendo quindi in considerazione solo metà della figura che avrà, di conseguenza, un’area pari ad ½. -∞ +∞ z -0,74 Z2= 1,18 Area corrispondente= 0,3810 % = 0,3810+0,50=0,881 Area corrispondente a z su tavola area cercata Area da aggiungere x 1647,50 3000 z -∞ +∞ 1,18
Esercizio: la regressione Data la seguente tabella determinare I parametri delle rette di regressione L’indice di determinazione lineare Il coefficiente di correlazione lineare Xi Yi Xi*Yi X² Y² 160 36,81 5.889,60 25.600,00 1.354,98 152 34,95 5.312,40 23.104,00 1.221,50 261 6,65 1.735,65 68.121,00 44,22 516 110,00 56.760,00 266.256,00 12.100,00 120 32,18 3.861,60 14.400,00 1.035,55 102 16,30 1.662,60 10.404,00 265,69 292 74,68 21.806,56 85.264,00 5.577,10 140 22,00 3.080,00 19.600,00 484,00 479 106,74 51.128,46 229.441,00 11.393,43 424 85,85 36.400,40 179.776,00 7.370,22 2.646 526,16 187.637,27 921.966,00 40.846,70 byx = Cov (xy) = 3,68 Var y ayx = My - Mxbyx -920,67 R² = 0,80280 r 0,90 Var x = M(X)² - (Mx)² 22.183,44 Var y = M(Y)² - (My)² 1.316,23 Cov (xy) = M(XY) - MxMy 4.841,53 bxy = 0,2182 Var x axy = My - bxyMx -5,13
% dei casi compresi tra 125 e 155 Esercizio: applicazioni della curva normale Determinare la percentuale dei casi di un fenomeno distribuito normalmente con µ= 140 e σ2=32 % dei casi minori di 90 Z130 130-140 -1,77 area 0,4616 % a sinistra di - 1,77 è uguale a 0,5-0,4616 0,04 5,66 area cercata x 90 140 z -∞ -∞ +∞ +∞ (x-μ)/σ=-1,77 % dei casi minori di 125 Z125 125-140 -2,65 area 0,4960 % a sinistra di -2,65 è uguale a 0,5-0,4960 0,00400 5,66 area cercata x 125 140 z -∞ +∞ % dei casi compresi tra 125 e 155 Z155 155-140 2,65 area 0,4960 % compresa tra 125 e 155 è uguale a 0,4960+0,4960 0,99 5,66 (x-μ)/σ=-2,65 area cercata x 140 125 155 z -∞ +∞ (x-μ)/σ=2,65 (x-μ)/σ=-2,65