La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux.

Presentazioni simili


Presentazione sul tema: "Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux."— Transcript della presentazione:

1 Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

2 Cap 3 es1-5 1.Definire e confrontare media, mediana e moda. 2.In quali casi e preferibile I'utilizzo della media? Delia mediana? Delia moda? 3.Definire a confrontare Ire misure di dispersione utilizzate comunemente: il range, il range interquartile e la deviazione standard. 4.E possibile calcolare misure di sintesi nu­merica per le osservazioni di una distribu­zione di frequenza, nella quale le misurazioni originali non sono più disponibili? Spiegare brevemente. Perché le informazioni di caratteri personale - come il reddito annuo - sono di solito presentate in questo modo? 5.Qual'é l'utilità della disuguaglianza di Chebychev per descrivere una serie di osservazioni? In quali casi e induce possibile utilizzare la regola empirica?

3 Cap 3 es 6 6. E stato condotto uno studio per esami-nare la prognosi a lungo termine di bambini che hanno contratto una meningite batterica acuta, un processo infiammatorio della mem­brane che avvolgono il cervello ed il midollo spinale. Di seguito sono riportati i tempi di insorgenza di paralisi in 13 bambini the hanno partecipato alto studio (10). Le misurazioni espresse in mesi sono: 0,10 0,25 0,50 4 12 12 24 24 31 36 42 55 96. a. Calcolare le scguenti misure di sintesi numerica dei dati: media range mediana range interquartile moda deviazione standard. b. Dimostrare che è uguale a 0.

4 Cap 3 es 7 Nel Massachusetts, otto soggetti riportarono un episodio inspiegato di intossicazione da vitamina D che richiese il ricovero in ospedale; si pensa che questo evento insolito potesse essere il risultato di un'eccessiva aggiunta di vitamina D al latte fresco (11). La tabella di seguito riportata illustra i livelli ematici di calcio e albumina - un tipo di proteina - per ogni soggetto al momento del ricovero in ospedale.

5 I dati - Cap 3 es 7 Albumina<- c( 43, 42, 42,40,42,38,34,42) (g/I) Calcio<-c(2.92,3.84,2.37,2.99,2.67,3.17,3.74,3.44) (mmol/l) summary(Albumina) Min. 1st Qu. Median Mean 3rd Qu. Max. 34.00 39.50 42.00 40.38 42.00 43.00 > summary(Calcio) Min. 1st Qu. Median Mean 3rd Qu. Max. 2.370 2.857 3.080 3.143 3.515 3.840 > quantile(Calcio) 0% 25% 50% 75% 100% 2.3700 2.8575 3.0800 3.5150 3.8400 > quantile(Albumina) 0% 25% 50% 75% 100% 34.0 39.5 42.0 42.0 43.0 >

6 Cap 3 es 7 Calcolare la media, la mediana, la deviazione standard e il range dei livelli di calcio. Calcolare la media, la mediana, la deviazione standard e il range dei livelli di albumina. Nei soggetti sani il range dei valori di calcio 2,12 e 2,74 mmol/l, mentre il range dei livelli di albumina a 32 e 55 g/l. Ritenete che i pazienti colpiti da intossicazione da vitamina D avessero livelli ematici normali di calcio e di albumina?

7 summ,detail albumine ------------------------------------------------------------- Percentiles Smallest 1% 34 34 5% 34 38 10% 34 40 Obs 8 25% 39 42 Sum of Wgt. 8 50% 42 Mean 40.375 Largest Std. Dev. 3.020761 75% 42 42 90% 43 42 Variance 9.125 95% 43 42 Skewness -1.314656 99% 43 43 Kurtosis 3.44875 calcium ------------------------------------------------------------- Percentiles Smallest 1% 2.37 2.37 5% 2.37 2.67 10% 2.37 2.92 Obs 8 25% 2.795 2.99 Sum of Wgt. 8 50% 3.08 Mean 3.1425 Largest Std. Dev..5106788 75% 3.59 3.17 90% 3.84 3.44 Variance.2607929 95% 3.84 3.74 Skewness -.002344 99% 3.84 3.84 Kurtosis 1.874623

8 Cap 3 es 8 E Stato condotto uno studio per confrontare adolescenli di sesso femminile affette da bulimia con adolescenti sane con simile struttura corporea e simile abitudini ajja attivitàò fisica. Di seguito sone riportati i valori relativi all'assunzione calorica giornaliera, in Kcal/kg, per campioni di adolescenti di ciascuno dei due gruppi (12).

9 I DATI di Cap 3 es 8 Adolescenti Bulimichesane 15.918.925.120.730.6 16.019.625.222.433.2 16.521.525.623.133.7 17.021.628.023.836.6 17.622.928.724.537.1 18.123.629.225.337.4 18.424.130.925.740.8 18.924.530.6

10 Cap 3 es 8 1.Calcolare lassunzione ealorica giornaliera (Kcal/Hg) per il gruppo di Adolescenti bulimiche e Adolescenti sane 2.Calcolare il range inter-quartile di ciascun gruppo. 3.Il valore tipico di assunzione calorica giornaliera e maggiore nelle adolescenti affette da bulimia o nelle adolescenti sane? Quale gruppo presenta una maggiore variabilità nelle misurazioni?

11 b<-c( 15.9, 18.9, 25.1, 16.0, 19.6, 25.2, 16.5, 21.5, 25.6, 17.0, 21.6, 28.0, 17.6, 22.9, 28.7, 18.1, 23.6, 29.2, 18.4, 24.1, 30.9, 18.9, 24.5) nb<-c( 20.7, 30.6, 22.4, 33.2, 23.1, 33.7, 23.8, 36.6, 24.5, 37.1, 25.3, 37.4, 25.7, 40.8, 30.6 ) summary(b) Min. 1st Qu. Median Mean 3rd Qu. Max. 15.90 18.25 21.60 22.08 25.15 30.90 > summary(nb) Min. 1st Qu. Median Mean 3rd Qu. Max. 20.70 24.15 30.60 29.70 35.15 40.80

12 Cap 3 es 9 Le Figurc 3.6 c 3.7 illustrano il tasso di mortaliti infantile per 111 Paesi in tre continenti: Africa, Asia ed Europa (13). Il tasso di mortalità infantile di un passe e il numero di decessi in bambini di età inferiore a a 12 mesi in un anno diviso per il numero totale di nati vivi in quell'anno. La Figura 3.6 presenta degli istogranuni che illustrano la distribuzione dei tassi di mortalità infantile per ciascun continence. La Figura 3.7 iliustra Egli stessi dati utilizzando diagrammi di dispersione a una dimensione a diagrammii a scatola.

13

14 Cap 3 es 9 Senza eseguire alcun calcolo, quale continente pensate presenti la media più bassa? Quale la mediana più elevata? Quale la deviazione standard più piccola? Spiegare. Per Africa, vi aspettate che la media e la mediana del tasso di mortalità infantile siano uguali? E in Asia? Perchè si, perché no?

15 Cap 3 es 10 Di seguito sono riportate le distribuzioni di fre- quenza dei livelli di cotinina sierica in un grup- po di fumatori ed in un gruppi di non fumatori (14). Questa misurazioni sane state raccolte in uno studio che ha valutato diversi fattori di rischio per le malattie cardiovascolari.

16 Cap 3 es 10 Livello di cotinina ng/ml FumatoriNon fumatori 0 - 13 14 - 49 50 - 99 100 - 149 150 - 199 200 - 249 250 - 299 300 78 133 142 206 197 220 151 412 3.300 72 23 15 7 8 9 11 totale1.5393.445

17 Cap 3 es 10 ACalcolare la media e la deviazione standard raggruppata per le misurazioni dei livelli di cotinina sierica nei due gruppi. Per I'uItimo intervallo - 300 ng/ml - si assune che il punto medio dell'intervallo sia 340 ng/mI. BIn quale intervallo si riduce il livello di cotinina sierica mediante nei fumatori? E nei non fumatori? CConfrontare Ie distribuzioni dei livelli di cotinina sierica nei fumatori e nei non fumatori.

18 summ fuma [weight=fuma],detail (analytic weights assumed) fuma ------------------------------------------------------------- Percentiles Smallest 1% 78 78 5% 78 133 10% 133 142 Obs 8 25% 151 151 Sum of Wgt. 1539 50% 206 Mean 237.8993 Largest Std. Dev. 118.7884 75% 412 197 90% 412 206 Variance 14110.68 95% 412 220 Skewness.6896045 99% 412 412 Kurtosis 1.990651.summ nonfuma [weight=fuma],detail (analytic weights assumed) nonfuma ------------------------------------------------------------- Percentiles Smallest 1% 3.3 3.3 5% 3.3 7 10% 7 8 Obs 8 25% 8 9 Sum of Wgt. 1539 50% 11 Mean 16.38687 Largest Std. Dev. 18.96492 75% 15 11 90% 23 15 Variance 359.6683 95% 72 23 Skewness 2.59816 99% 72 72 Kurtosis 8.38565

19 3-11 I dati relativi al livelto di zinco sierico in 462 maschi di eta compresa tra 15 e 17 sono rcgistrati net CD ailegato al libro in un file chiamato serzinc (Appendice B, Tabelia B.1); le misurazioni di zinco sierico in microgrammi per decilitro sane registracc nella variabilc zinc (151).

20 zinc 50 51 53 55 56 58 60 60 60 61 61 61 61 62 62 62 62 63 63 63 64 64 64 64 64 65 65 65 66 66 66 67 67 67 67 67 68 68 68 68 69 70 70 70 70 70 70 70 70 70 71 71 71 71 71 71 71 71 71 71 71 72 72 72 72 72 72 72 72 72 72 72 72 72 73 73 73 73 73 73 73 73 73 74 74 74 74 74 74 74 74 74 74 74 74 75 75 75 75 75 75 75 75 75 75 75 75 75 75 75 76 76 76 76 76 76 76 76 76 76 76 76 76 77 77 77 77 77 77 77 77 77 77 78 78 78 78 78 78 78 78 78 78 78 78 79 79 79 79 79 79 80 80 80 80 80 80 80 80 80 80 80 81 81 81 81 81 81 81 81 81 81 82 82 82 82 82 82 82 82 82 82 82 82 82 83 83 83 83 83 83 83 83 83 83 83 84 84 84 84 84 84 84 84 84 84 84 84 84 84 85 85 85 85 85 85 85 85 85 85 85 86 86 86 86 86 86 86 86 86 86 86 86 86 87 87 87 87 87 87 87 87 87 87 88 88 88 88 88 88 88 88 88 88 88 88 88 88 89 89 89 89 89 89 89 89 89 90 90 90 90 90 90 90 90 91 91 91 91 91 91 91 91 91 91 92 92 92 92 92 92 92 92 93 93 93 93 93 93 93 93 93 94 94 94 94 94 94 94 94 94 94 94 95 95 95 95 95 95 95 95 95 95 95 96 96 96 96 96 96 96 96 96 96 97 97 97 97 97 97 97 97 97 98 98 98 98 98 98 98 98 98 99 99 99 99 99 99 100 100 100 100 100 101 101 101 101 101 101 101 102 102 102 102 102 102 102 102 103 103 103 103 103 103 104 104 104 104 104 104 104 105 105 105 105 105 105 105 105 106 106 106 106 106 106 107 107 107 107 107 107 107 108 108 108 108 108 108 108 109 109 110 110 111 111 111 111 112 112 112 113 113 113 114 114 114 114 115 115 115 116 116 116 116 117 117 117 118 118 119 119 121 123 124 125 128 131 135 142 147 151 153

21 3-11 Calcolare la media, la mediana la deviazione standard, il range ed il range inter-quartile dei dati. Utilizzare la disuguaglianza di Chebychev per descrivere la distribuzione dei valori. Quale percentuale di valori ritenete the rientri in 2 deviazioni standard dalla media? E in 3 deviazioni standard dalla media? Quale percentuale dells 462 misura­xioni rientri in questi range? Ritenete che la regoia empirica sia piu efficace delia disuguaglianza di Chebychev per sintetizzare questi; dati? Spiegare.

22

23 summary(zinc) Min. 1st Qu. Median Mean 3rd Qu. Max. 50.00 76.00 86.00 87.94 98.00 153.00 > sum(x) [1] 323 > sum(zinc) [1] 40627 > sum(zinc^2) [1] 3690711 > (sum(zinc^2)-sum(zinc)^2/length(zinc))/(length(zinc)-1) [1] 256.1501 > length(zinc) [1] 462 quantile(zinc) 0% 25% 50% 75% 100% 50 76 86 98 153

24 Cap 3 es 12 Le percentuali di neonati con basso peso alla nascita - peso inleriore a 2300 granuni - in diversi Paesi sono registratc, nel CD ailegato al libro, nella variabilc lowbwt in un file chianuto unicef (13) (Appendices B, Tabella 13.2).

25

26

27

28 Cap 3 es 12 Calcolare la media e la mediana di queste osservazioni. Calcolare la media troncata al 5%. Per questa serie di dati, quale di queste misure numeriche preferite come misura di tendenza centrale? Spiegare.

29 Cap 3 es 13 La concentrazione di nicotina in milligrammi dichiarata da 35 marche di sigarette canadesi e registrate, net CD allegato al libro, nella variabile nicotine in un file chiamato cigarett (16) (Appendice B, Isabella 13.4). Calcolare la media e la mediana delle concentrazioni di nicotina. Disegnare un istogramma delle misurazioni di nicotina. Descrivere la forma della distribuzione dei valori. Quale numero ritenete fornisca la migliore misura di tendenza centrale per quale concentrazioni, la media o la mediana? Spiegare.

30 Cap 3 es 13 [i dati per R] Nicotine<- c(0.30, 1.20, 1.30, 1.00, 1.40, 1.20, 0.10, 0.90, 1.30, 1.10, 1.20, 1.00, 0.90, 1.30, 1.20, 1.30, 0.89, 1.20, 1.30, 0.40, 1.10, 0.40, 0.20, 1.10, 1.30, 1.00, 1.30, 1.30, 1.40, 1.10, 1.20, 1.20, 1.00, 0.50, 0.09)

31 summary(Nicotine) Min. 1st Qu. Median Mean 3rd Qu. Max. 0.0900 0.9000 1.1000 0.9909 1.3000 1.4000

32

33 Cap 3 es 14 Di seguito è illustrata una distribuzione di frequenza che sintetizza i valori di pressione sistolica a riposo in un campione di 35 pazienti con ischemia cardiaca, doe assenza di flusso ematico al cuore (17).

34 Cap 3 es 14 PressioneNumero Sistolica mmHgdi pazienti 115-124 4 125-134 5 135-144 5 145-154 7 155-164 6 165-174 4 175-1845 TOTALE35 Calcolare la media e la deviazione standard raggruppata dei dati. Le 35 misurazioni della pressione sistolica sono registrate nol CD allegato al libro in un file chiamato ischemia (Appendices B, Isabella 13.6); i valori sono registrati nella variabile bp. Calcolare la media e la deviazione standard non raggruppata di questi dati. Le misure di sintesi numerica raggruppate e non raggruppate sono uguali? Perché si o perche no?

35 sbp duration time 170 640 105 128 670 118 150 560 130 148 510 150 160 212 178 154 260 180 175 228 192 140 335 200 140 460 200 120 440 201 172 210 240 178 359 245 122 438 252 158 270 270 132 781 277 130 802 278 175 360 300 140 1775 300 150 524 322 180 441 330 160 1084 345 122 505 360 170 75 375 150 823 386 168 780 440 134 1065 480 160 1080 540 154 308 562 125 860 570 140 60 578 154 765 720 120 396 729 162 328 780 140 540 1200 178 130 1430 Cap 3 es 14

36 Misurazione della velocità della luce Simon Newcomb misur`o il tempo necessario affich´e la luce andasse dal suo laboratorio sul fiume Potomac ad uno specchio alla base del Washington Monument e ritornasse indietro, per una distanza totale di circa 7400 metri. Egli fece 66 misurazioni qui sotto riportate. 28 24 27 30 29 24 22 33 32 33 36 25 36 21 34 29 32 27 26 36 30 27 28 24 28 32 25 29 40 16 28 31 26 28 19 29 26 25 26 22 37 20 24 24 25 26 23 28 32 25 -44 27 32 27 30 28 23 16 29 39 27 36 21 31 -2 23 1. Si rappresenti la distribuzione dei dati mediante un diagramma a scatola. 2. Si stimi la velocita della luce.


Scaricare ppt "Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux."

Presentazioni simili


Annunci Google