La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Presentazioni simili


Presentazione sul tema: "LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana."— Transcript della presentazione:

1

2 LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale Media Mediana Moda 373.2Misure di dispersione Campo di variazione (Range) Campo di variazione inter quartile (Range inter quartile) Varianza e Deviazione standard Coefficiente di variazione 413.3Dati raggruppati Media raggruppata Varianza raggruppata 433.4Disuguaglianza di Chebychev 443.5Altre applicazioni 483.6Esercizi

3 Sintassi Media aritmetica Media aritmetica Media Geometrica Media Geometrica Media Armonica Media Armonica mediana moda STATISTICA DESCRITTIVA frattili e percentili frattili e percentili intervallo di variazione varianza deviazione standard intervallo interquartile Obiettivi della lezione: CENTRO DI UNA DISTRIBUZIONE quale misura di posizione usare?

4 Colore degli occhi Stato civile Gruppo Sanguigno Peso Statura Numero di componenti Caratteri qualitativi Caratteri quantitativi

5 Frequenza assoluta: Si considerino N=60 dati da analizzare. I dati vengono suddivisi in un numero M=8 opportuno di classi; per ogni classe si ha, per j=1,2,…,M, Frequenza relativa: Sintassi (1) Dato un insieme di N elementi {x 1, x 2,... x N } n j numero di elementi di tipo j-esimo

6 Si dice media aritmetica semplice di N numeri il numero che si ottiene dividendo la loro somma per N. dato un insieme di n elementi {x 1, x 2,... x N } Centro di una distribuzione Centro di una distribuzione

7 Si dice media aritmetica pesata dato un insieme di m elementi {x 1, x 2,... x m }, e dato un insieme di m di numeri reali {p 1, p 2,... p m } che utilizza un peso p j o la frequenza di ogni dato x j per j=1,…,m

8 La media della lunghezza di un gruppo di f 1 = 7 neonati m 1 =48.0 cm e di altri f 2 = 3 neonati m 2 =49.5 cm. Per calcolare la media delle lunghezze dell'insieme totale di 10 neonati pur senza avere la conoscenza dei valori delle lunghezze individuali, si utilizzano le proprietà della media aritmetica : la somma delle lunghezze dei primi 7 è 48.0×7 = la somma delle lunghezze dei secondi 3 è 49.5×3 = la somma delle lunghezze di tutti i 10 è = La media della lunghezza di tutti i 10 neonati è = 484.5/10 = Ovvero Media = (f 1 ×m 1 + f 2 ×m 2 )/(f 1 + f 2 ) Media = (7× ×49.5)/(7+3) Esempio di media pesata

9 la media aritmetica dei primi 6 valori di lunghezza di 6 neonati è: = ( )/6 = 305.2/6 = la media aritmetica di tutti i 60 valori di lunghezza è: = ( …+53.8)/60 = /60 = La media aritmetica di N dati distinti è … esempio di media aritmetica esempio di media aritmetica Lunghezza(cm) in un campione di 60 neonati

10 MEDIA per dati raggruppati in classi limiti di classe xixi f(x j ) x i f(x j ) ALTEZZA(cm) di un campione di 60 neonati. Nell'esempio del campione di 60 misure di lunghezza dei neonati: La media per dati raggruppati in m classi è … se f(x i ) indica le frequenze assolute, se f(x i ) indica le frequenze relative. dove m è il numero di classi e, oppure

11 Dalla definizione consegue che la somma degli scarti di ogni elemen- to del campione dalla media aritmetica è 0: In questo senso la media rappresenta il baricentro della distribuzione. Per molte variabili ( es.: statura adulta, emoglobinemia ), il baricentro si trova dove si addensano i valori e si può considerare un valore tipico della variabile. proprietà della media aritmetica Nota: valgono anche le seguenti relazioni:

12 Media Aritmetica Per effettuare la correzione di errori accidentali. Permette di sostituire i valori di ogni elemento senza cambiare il totale. Sostituzione di valori NULL Monotona crescente

13 Si dice mediana il valore che occupa il posto centrale in una distribuzione statistica di frequenza i cui valori sono disposti in ordine crescente La media aritmetica è la misura di posizione più usata ma. A volte, altre misure come la mediana e la moda si dimostrano utili. … centro di una distribuzione : LA MEDIANA … centro di una distribuzione : LA MEDIANA

14 Si consideri un campione di valori di VES (velocità di eritrosedimen-tazione, mm/ora) misurati in 7 pazienti {8, 5, 7, 6, 35, 5, 4} In questo caso, la media ( = 10 mm/ora) non è un valore tipico della distribuzione: soltanto un valore su 7 è superiore alla media! Per calcolare la mediana si dispongono i dati in ordine crescente: ordine originale:{8, 5, 7, 6, 35, 5, 4} ordine crescente:{4, 5, 5, 6, 7, 8, 35} media aritmetica e mediana media aritmetica e mediana Conviene usare come indice del centro la mediana, definita come quel valore che divide a metà la distribuzione, sicché l'insieme dei valori è per metà minore e per metà maggiore della mediana.

15 Se n è dispari, la mediana è il valore che occupa la posizione (n+1)/2 nell'insieme ordinato. Nell'esempio, poich é (n+1)/2=4, la mediana è 6 mm/ora, ed è tipica nel senso che si avvicina a buona parte dei valori del campione. Se n è pari, la mediana è la media dei valori che occu ­ pano le posizioni (n/2) ed [(n/2)+1] nell'insieme ordinato dei numeri. Se, nell'esempio, si esclude il valore più alto, si ottiene l'insieme ordinato {4, 5, 5, 6, 7, 8}, (n/2)=3 e [(n/2)+1]=4, e la mediana vale (5+6)/2=5.5. mediana

16 La mediana è semplicemente il dato centrale della distribuzione. Dopo aver disposto i dati in ordine crescente la mediana è quel valore che lascia alla sua sinistra e alla sua destra un ugual numero di termini mediana non è tra 54.5 e 49.5 cm di lunghezza [=( )/2= 52.0]

17 Il 30° e il 31° valore nella serie ordinata è di 50.5 e 50.5 giorni: la mediana è perciò 50.5 Nota Bene La mediana NON è il valore intermedio tra i valori di lunghezza del 30 mo e 31 mo neonato esaminato, ma il valore intermedio tra la 30ª e 31ª osserva- zione, dopo aver ordinato i dati in verso crescente. mediana

18 limiti di classeXjXj f(x j ) NjNj F(x j ) Mediana= Mediana per dati raggruppati in classi Mediana per dati raggruppati in classi

19 x j-1 xjxj ? wjwj interpolazione lineare della MEDIANA

20 Mediana== Mediana per dati raggruppati in classi Mediana per dati raggruppati in classi

21 Una delle leggi fondamentali della fisiologia afferma che la risposta eccitatoria di un organismo ad uno stimolo è proporzio-nale al logaritmo dello stimolo: Legge di Weber-Fechner:Risposta log(stimolo) Tale legge è valida anche in altri ambiti, quali la farmaco­logia (l'effetto di un principio attivo è proporzionale non alla sua dose ma al logaritmo della dose), la microbiologia, l'enzimologia e l'immunologia. Media geometrica Media geometrica

22 Si riportano i valori (ng/ml) di concentrazione minima di penicillina-G inibente la Neissaria gonorrhoeae (MIC) presente nell'urina di 7 pazienti: {31.25, 62.5, 125, 250, 500, 1000, 2000}. Tali dati risentono del fatto che il metodo di determinazione della MIC è basato su diluizioni (1:1) successive della concentrazione iniziale di penicillina G (si noti che la differenza tra e 62.5 è la metà di quella tra 62.5 e 125, e così via). Esempio di media geometrica Esempio di media geometrica In scala logaritmica,invece, le differenze tra le concentrazioni log 10 (MIC) sono uguali: {1.495, 1.796, 2.097, 2.398, 2.699, 3.000, 3.301} e la media aritmetica dei logaritmi è (2.398) e coincide con il logaritmo della mediana La media aritmetica (566.96) risente dei valori più alti ed è più del doppio della mediana (250).

23 Neisseria gonorrhoeae Neisseria gonorrhoeae (NG) is a Gram-negative diplococcus that commonly infects the mucosa of the urethra, cervix, rectum, and throat. It frequently presents as an uncomplicated, symptomatic infection at one or more of these sites. In women, untreated lower genital tract infection, which more often may be asymptomatic, may progress to pelvic inflamma-tory disease (PID). Repeated cases of PID increase the risk for chronic pelvic pain, ectopic pregnancy, and infertility

24 Si dice media geometrica l'antilogaritmo della media aritmetica dei logaritmi: Media geometrica Media geometrica

25 Dalla definizione di logaritmo si ricava che la media geometrica di n valori si può calcolare come radice n-ma del loro prodotto: Nell'esempio: antilog10(2.398)= dove la differenza è dovuta ad errori di arrotondamento.

26 Tasso di incremento di colture di batteri Se il tasso di incremento in 4 giorno consecutivi risulta pari a 1.75, 2.0, 1.5, 1.25, quale è il tasso medio di incremento? Giorno1234 Tasso incr N° batt eff N° batt calc

27 media di N proporzioni Esempio: P 1 = 0.1% ed P 2 =0.05% ovvero P 1 =1/10 e p 2 =1/20 hanno media aritmetica 3/40 ovvero P MEDIA = La Media armonica MH e = 1/15 … centro di una distribuzione : Media Armonica … centro di una distribuzione : Media Armonica

28 Media Armonica: Costo medio di prodotti confezionati Avendo speso 24 euro nellacquisto di confezioni del costo di 4 euro, ed altrettanto per lacquisto di confezioni del costo di 6 euro ed ancora per lacquisto confezioni del costo di 8 euro. Quale sarà il prezzo medio globale?

29 Problema di Briatore Una macchina da corsa esegue un giro di pista a 100 km/ora ed un secondo giro di pista a 300 km/ora. Qual è stata la sua velocità media ? A voi la risposta … … … … …

30 Problema di Briatore risposta) Una macchina da corsa esegue un giro di pista a 100 km/ora ed un secondo giro di pista a 300 km/ora. Qual è stata la sua velocità media ? A voi la risposta … 2/(1/100+1/300)= 150… … … …

31 Media Armonica (Una gita in montagna ) Ieri è partito alle 3 del pomeriggio ha fatto un bel tratto piano, poi è salito su un monte, ne è ridisceso ed è ritornato a casa alle 9 di sera senza fermarsi. Nei tratti piani avanza a 8 chilometri l'ora ed è facile stargli dietro, ma anche su una salita ripida, come quella di ieri, mantiene una media di 6 km/h. In discesa, poi allunga il passo e fa 12 Km/ora, senza stancarsi mai. Quanti chilometri era lunga la gita di mio suocero ? A che ora era sulla cima del monte (mezz'ora più o meno)? Mio suocero è un buon camminatore. È capace di fare gite lunghissime cammi- nando sempre con quel suo passo svelto ed instancabile. Ieri …

32 Risposte & riflessioni (Una gita in Montagna ) Supponiamo che la salita fosse di 6 km. Avrebbe impiegato un'ora a salire e mezz'ora a scendere. Quindi nel tratto in salita/discesa avrebbe percorso 12 km in un'ora e mezza. La sua velocità media, quindi sarebbe stata di 8 km/h, come sul piano. Pertanto lui ha camminato sempre ad una velocità media di 8km/h. Partito alle tre e tornato alle nove di sera, ha camminato per 48 km. Se il tratto fosse stato tutto piano, si sarebbe trovato a tornare indietro dopo 3 ore. Se il tratto fosse stato tutto in salita si sarebbe trovato a tornare indietro dopo 4 ore. Pertanto, se diciamo che dopo 3 ore e mezza era sulla cima, abbiamo risposto correttamente. Per gli amanti della statistica ed i cultori di Chisini e della sua splendida defi- nizione di media, la velocità media nel tratto in salita e discesa si calcola con la media armonica, se vogliamo che la velocità media conservi i tempi di percorrenza.

33 INFINE PER CHI NON è CONVINTO La gita è lunga 48 km = x (in piano) + y (in salita) DATI Spazio = vel*t, t = spazio / vel e vel=Spazio/tempo t1=x/8 t2=y/6 8*t1+6*t2+12*(t2/2)+8*t1=48 ovvero 4*t1+3*t2=12 quindi t2=(12-4*t1)/3 t1t2t1+t /3 10/3 1 8/3 11/ Y X

34 Una distribuzione può essere descritta per mezzo dei suoi frattili. Si dice frattile (sinonimi: centile, percentile e quantile) p-esimo di una distribuzione quel valore xp tale che la frequenza relativa cumulata F(x p )= p. Ad esempio, il 50° centile di una distribuzione è il valore che, sull'asse dei numeri reali, ha alla sua sinistra il 50% dei valori della distribuzione, e coincide con la mediana. Il 10° centile è il valore che ha alla sinistra il 10% della distribuzione. Frattili di una distribuzione Frattili di una distribuzione

35 Nei grafici cumulati, i valori riportati sull'asse verticale indicano la frequenza delle rilevazioni con valore pari o minore ai valori in corrispondenza sull'asse orizzontale

36 calcolo dei frattili Per il frattile di una seriazione di frequenza si ricorre all'interpolazione lineare x j-1 e x j sono i limiti inferiore e superiore della classe … F(x j ) e F(x j-1 ) sono le frequenze cumulate della classe … e della classe contigua precedente f(x j )= F(x j )-F(x j-1 ) è la frequenza della classe … w j = x j - x j-1 è l'ampiezza della classe… … classe j che contiene il frattile ricavabile dalla proporzione:

37 una distribuzione in breve Un insieme di dati può essere descritto con 5 frattili: la mediana, i quartili 1° e 3°, e due centili estremi (es.: il 10° ed il 90°). Si danno così indicazioni su localizzazione, dispersione e forma della distribuzione. limiti di classexjxj f(x j ) NjNj F(x j )

38 Con riferimento all'esempio delle lunghezze dei neonati: 25 ° centile= 1° quartile 10° centile 75°centile= 3° quartile 90° centile 50°centile= mediana

39 Un indice di dispersione di uso comune è l'intervallo interquartile, dato dalla differenza tra 3° e 1° quartile (cioè tra 75° e 25° centile): tale intervallo contiene la metà dei valori inclusi nel campione, indipendentemente dalla forma della distribuzione della variabile. l'intervallo interquartile

40 Lefficienza e la immediatezza delle distribuzioni cumulative Il primo quintile 40 verso 54 anni per il tumore al seno verso il tumore allovaio

41 Si dice moda di una distribuzione statistica di frequenza il valore che compare con la massima frequenza … centro di una distribuzione : La Moda … centro di una distribuzione : La Moda

42 Più di rado si incontra una terza misura di posizione, la moda; è il valore che si verifica più spesso (frequenza assoluta più elevata); la modalità della variabile in cui si registra il maggior numero di casi. Quanto sono usualmente lunghi i bimbi alla nascita? Guardando i dati a nostra disposizione, è subito evidente maggior numero (16) di bimbi è lungo tra i 50.3 cm e i 51.7 cm. la classe modale è dunque Se la distribuzione ha più di due valori massimi o se la frequenza più alta riscontrata nellinsieme considerato non supera di molto le altre la moda non è un buon indicatore di tendenza centrale. La Moda La Moda

43 amp = ampiezza della classe modale. x inf = limite inferiore della classe modale La moda di seriazioni statistiche

44 Lunghezza supina (cm) in un campione di 60 neonati. Valori ottenuti con l'infantometro Harpenden. La moda EstremiValoreFreq SempliciFreq cumulate di classeCentralen%n% Nella classe , piu vicino alla casse con freq=14

45 Il proprietario di una ditta afferma "Lo stipendio mensile nella nostra ditta è euro" Il sindacato dei lavoratori dice che lo stipendio medio è di euro. L'agente delle tasse dice che lo stipendio medio è stato di euro. Queste risposte diverse sono state ottenute tutte dai dati della seguente tabella. A quale misura di tendenza centrale ci riferiamo? Stipendio mensile N° di lavoratori Media aritmetica= lire Mediana = lire Moda= lire quale misura di posizione usare? quale misura di posizione usare?

46 interpretazione delle misure di posizione La media aritmetica indica che, se il denaro fosse distribuito in modo che ciascuno ricevesse la stessa somma, ciascun dipendente avrebbe avuto euro La moda ci dice che la paga mensile più comune è di euro La moda si considera spesso come il valore tipico dell'insieme di dati poiché è quello che si presenta più spesso. Non tiene però conto degli altri valori e spesso in un insieme di dati vi è più di un valore che corrisponde alla definizione di moda. La mediana indica che circa metà degli addetti percepiscono meno di euro, e metà di più. La mediana non è influenzata dai valori estremi eventualmente presenti ma solo dal fatto che essi siano sotto o sopra il centro dell'insieme dei dati.

47 In quale ordine si dispongono le misure di tendenza cetrale ?

48 FINE DELLARGOMENTO MISURE DI TENDENZA CETRALE

49 La percentuale è una misura molto semplice e di facile comprensione Se ci dicono che il 10% della popolazione è composta da Mancini, è facile calcolare che il 90% è costituita da Destrimani Immaginiamo quindi di classificare 1000 adolescenti in accordo alla osservanza delle leggi: Delinquenti o Rispettosi della Legge. 810 Osservanti Destri e 90 Delinquenti Destri, 80 Osservanti Mancini e 20 Delinqunti Mancini A quale misura di tendenza centrale ci riferiamo? DestrimaniMancini Osservanti81080 Delinquenti =10% La tabella non ci aiuta molto a capi- re il fenomeno: appare che siano più delinquenti i destrimani ? quale misura di posizione usare? quale misura di posizione usare?

50 Passiampo alle percentuali A quale misura di tendenza centrale ci riferiamo? DestrimaniManciniTotale Osservanti91% [810]9% [80]100% [900] Delinquenti82% [ 90]18% [ 20]100% [ 100] La tabella ci informa sulla probabilità quale misura di posizione usare? quale misura di posizione usare? Che ha un Osservante di essere mancino Che ha un Delinquente di essere mancino % RIGHE

51 cambiamo il verso della proporzionalità A quale misura di tendenza centrale ci riferiamo? DestrimaniMancini Rispettoso90% [810]80% [80] Delinquente10% [ 90]20% [ 20] Totale100% [900]100% [100] quale misura di posizione utilizzare? quale misura di posizione utilizzare? La tabella ci informa sulla probabilità … Che ha un Destrimano di essere Rispettoso della Legge Che ha un Mancino di essere Rispettoso della Legge % COLONNE

52 Principali indici statistici di posizione di forma di dispersione MODA MEDIANA MEDIA SCARTO QUADRATICO MEDIO VARIANZA RANGE ASIMMETRIA (SKEWNESS) CURTOSI ( KURTOSIS) INDICI

53 Sintassi Preambolo media media mediana moda STATISTICA DESCRITTIVA frattili e percentili frattili e percentili intervallo di variazione varianza deviazione standard intervallo interquartile Obiettivi della lezione: Fine dellargomento

54 Siméon-Denis Poisson ( )


Scaricare ppt "LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana."

Presentazioni simili


Annunci Google