La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

La distribuzione normale e normale standardizzata La disuguaglinaza di Chebischev.

Presentazioni simili


Presentazione sul tema: "La distribuzione normale e normale standardizzata La disuguaglinaza di Chebischev."— Transcript della presentazione:

1 La distribuzione normale e normale standardizzata La disuguaglinaza di Chebischev

2 Presi un insieme di misure {x 1 x 2, …, x N } ed un numero k 1, La proporzione di misure rispetto al totale che distano dal valore medio non più di k volte lo scarto quadratico medio è almeno Il significato di questo teorema si può comprendere con laiuto della figura per la popolazione mostrata il teorema afferma che la proporzione della popolazione che sta nellintervallo da m-ks a m+ks (Larea ombreggiata sotto la curva) deve essere almeno 1- 1 / k 2. Questo è il valore estremo inferiore della proporzione Disuguaglianza di Chebychev

3 Per ogni k 1, sia s la deviazione standard, e sia S k definito come Si ha che : Cioè almeno una frazione dei dati cade nellintervallo Disuguaglianza di Chebychev

4 La regola empirica (distribuzione normale) 99.7% delle osservazioni cadono nellintervallo ( -3sd, +3sd) 95.4% nellintervallo ( -2sd, +2sd) 68.2% nellintervallo ( -sd, +sd) Osservazioni Questa regola si applica a dati continui che hanno una distribuzione normale

5 Contenuti della lezione A livello delle singole osservazioni La distribuzione normale Lo z score La distribuzione normale standardizzata

6 La distribuzione normale Curva simmetrica a forma di campana Media Distribuzione simmetrica e unimodale (media=moda=mediana) Caratterizzata da due parametri indipendenti: media e SD Al variare di questi parametri la curva modifica la sua posizione. La conoscenza di questi 2 parametri permette di calcolare la probabilità degli eventi di interesse.

7 Come varia la forma della curva al variare dei parametri Esempio: Distribuzione delle altezze negli adulti maschi e femmine Maschi Media=175 SD=7 Femmine Media=161 SD= Altezze

8 Esempio: Livello di Frequenza Albumina (numero di pazienti) Livello di albumina nel sangue in 216 pazienti affetti da cirrosi biliare primaria Distribuzione del livello di albumina in pazienti cirrotici n=216 Frequenza Albumina Distribuzione empirica Distribuzione teorica Media: =33.8, Deviazione Standard: =5.9

9 Distribuzione del livello di albumina in pazienti cirrotici n=216 Frequenza Albumina Probabilità empirica ( )/216=0.16 Probabilità teorica (area sotto la curva) Qual è la probabilità di osservare un paziente con valore di albumina superiore o uguale a 40? Qual è la frequenza dei pazienti con valori di albumina ….[Pr(x 40)] Larea totale sotto la curva è pari a 1 Prevede la conoscenza dei valori osservati e delle loro frequenze Prevede la conoscenza della media e della deviazione statndard dei valori Espressione matematica

10 La regola empirica (distribuzione normale) Questa regola si applica a dati continui che hanno una distribuzione normale 99.7% delle osservazioni cadono nellintervallo ( -3sd, +3sd) 95.4% nellintervallo ( -2sd, +2sd) 68.2% nellintervallo ( -sd, +sd) Osservazioni

11 Lo Z score Lo z score è una trasformazione che permette di esprimere il fenomeno di interesse su una scala a- dimensionale. Definizione Lo z score, è la distanza (espressa in termini di deviazioni standard) tra un valore e la media. Esso è calcolato nel seguente modo: z = (x-media) SD Osservazioni

12 Esempio Livello di albumina z-score frequenza 20 ( )/5.9 = ( )/5.9 = ( )/5.9 = ( )/5.9 = ( )/5.9 = ( )/5.9 = ( )/5.9 = ( )/5.9 = ( )/5.9 = ( )/5.9 = ( )/5.9 = ( )/5.9 = ( )/5.9 = ( )/5.9 = ( )/5.9 = ( )/5.9 = ( )/5.9 = ( )/5.9 = Media osservazioni=33.8 sd=5.9 Valori frequenti Valori meno frequenti Osservazioni

13 Valori non comuni Valori comuni Z Se i dati (osservazioni) si distribuiscono normalmente vale la seguente regola: Osservazioni

14 La distribuzione dello z score Data una serie di valori distribuiti normalmente, la trasformazione di ogni osservazione in z score genera una nuova distribuzione: La distribuzione normale La distribuzione normale standardizzata Lo z score calcolato su valori normali si distribuisce normalmente con media zero e SD pari a 1 La normale standardizzata (media=0, sd=1) Osservazioni

15 Area sotto la curva (normale standardizzata) Table 1 Osservazioni

16 99.7% degli z cadono nellintervallo (-3,+3) 95.4% nellintervallo (-2,+2) 68.2% nellintervallo (-1,+1) La regola empirica (distribuzione normale standardizzata) Osservazioni

17 La distribuzione normale standardizzata La distribuzione normale standardizzata è una distribuzione normale con parametri: Media=0, SD=1 Espressione matematica Le probabilità associate ad ogni valore di z sono note (di solite riportate in tabelle). Osservazioni

18 Soluzione a) Calcolo dello z-score Esempio Il livello medio di albumina nel sangue di pazienti con cirrosi biliare è pari a 34.5 g/l con SD pari a 5.84 g/l a) calcolare la probabilità di estrarre un paziente con valore superiore a Pr(x>44.46) b) calcolare la probabilità di estrarre un paziente con valore superiore a 40 Pr(x>40) la probabilità è pari a 1-( ) = (4%) b) Calcolo dello z-score la probabilità è pari a 1-( ) = (17.4%) Osservazioni

19 …la volta scorsa avevamo introdotto il concetto di distribuzione delle media aritmetica … ci eravamo chiesti: quando è affidabile la stima della media calcolata sul campione? … dipende dalla sua distribuzione… … per grandi campioni la distribuzione è normale … con media pari al valore della media della popolazione e deviazione standard pari a SE Campioni


Scaricare ppt "La distribuzione normale e normale standardizzata La disuguaglinaza di Chebischev."

Presentazioni simili


Annunci Google