La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Statistica Descrittiva dispersione di una distribuzione Obiettivi della lezione: Media Mediana, Moda Asimmetria, kurtosi Quantili e percentili devianza.

Presentazioni simili


Presentazione sul tema: "Statistica Descrittiva dispersione di una distribuzione Obiettivi della lezione: Media Mediana, Moda Asimmetria, kurtosi Quantili e percentili devianza."— Transcript della presentazione:

1 Statistica Descrittiva dispersione di una distribuzione Obiettivi della lezione: Media Mediana, Moda Asimmetria, kurtosi Quantili e percentili devianza varianza deviazione standard intervallo interquartile

2 sonnoMaschiFemmine Usando SOLO le medie possiamo ingannarci nel confrontare i caratteri di due gruppi di individui. Ad esempio, sappiamo che le donne sono notoriamente diverse dagli uomini sotto molti aspetti Ore di frequenza Diamo un'occhiata alla distribuzione di frequenza della durata di sonno indotto da un anestetico in un campione di pazienti. dispersione di una distribuzione

3 Per facilitare i confronti riportiamo i dati in grafico. Il periodo medio di sonno per le donne risulta di 5 ore così come per gli uomini Se ci soffermiamo solo sulle medie potremmo concludere che le donne hanno una durata di sonno uguale a quello dei maschi. dispersione di una distribuzione

4 D = ( ) ( ) ( ) 2 1 = x i f(x i )x i f(x i ) D = (3022.5) 2 /60 = = Nell'esempio della lunghezza dei neonati: Var= /59 =6.2Deviazione standard = 2.49 calcolo della media e della varianza ( dati in classi ) Media = /60 =

5 esempio della lunghezza dei neonati: Istogramma dei dati

6 Media = 400/80 = 5 Devianza= 620 ; Varianza=Devianza/(N-1)= 620/79 = xixi f(x i ) Σ Deviazione standard= Torniamo allesempio del sonno

7 Media 5 Varianza dev. Stand asimm Kurtosi Mediana 5 quartile 1 3 quartile 3 6

8 i valori assoluti degli scarti, Dato un insieme di n valori: detta la loro media aritmetica e si chiama scarto semplice medio (assoluto) la media aritmetica dei valori assoluti degli scarti semplici di ciascun dato x dalla media aritmetica scarto semplice medio

9 Si definisce varianza di una distribuzione statistica la media aritmetica dei quadrati degli scarti dalla media. Si definisce scarto quadratico medio la radice quadrata della varianza. la varianza

10 Questo numero rappresenta una misura della deviazione dei valori dalla media. Esso ci dice come i valori tendano a disperdersi intorno alla loro media: se la deviazione standard è piccola, indica un fitto addensamento dei valori intorno alla loro media; se è grande indica la presenza di valori molto lontani dalla media. la deviazione standard Per i dati raggruppati in classe => Per i dati singoli =>

11 stima in un campione => Per dati raggruppati in classe => dove Stima della Deviazione standard

12 Deviazione standard

13 Un indice di dispersione di uso comune è l'intervallo interquartile, dato dalla differenza tra 3° e 1° quartile (cioè tra 75° e 25° centile): tale intervallo contiene la metà dei valori inclusi nel campione, indipendentemente dalla forma della distribuzione della variabile. l'intervallo interquartile

14 Obiettivi della lezione: media mediana moda percentili intervallo di variazione devianza varianza deviazione standard intervallo interquartile Indice di simmetria Coefficiente di variazione Sommario della statistica descrittiva

15 ESEMPIO: Come confrontare il vostro peso con quello di altre persone della vostra età? Supponiamo che uno di voi pesi 4 kg oltre la media dei soggetti della sua età: ci sono molti altri, della stessa età, con un peso maggiore, oppure egli è un piccolo gigante? Bisogna conoscere la deviazione standard dei pesi dei ragazzi di quella età, prima di fare un confronto con il peso degli altri. Supponiamo che il peso medio dei ragazzi di quell'età sia 45 kg e che la deviazione standard sia 2 kg: … allora un peso di 49 kg è sopra la media di due deviazioni standard. La deviazione standard è una quantità utile per effettuare confronti.

16 Approfondimento: rivediamo alcune formule ed introduciamo le nozioni di asimmetria (skewness) e di curtosi

17 Principali indici statistici I grafici finora analizzati ci danno informazioni qualitative; possiamo quantificarle ricorrendo ai seguenti indici. Siano n osservazioni numeriche di posizione di forma di dispersione MODA MEDIANA MEDIA SCARTO QUADRATICO MEDIO VARIANZA RANGE ASIMMETRIA (SKEWNESS) CURTOSI ( KURTOSIS) INDICI

18 Indici di posizione: moda E' definita come il valore che ha la frequenza più alta. E' quel valore al di sotto del quale cadono la metà dei valori campionari. mediana E' quel valore che corrisponde alla somma di tutti i valori diviso il numero dei valori stessi. dove: X i = esito i-ma misura n = numero dei dati (dimensione del campione) media Gli indici di posizione indicano il valore attorno al quale i dati del campione sono posizionati Mi interessa la dispersione dei dati intorno a tale valore N.B. NELLA DISTRIBUZIONE NORMALE MEDIA= MODA = MEDIANA

19 Indici di dispersione: media dei quadrati degli scarti x max -x min range (intrevallo di variazione) scarto medio assoluto varianza campionaria deviazione standard campionaria p_esimo quantile: si considera np per [ 0 p 1 ] Se np non è intero, considero k lintero successivo e il p_esimo quantile è x k Se np = k è intero, il p_esimo quantile è (x k + x k+1 )/2 Q 1 =primo quartile =25° percentile Q 2 =secondo quartile=50° percentile=mediana Q 3 =terzo quartile=75° percentile

20 Media uguale Deviazione Standard Diversa Media e varianza: Media=2 Varianza=1.33 Media=2 Varianza=4

21 Indici di forma INDICE DI ASIMMETRIA (Skewness) CURTOSI >0 coda a destra <0 coda a sinistra =0 simmetrica Misura il grado di ripidezza della distribuzione >3 leptocurtica =3 distribuzione normale (mesocurtica) <3 platicurtica N.B. In molti software il coefficiemte di curtosi viene confrontato con il valore 0

22 Indici: Schema riassuntivo media: moda: punto di max della distribuzione mediana: valore sotto al quale cadono la metà dei valori campionari. Si dispongono i dati in ordine crescente e si prende quello che occupa la posizione centrale (N dispari) o la media dei 2 valori in posizione centrale (N pari) varianza deviazione standard range skewness (coeff. di asimmetria) curtosi: misura quanto la distribuzione è appuntita di posizione di dispersione di di forma >0 coda a ds <0 coda a sin =0 simmetrica 3 molto appuntita


Scaricare ppt "Statistica Descrittiva dispersione di una distribuzione Obiettivi della lezione: Media Mediana, Moda Asimmetria, kurtosi Quantili e percentili devianza."

Presentazioni simili


Annunci Google