dispersione di una distribuzione

Slides:



Advertisements
Presentazioni simili
Statistica descrittiva e inferenziale
Advertisements

____________________
LA VARIABILITA’ IV lezione di Statistica Medica.
QUANTILI.
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
STATISTICA DESCRITTIVA
“Teoria e metodi della ricerca sociale e organizzativa”
Le misure di tendenza centrale informano sul centro della distribuzione 4 - Le medie a.a Le medie a.a
Variabilità Variabilità: inevitabile fluttuazione dei fenomeni naturali, fisici, sociali ecc le indicazioni fornite dalle misure di tendenza centrale (media.
Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita.
Lez. 3 - Gli Indici di VARIABILITA’
Analisi preliminari dei dati
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Statistica descrittiva
STATISTICA DESCRITTIVA
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
LIBRO – BIOSTATISTICA [Pagano-Gauvreau]
Varianza campionaria Errore standard della varianza campionaria
Campionamento casuale semplice
Obiettivi del corso di Statistica Medica.
Introduzione alla statistica per la ricerca Lezione I
COSA VUOL DIRE FARE STATISTICA
STATISTICA a.a DISTRIBUZIONI DI FREQUENZE
Esercizi x1=m-ts x2=m+ts
Misure di dispersione Giovanni Filatrella
Statistica sociale Modulo A
LEZIONI DI STATISTICA MEDICA
Misurazione Le osservazioni si esprimono in forma di misurazioni
Lezione 4 Probabilità.
Nicola Paparella, Università degli Studi, Lecce, aprile 2006 Pedagogia sperimentale Note ed appunti Corso di base / 5
Pedagogia sperimentale
Luciano giromini – la misura in psicologia, 2009 database e distribuzioni - misure di sintesi - misure di variabilità descrizione dei dati:
Quale valore dobbiamo assumere come misura di una grandezza?
Statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Di Capuano,Colucci e Panunzi Valori medi I valori medi.
Fondamenti di informatica
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Simone Mosca & Daniele Zucchini 4Bi.
INDICE I VALORI MEDI LA MEDIA GEOMETRICA LA MEDIA ARITMETICA
La Variabilità e La Concentrazione
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Sintesi della lezione Il concetto di variabilità Campo di variazione Differenza interquartile La varianza La deviazione standard Scostamenti medi VARIABILITA’
Completiamo i grafici Diagramma logaritmico: variante del diagramma cartesiano; si usa se ci sono valori delle y molto piccoli e molto grandi (nessuna.
Lez. 3 - Gli Indici di VARIABILITA’
Gli Indici di VARIABILITA’
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Gli indici di dispersione
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
COSA VUOL DIRE FARE STATISTICA
Accenni di analisi monovariata e bivariata
Strumenti statistici in Excell
Corso di Analisi Statistica per le Imprese Indici di variabilita’ ed eterogeneita’ Prof. L. Neri a.a
Martina Serafini Martina Prandi
Marta Pinto Stefania Serra Valentina Paravidino
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
ANALISI E INTERPRETAZIONE DATI
STATISTICHE DESCRITTIVE
TRATTAMENTO STATISTICO DEI DATI ANALITICI
STATISTICA P IA F ONDAZIONE DI C ULTO E R ELIGIONE C ARD. G. P ANICO Azienda Ospedaliera CORSO DI LAUREA IN INFERMIERISTICA Sr. Margherita Bramato.
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
STATISTICA DESCRITTIVA La Sintesi Statistica Una serie di dati numerici è compiutamente descritta da tre proprietà principali: La tendenza centrale o posizione.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Gli Indici di VARIABILITA’
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

dispersione di una distribuzione Statistica Descrittiva dispersione di una distribuzione Obiettivi della lezione: Media   Mediana, Moda Asimmetria, kurtosi Quantili e percentili devianza varianza deviazione standard intervallo interquartile

dispersione di una distribuzione Ore di frequenza Usando SOLO le medie possiamo ingannarci nel confrontare i caratteri di due gruppi di individui.   sonno Maschi Femmine 1 3 2 6 7 4 8 5 11 9 10 - 12 13 14 15 Diamo un'occhiata alla distribuzione di frequenza della durata di sonno indotto da un anestetico in un campione di 40+40 pazienti. Ad esempio , sappiamo che le donne sono notoriamente diverse dagli uomini sotto molti aspetti

dispersione di una distribuzione Il periodo medio di sonno per le donne risulta di 5 ore così come per gli uomini Se ci soffermiamo solo sulle medie potremmo concludere che le donne hanno una durata di sonno uguale a quello dei maschi. Per facilitare i confronti riportiamo i dati in grafico.

calcolo della media e della varianza ( dati in classi ) Nell'esempio della lunghezza dei neonati: xi f(xi) xi f(xi) 45.0 2 90.0 -5.375 28.891 57.781 2025.00 4050.00 46.5 5 232.5 -3.875 15.016 75.078 2162.25 10811.25 48.0 7 336.0 -2.375 5.641 39.484 2304.00 16128.00 49.5 14 693.0 -0.875 0.766 10.719 2450.25 34303.50 51.0 16 816.0 0.625 0.391 6.250 2601.00 41616.00 52.5 9 472.5 2.125 4.516 40.641 2756.25 24806.25 54.0 270.0 3.625 13.141 65.703 2916.00 14580.00 55.5 1 5.125 26.266 3080.25 57.0 6.625 43.890 3249.00 60 3022.5 365.812 152624.25 Media = 3022.5/60 = 50.375 D = (45.0-50.375)2 2 + (46.5-50.375)25+...+ (57.0-50.375)2 1 = 365.812 D = 152624.25 - (3022.5)2/60 = 152624.25 - 152258.44 = 365.813 Var= 365.812/59 =6.2 Deviazione standard = 2.49

Istogramma dei dati esempio della lunghezza dei neonati:

Torniamo all’esempio del sonno xi f(xi) 1 4 -4 64 2 9 18 36 -3 81 3 10 30 90 -2 40 15 16 60 240 -1 5 25 80 400 6 11 66 396 7 49 35 245 20 8 24 192 27 162 32 100 121 12 144 13 169 14 196 225 Σ 2620 620 Media = 400/80 = 5 Devianza= 620 ; Varianza=Devianza/(N-1)= 620/79 = 7.848 Deviazione standard= 2.801

Media 5 Varianza 7.848101 dev. Stand. 2.801446 asimm. 1.456178 Kurtosi 2.897833 Mediana 5 quartile 1 3 quartile 3 6

Dato un insieme di n valori: scarto semplice medio Dato un insieme di n valori: detta la loro media aritmetica e i valori assoluti degli scarti, si chiama scarto semplice medio (assoluto) la media aritmetica dei valori assoluti degli scarti semplici di ciascun dato x dalla media aritmetica

la varianza Si definisce varianza di una distribuzione statistica la media aritmetica dei quadrati degli scarti dalla media. Si definisce scarto quadratico medio la radice quadrata della varianza.

la deviazione standard Per i dati singoli => Questo numero rappresenta una misura della deviazione dei valori dalla media. Esso ci dice come i valori tendano a disperdersi intorno alla loro media: se la deviazione standard è piccola, indica un fitto addensamento dei valori intorno alla loro media; se è grande indica la presenza di valori molto lontani dalla media. Per i dati raggruppati in classe =>

Stima della Deviazione standard stima in un campione => Per dati raggruppati in classe => dove

Deviazione standard

l'intervallo interquartile Un indice di dispersione di uso comune è l'intervallo interquartile, dato dalla differenza tra 3° e 1° quartile (cioè tra 75° e 25° centile): tale intervallo contiene la metà dei valori inclusi nel campione, indipendentemente dalla forma della distribuzione della variabile.

Sommario della statistica descrittiva Obiettivi della lezione: media   mediana moda percentili intervallo di variazione devianza varianza deviazione standard intervallo interquartile Indice di simmetria Coefficiente di variazione

La deviazione standard è una quantità utile per effettuare confronti.  ESEMPIO: Come confrontare il vostro peso con quello di altre persone della vostra età?  Supponiamo che uno di voi pesi 4 kg oltre la media dei soggetti della sua età: ci sono molti altri, della stessa età, con un peso maggiore, oppure egli è un piccolo gigante? Bisogna conoscere la deviazione standard dei pesi dei ragazzi di quella età, prima di fare un confronto con il peso degli altri. Supponiamo che il peso medio dei ragazzi di quell'età sia 45 kg e che la deviazione standard sia 2 kg:  … allora un peso di 49 kg è sopra la media di due deviazioni standard.

Approfondimento: rivediamo alcune formule ed introduciamo le nozioni di asimmetria (skewness) e di curtosi

Principali indici statistici I grafici finora analizzati ci danno informazioni qualitative; possiamo quantificarle ricorrendo ai seguenti indici. Siano n osservazioni numeriche MODA MEDIANA MEDIA di posizione SCARTO QUADRATICO MEDIO VARIANZA RANGE INDICI di dispersione ASIMMETRIA (SKEWNESS) CURTOSI ( KURTOSIS) di forma

Indici di posizione: moda media mediana E' definita come il valore che ha la frequenza più alta. E' quel valore che corrisponde alla somma di tutti i valori diviso il numero dei valori stessi. dove: Xi = esito i-ma misura n = numero dei dati (dimensione del campione) media E' quel valore al di sotto del quale cadono la metà dei valori campionari. mediana Gli indici di posizione indicano il valore attorno al quale i dati del campione sono posizionati Mi interessa la dispersione dei dati intorno a tale valore N.B. NELLA DISTRIBUZIONE NORMALE MEDIA= MODA = MEDIANA

Indici di dispersione: xmax -xmin range (intrevallo di variazione) scarto medio assoluto media dei quadrati degli scarti varianza campionaria deviazione standard campionaria p_esimo quantile: si considera np per [ 0 ≤ p ≤1 ] Se np non è intero, considero k l’intero successivo e il p_esimo quantile è xk Se np = k è intero, il p_esimo quantile è (xk+ xk+1)/2 Q1=primo quartile =25° percentile Q2=secondo quartile =50° percentile =mediana Q3=terzo quartile =75° percentile

Deviazione Standard Diversa Media e varianza: Media uguale Deviazione Standard Diversa Media=2 Varianza=4 Media=2 Varianza=1.33

INDICE DI ASIMMETRIA (Skewness) Indici di forma INDICE DI ASIMMETRIA (Skewness) >0 coda a destra <0 coda a sinistra =0 simmetrica CURTOSI Misura il grado di ripidezza della distribuzione >3 leptocurtica =3 distribuzione normale (mesocurtica) <3 platicurtica N.B. In molti software il coefficiemte di curtosi viene confrontato con il valore 0

Indici: Schema riassuntivo di posizione media: moda: punto di max della distribuzione mediana: valore sotto al quale cadono la metà dei valori campionari. Si dispongono i dati in ordine crescente e si prende quello che occupa la posizione centrale (N dispari) o la media dei 2 valori in posizione centrale (N pari) di dispersione varianza deviazione standard range >0 coda a ds <0 coda a sin =0 simmetrica di di forma skewness (coeff. di asimmetria) curtosi: misura quanto la distribuzione è appuntita <3 poco appuntita >3 molto appuntita