Gli Indici di VARIABILITA’

Slides:



Advertisements
Presentazioni simili
- le Medie la Moda la Mediana
Advertisements

____________________
LA VARIABILITA’ IV lezione di Statistica Medica.
Distribuzione Normale o Curva di Gauss
STATISTICA DESCRITTIVA
“Teoria e metodi della ricerca sociale e organizzativa”
Variabilità Variabilità: inevitabile fluttuazione dei fenomeni naturali, fisici, sociali ecc le indicazioni fornite dalle misure di tendenza centrale (media.
Lez. 3 - Gli Indici di VARIABILITA’
Progetto Pilota 2 Lettura e interpretazione dei risultati
Gli Integrali.
Elementi di STATISTICA DESCRITTIVA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
DISTRIBUZIONE CAMPIONARIA CONGIUNTA DI DUE VARIABILI (1)
COSA VUOL DIRE FARE STATISTICA
Corso di biomatematica lezione 4: La funzione di Gauss
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
Statistica sociale Modulo A
Misurazione Le osservazioni si esprimono in forma di misurazioni
Propagazione degli errori
METODI E CONTROLLI STATISTICI DI PROCESSO
Quale valore dobbiamo assumere come misura di una grandezza?
Statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
TRATTAMENTO, ANALISI E INTERPRETAZIONE DEI DATI
MEDIE STATISTICHE.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Pier Giorgio Ardeni Dipartimento di Scienze Economiche
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Simone Mosca & Daniele Zucchini 4Bi.
La Variabilità e La Concentrazione
Sintesi della lezione Il concetto di variabilità Campo di variazione Differenza interquartile La varianza La deviazione standard Scostamenti medi VARIABILITA’
Lez. 3 - Gli Indici di VARIABILITA’
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Gli Indici di VARIABILITA’
Statistica La statistica è
Anova a due fattori Esempio di piano fattoriale: il caso della progettazione robusta di batterie Tipo di Materiale Temperatura (°F)
Che cos’è e come si misura la disuguaglianza economica
PROPAGAZIONE DEGLI ERRORI:
Gli indici di dispersione
COSA VUOL DIRE FARE STATISTICA
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
Accenni di analisi monovariata e bivariata
Strumenti statistici in Excell
Corso di Analisi Statistica per le Imprese Indici di variabilita’ ed eterogeneita’ Prof. L. Neri a.a
Pier Giorgio Ardeni Dipartimento di Scienze Economiche
3 June Biostatistica Biostatitistica= Statistica per scienze Biostatitistica= Statistica per scienze biologiche e sanitarie. biologiche e sanitarie.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
La distribuzione campionaria della media
A.A STATISTICA E CALCOLO DELLE PROBABILITA’ Docenti: Stefania Mignani Maurizio Brizzi.
Elaborazione statistica di dati
STATISTICHE DESCRITTIVE
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Statistica – L33 (prof. Pellegrini)
STATISTICA P IA F ONDAZIONE DI C ULTO E R ELIGIONE C ARD. G. P ANICO Azienda Ospedaliera CORSO DI LAUREA IN INFERMIERISTICA Sr. Margherita Bramato.
La covarianza.
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Il Moto. Partendo da una quesito assegnato nei test di ingresso alla facoltà di medicina, si analizza il moto di un oggetto.
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
Analisi delle osservazioni
Transcript della presentazione:

Gli Indici di VARIABILITA’ Elementi di Statistica descrittiva Gli Indici di VARIABILITA’ - Campo di variazione Scarto semplice medio Varianza Scarto quadratico medio Coefficiente di variazione

Indici di Variabilità I valori medi sono indici importanti per la descrizione sintetica di un fenomeno statistico Hanno però il limite di non darci alcuna informazione sulla distribuzione dei dati

In tutte e tre le prove la media è 6,25 Esempio In tre differenti prove di matematica 4 studenti hanno riportato le seguenti valutazioni In tutte e tre le prove la media è 6,25 ma i dati sono chiaramente distribuiti in modo diverso

Diagramma di distribuzione delle tre prove

nel caso della 1a prova e 2a prova sarà opportuno fare un recupero per alcuni studenti nel caso della 3a prova l’insegnante può ritenere che gli obiettivi siano stati raggiunti dalla classe, anche se ad un livello solo sufficiente

In statistica è possibile valutare in modo sintetico la distribuzione dei dati mediante gli indici di variabilità (o dispersione) Vedremo i seguenti indici Campo di variazione (Range) Scarto semplice medio Varianza e scarto quadratico medio Coefficiente di variazione

Campo variazione = x max – x min Campo di variazione E’ il più semplice degli indici di variazione: Si calcola facendo la differenza tra il dato più grande e il dato più piccolo Campo variazione = x max – x min Rappresenta l’ampiezza dell’intervallo dei dati

Xmax = 9; Xmin = 3 Range = 9 – 3 = 6 Esempio Consideriamo le valutazioni della prima prova Xmax = 9; Xmin = 3 Range = 9 – 3 = 6

Calcoliamo il Range per tutte le tre prove Range 1a prova = 6  dati più dispersi, risultati più eterogenei Range 3a prova = 1  dati più concentrati, risultati più omogenei Range 2a prova = Range 1a prova = 6 Stessa Distribuzione?

Vediamo graficamente

ma distribuzione 1a prova  Distribuzione 2a prova Osservazioni: 1. Il campo di variazione dà informazioni sulla distribuzione dei dati: più R è piccolo più i dati sono concentrati; più R è grande più i dati sono dispersi. 2. R è espresso nella stessa unità di misura dei dati 3. Tuttavia R tiene conto solo dei dati estremi della distribuzione e non di tutti i dati, pertanto distribuzioni diverse ma con gli stessi valori estremi hanno range uguali Es. Range 1aprova = Range 2a prova. ma distribuzione 1a prova  Distribuzione 2a prova

Scarto semplice medio Un altro modo per calcolare la variabilità dei dati (tenendo conto di tutti i dati) consiste nel calcolare la distanza di tutti i dati dalla media e fare la media aritmetica di tali distanze Scarto semplice medio = Distanza media dei dati dalla media

Consideriamo le valutazioni della prima prova Esempio Consideriamo le valutazioni della prima prova x1 =  3 – 6,25  = 3,25; x2 =  5 – 6,25  = 1,25; x3 =  8 – 6,25  = 1,75; x4 =  9 – 6,25  = 2,75; Sm = 3,25 + 1,25 + 1,75 + 2,75 = 2,25 4

Calcoliamo lo Scarto semplice medio per tutte le tre prove Scarto 1a prova = 2,25  dati più dispersi, risultati più eterogenei Scarto 3a prova = 0,38  dati più concentrati, risultati più omogenei Scarto 2a pr.  Scarto 1a pr. “Le Distribuzioni Differiscono”

Diagramma degli scarti dalla media

Osservazioni: 1. Lo scarto medio dalla media dà informazioni sulla distribuzione dei dati: più SM è piccolo più i dati sono concentrati; più SM è grande più i dati sono dispersi. 2. SM è espresso nella stessa unità di misura dei dati 3. Non ha l'inconveniente del “Campo di variazione” in quanto SM tiene conto di tutti i dati della distribuzione

Varianza e Scarto quadratico medio Sono gli indici di variabilità più utilizzati, e tengono conto della distribuzione di tutti i dati. Varianza Rappresenta la media aritmetica dei quadrati delle distanze dei dati dalla media M

Consideriamo le valutazioni della prima prova Esempio - Varianza Consideriamo le valutazioni della prima prova (x1)2 = (3 – 6,25 )2 = 10,5625; (x2)2 = (5 – 6,25 )2 = 1,5625; (x3)2 = (8 – 6,25 )2 = 3,0625; (x4)2 = (9 – 6,25 )2 = 7,5625; 2 = 10,5625+1,5625+3,0625+7,5625 = 5,6875 4

Calcoliamo la Varianza per tutte le tre prove Varianza 1aprova = 5,69  dati più dispersi, risultati più eterogenei Varianza 3a prova = 0,19  dati più concentrati, risultati più omogenei Varianza 2a pr.  Varianza 1a pr “Le Distribuzioni Differiscono”

Scarto quadratico medio o Deviazione standard È uguale alla radice quadrata della varianza

Esempio - Scarto quadratico medio Riprendiamo le valutazioni della prima prova

Calcoliamo lo Scarto quadratico medio per tutte le prove Scarto q. 1aprova = 2,38  dati più dispersi, risultati più eterogenei Scarto q. 3aprova = 0,43  dati più concentrati, risultati più omogenei Scarto q. 2a pr.  Scarto q. 1a pr “Le Distribuzioni Differiscono”

Osservazioni: 1. La varianza 2 e lo scarto quadratico medio  danno informazioni sulla distribuzione dei dati: più 2 e  sono piccoli più i dati sono concentrati; più 2 e  sono grandi più i dati sono dispersi. 2. Entrambi gli indici tengono conto di tutti i dati della distribuzione

3. Entrambi si basano sulla proprietà della media per cui la somma dei quadrati degli scarti dalla media è minima 4. La varianza è espressa mediante il quadrato dell’unità di misura dei dati 5. Lo scarto quadratico nella stessa unità di misura dei dati e pertanto viene preferito alla varianza

Il coefficiente di variazione CV Il CV è una misura relativa di dispersione (le precedenti sono misure assolute) ed è una grandezza adimensionale. E’ particolarmente utile quando si devono confrontare le distribuzioni di due gruppi con medie molto diverse o con dati espressi in scale differenti (es. confronto tra variazione del peso e variazione dell’altezza).

In natura il coeff. di variazione tende a rimanere costante per ogni fenomeno: i valori normalmente variano dal 5% al 15% Se i valori di CV sono esterni a quelli indicati o si è in presenza di errori di rilevazione, oppure il fenomeno presenta aspetti particolari. se CV è molto basso (2 – 3 %) bisogna sospettare l’esistenza di fattori limitanti la variabilità, se CV è molto alto (intorno al 40% o più) è molto probabile l’esistenza di fattori che aumentano la variabilità

Calcoliamo il Coeff. di variazione delle tre prove CV 1a prova = 38,16%  dati più dispersi, risultati più eterogenei CV 3a prova = 6,93%  dati più concentrati, risultati più omogenei CV 2a pr.  CV 1a pr  “Le Distribuzioni Differiscono”

L’Area di Concentrazione Uno dei metodi più interessanti per misurare il grado di disuguaglianza della distribuzione del reddito è costituito dalla cosiddetta curva di Lorenz*, rappresentata nella figura seguente. La retta inclinata di 45°indica una distribuzione perfettamente ugualitaria. Ogni punto della curva di Lorenz indica la percentuale di reddito percepita da una percentuale di famiglie. L’AREA DI CONCENTRAZIONE è l’area compresa fra la spezzata di concentrazione (CURVA DI LORENZ) e la bisettrice. Lo scarto della curva di Lorenz dalla retta a 45°, costituisce una misura del grado di diseguaglianza nella distribuzione del reddito. * Otto Max Lorenz (1880 – 1962) è stato un economista statunitense, noto per aver messo a punto uno studio che descrive le disparità di reddito da cui prende il nome la "curva di Lorenz".

L’asse verticale indica le percentuali del reddito delle famiglie L’asse orizzontale indica le percentuali di famiglie. Una distribuzione perfettamente uniforme del reddito si avrebbe qualora il 20% delle famiglie ottenesse il 20% del reddito totale (e anche all’interno di questa fascia la distribuzione risultasse uniforme), il 40% delle famiglie percepisse il 40% del reddito, e così via. La curva tratteggiata della figura rappresenta questo caso di distribuzione perfettamente eguale. La curva di Lorenz descrive, invece, la distribuzione effettiva del reddito: ogni punto della curva indica la percentuale di reddito ricevuto nella realtà da una percentuale di famiglie. Lo scarto della curva di Lorenz dalla curva della perfetta uguaglianza è indicato dall’area ombreggiata, che costituisce una misura del grado di disuguaglianza nella distribuzione del reddito. Quanto più è ampia quest’area, tanto maggiore è la distanza della distribuzione effettiva dalla perfetta uniformità. Nel caso di completa disuguaglianza, l’area coinciderebbe con il triangolo di area 1/2 È possibile fornire un indice specifico della disuguaglianza, che è dato dal rapporto tra l’area compresa tra la curva di eguaglianza perfetta e la curva di Lorenz e l’area del triangolo di area 1/2. Tale indice, definito coefficiente di Gini, assume un valore compreso tra 0 (per l’uguaglianza perfetta) e 1 (per la massima disuguaglianza).

Indice di Concentrazione (o coefficiente di Gini) Corrado Gini (1884 – 1965) è stato uno statistico, economista e sociologo italiano.

Coefficiente di Gini Mappa mondiale del coefficiente di Gini che misura la disuguaglianza nella distribuzione del reddito. I paesi a coefficiente di Gini più basso (colore chiaro) sono i paesi dove il reddito è distribuito più equamente. Al contrario, quelli a coefficiente di Gini più elevato sono quelli dove la diseguaglianza nella distribuzione del reddito è maggiore.