Gli indici di dispersione
La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati 5, 5, 5, 5, 5 1, 3, 5, 7, 9 1, 1, 1,1, 21 X = 5 1, 2, 3, 4,15
Variabilità nel gruppo La variabilità È la capacità di un fenomeno di assumere valori quantitativi o caratteri qualitativi diversi Variabilità nel gruppo statura in un gruppo di individui della stessa età Variabilità nell’individuo statura nell’età evolutiva
indice di tendenza centrale La variabilità Occorre un criterio per quantificare la variabilità delle misure rispetto a un termine di riferimento : indice di tendenza centrale La forma della variabilità è visibile ponendo su un piano cartesiano i valori della distribuzione La variabilità delle misure può essere valutata in base alla loro dispersione rispetto ai valori medi e misurata dagli indici di dispersione
LA VARIABILITÀ X 0 x1 x2... ..... x i ..... x n L’indice di variabilità rappresenta quanto ciascun termine è distante, in media, da X
Variabilità rispetto alla media Distribuzione simmetrica la maggior parte delle osservazioni si avvicina alla media Ci sono tanti soggetti in ciascuna classe Molte osservazioni sono lontane dalla media Molti soggetti nella classe iniziale e pochi nelle altre La maggior parte delle osservazioni sono lontane dalla media
Indici di variabilità La più elementare misura di dispersione è l’intervallo di variazione (range): differenza tra valore più alto e più basso Es: la statura di 5 persone adulte in cm. 150 168 170 171 172 R = 22
Intervallo di variazione Lo scarto indica la dimensione della variabilità ma non fornisce informazioni circa la variabilità della distribuzione Considera solo i dati estremi e non informa circa i valori intermedi Scarsamente utile, utilizzata solo in alcuni casi (es. temperature)
Scarto medio semplice assoluto Definiamo lo SCARTO come la differenza tra la singola osservazione e la media della distribuzione Dati n valori xi di media aritmetica x , si chiama scarto semplice medio assoluto la media aritmetica dei valori assoluti degli scarti xi – x
SCARTO E DEVIANZA Gli SCARTI esprimono la distanza di ciascuna osservazione dalla media della distribuzione. Potremmo rappresentare la variabilità totale della distribuzione come la somma di tutti gli scarti, e cioè: Variabilità totale = Ma, per una proprietà della Media aritmetica, risulta sempre essere = 0 la somma degli scarti:
Devianza Per superare il problema dei valori negativi alle differenze dalla media si possono elevare al quadrato i valori La Devianza è un indice di valutazione della variabilità di una distribuzione Da essa discendono la Varianza e la Deviazione Standard
Varianza La devianza non contiene l’informazione sul numero di osservazioni utilizzato per il calcolo La varianza è una devianza media che si rapporta al numero di osservazioni Essa da informazioni circa la variabilità dei singoli valori invece che per quella complessiva
Varianza corretta In campo biostatistico la formula viene modificata in considerazione della minore numerosità delle distribuzioni che penalizzerebbero l’informazione sulla variabilità Viene introdotto il concetto di gradi di libertà nel denominatore per valutare al massimo il grado di dispersione I gradi di libertà rappresentano il numero di osservazioni indipendenti della distribuzione ( N-1) poiché sui dati disponibili è già stata calcolata la media
I gradi di libertà Date 6 osservazioni vincolate dalla media x =25 N. misura attribuzione arbitraria 1 1 54 2 2 - 9 3 . ... 11 4 ..... 86 5 N – 1 1 6 N ? 54 – 9+11+86+1=143 La sesta misura si ricava indirettamente Allora Σx= N x = 6 25 =150 Pertanto considerati i valori arbitrari la sesta misura sarà X6=150 – 143=7
Deviazione standard o Scarto Quadratico Medio E’ più conveniente esprimere la variabilità nello stesso ordine di grandezza dei dati e della loro media La varianza è espressa con un ordine di grandezza al quadrato rispetto ai dati originali Per esprimere la variabilità nello stesso ordine di grandezza si applica alla varianza la trasformazione inversa al quadrato: la radice quadrata
Esempi di variabilità di distribuzioni Modalità 1 2 3 Frequenze 3 5 3 si ha x = s = Modalità 0 2 4 frequenze 3 5 3 si ha x =2
VARIANZA E DEVIAZIONE STANDARD DI DATI RAGGRUPPATI IN CLASSI Come fatto per il calcolo della media anche in questo caso andremo a modificare la formula per il calcolo della VARIANZA e dello SCARTO QUADRATICO MEDIO considerando le “Frequenze” (fi) di ciascuna classe. Abbiamo pertanto: Varianza Scarto quadratico medio mi = valori centrali delle singole classi
Calcolo e interpretazione di s 5 reparti di un ospedale secondo il numero di posti letto 12 60 42 54 32 X = (12 + 60 + 42 + 54 + 32) / 5 = 200 / 5 = 40 Se tutti i reparti avessero lo stesso numero di posti letto, avrebbero 40 posti letto ciascuno Dev.=(12 – 40)2 + (60 -40)2 + (42 – 40)2 + (54 - 40)2 + (32 – 40)2 =1448 s = 1448 / 5 = 289,6 s = 289,6 = 17 Ciascun reparto ha un numero di posti letto che è diverso da quello medio (40) in media di 17
Coefficiente di variazione Es: una popolazione di adulti ha un peso medio di 75 Kg. una di neonati con peso medio 3.2Kg. s adulti = 4 Kg s neonati = 0.6 Si può affermare che la variabilità per gli adulti è maggiore rispetto a quella dei neonati? Si possono confrontare i rapporti con le medie La variabilità del peso degli adulti è inferiore
Coefficiente di variazione Gli indici di variabilità sono espressi nella stessa unità di misura delle osservazioni e non consentono confronti fra la variabilità di due distribuzioni espresse in unità di misura diverse Non consentono il confronto di distribuzioni che hanno medie diverse: sono influenzate dall’intensità del carattere Il CV è una misura relativa di variabilità: esprime la variabilità in proporzione alla dimensione media del carattere Il CV può essere definito come il rapporto tra la deviazione standard e la media (in %) E’ una misura adatta a confrontare la variabilità fra popolazioni diverse o fra caratteri diversi
Coefficiente di variazione ES : Si considerino i dati relativi a un gruppo di studenti a cui siano stati rilevati la statura e il peso. Conoscendo media e scarto quadratico medio si vuole stabilire quale fra i caratteri in studio ha minore variabilità Carattere media deviazione standard statura 168,59 6,49 peso 64,48 7,27 C. V..(statura) C. V.(peso) La statura è il carattere che presenta una minore variabilità