LA VARIABILITA’ IV lezione di Statistica Medica
Sintesi della lezione Il concetto di variabilità Campo di variazione Differenza interquartile La varianza La deviazione standard Scostamenti medi
Il concetto di variabilità Si definisce come l’attitudine di un fenomeno ad assumere valori diversi
Il concetto di variabilità In assenza di variabilità all’interno dei gruppi è evidente che i Q.I. del primo gruppo sono più elevati rispetto a quelli del secondo gruppo In presenza di una forte variabilità all’interno dei gruppi non è evidente in quale gruppo sono più elevati i Q.I.
INDICI DI VARIABILITA’ Indici di variabilità assoluta Indici di variabilità relativa Indici di diversità Indici di disuguaglianza rispetto a un valore medio Indici di disuguaglianza a coppie
Requisiti di un indice di variabilità 1. 2. 3.
Indici di diversità
E’ anche denominato “range” ed è espresso da: R = xN – x1 Indici di diversità Campo di variazione E’ anche denominato “range” ed è espresso da: R = xN – x1 Può essere elevato anche se la variabilità della distribuzione è prossima a zero Es. 1 10 10 10 10 10 10 10 10 10 10 12
Indici di diversità Differenza interquartile Sia data una distribuzione x1, x2….xn tale indice è espresso da: IR = Q3 – Q1 Può essere nullo anche se non è nulla la variabilità della distribuzione Es. 1 2 10 10 10 10 10 10 10 10 11 12 dove Q1 = Q3 = 10
Indici di diversità Scarto interquartile Sia data una distribuzione x1, x2….xn lo scarto interquartile è espresso dalla semidifferenza tra Q3 e Q1: IR % Si ottiene rapportando IR alla mediana e moltiplicando il rapporto per 100:
Indici di disuguaglianza rispetto a un valore medio
Distanza rispetto alla media Valore medio Intuitivamente la variabilità è vista come la distanza media di un’”osservazione tipo” rispetto al valore medio per la popolazione Tuttavia: Distanza rispetto alla media
La varianza La varianza si calcola come la media degli scarti al quadrato La varianza è utilizzata per standardizzare le misure di variabilità e renderle relative Il valore della varianza è indipendente rispetto al numero delle osservazioni Il numeratore della varianza si chiama devianza
La deviazione standard Si ottiene dalla radice quadrata della varianza della popolazione Si definisce deviazione standard o scarto quadratico medio la media quadratica degli scarti dalla Media della popolazione
Formula di calcolo della varianza
Varianza e dev. st. di un campione Nelle attività normali di ricerca non disponiamo di una popolazione bensì di un campione Obiettivo della statistica inferenziale: stima dei parametri di una popolazione attraverso l’utilizzo di un campione In generale i campioni presentano una variabilità minore rispetto alla popolazione Assenza di valori estremi ( e rari) Nelle popolazioni poco variabili è possibile stimare i parametri della popolazione con un campione ristretto Nelle popolazioni ad elevata variabilità è necessario un campione più grande
Varianza e dev. st. di un campione Varianza di un campione Deviazione standard di un campione La correzione è importante soprattutto per i campioni di piccole dimensioni Per i campioni molto numerosi la deviazione standard del campione si avvicina a quella della popolazione
Cosa sono i gradi di libertà? Il numero di osservazioni libere nel campione. Con un vincolo, vi saranno n-1 g.l. Con due vincoli, vi saranno n-2 g.l. Ricordando l’esempio del voto medio di 30 studenti, le prime 29 osservazioni potranno assumere qualunque valore ma la 30-esima osservazione sarà vincolata al seguente valore:
Indici relativi di variabilità
Esempio
Indici di eterogeneità
Mutabilità È la possibilità di variare per una variabile qualitativa tra una perfetta omogeneità (quando la variabile si manifesta mediante un solo attributo) e una qualche eterogeneità ( se nella popolazione vi sono almeno due attributi differenti)
La eterogeneità misura la variabilità delle frequenze relative senza coinvolgere le modalità della variabile Max omogeneità L’indice di eterogeneità vale zero L’indice di eterogeneità raggiunge il massimo Max eterogeneità
L’indice di Gini Min eterogeneità: Max eterogeneità: Rapportando G al suo massimo, otteniamo un indice che varia tra 0 ed 1:
Esempio