Indici di variabilità La variabilità è la ragione dell’esistenza della psicologia. Le persone hanno dei comportamenti diversi che non possono essere predetti in maniera deterministica: è il motivo per il quale in psicologia si studiano le variabili! Variabilità: indica quanto i punteggi sono differenti tra loro. È importante per comprendere le caratteristiche di una distribuzione.
Cos’è la variabilità? Se due distribuzioni che hanno la stessa media e la stessa mediana sono uguali tra loro? ES. 1: 24 24 24 24 ES. 2: 18 18 30 30 Se i punteggi di una distribuzione sono tutti uguali tra loro non c’è variabilità, cioè tutti gli indici di variabilità sono uguali a 0. Un soggetto che prende 25 in entrambe le distribuzioni, in quale delle due è andato meglio?
Indici di variabilità Campo di variazione o gamma Differenza interquartilica Deviazione standard Varianza
1) Campo di variazione (ɣ=gamma) Detto anche Scarto intervallare, indica quanti punteggi “possibili e diversi”, in termini di intervallo, appartengono alla distribuzione. È la distanza tra il punteggio più alto (Xmax) e quello più basso (Xmin) di una distribuzione. È considerato un indice poco attendibile e poco informativo (è influenzato dai valori estremi), ma in alcuni casi può essere utile. ES: 24 24 24 24 GAMMA=0 ES: 18 18 30 30 GAMMA=12 Sarebbe più idoneo utilizzare la formula: ɣ=(Xmax-Xmin)+1
2) Differenza interquartilica (IQR) L’Inter-Quartile Range (IQR) è un indice di variabilità che si basa sugli indici di posizione: è la differenza tra il 3° ed il 1° quartile ed indica il Range entro cui si trova (almeno) il 50% “centrale” della distribuzione. Es: 1 2 2 2 3 4 4 6 Calcoliamo i quartili: Q1=2; Q2=2,5; Q3=4; A quanto è uguale lo scarto interquartile? IQR=4-2=2
2) IQR e boxplot L’informazione dell’IQR è molto intuitiva, se utilizzata insieme al XMIN e al XMAX in un boxplot.
2) Esercitazione Boxplot Disegnare il Boxplot della seguente distribuzione Es: 25 25 27 27 28 30 30 30 30 .
Deviazione standard (SD) La SD è l’indice di variabilità più importante poiché considera tutti i punteggi di una distribuzione. La SD indica quanto i punteggi deviano in media dalla media; ma a quanto è uguale? Es: 1 2 2 2 3 4 4 6 media=3
Deviazione standard (SD) La SD è detta anche “scarto quadratico medio” Formula per punteggi “sparsi” Il numeratore è detto DEVIANZA
Esempio calcolo SD Esempio: 1 2 2 2 3 4 4 6 media=3
Calcolo σ tabella di frequenza X f 1 2 3 4 6 (X-M) (1-3)=-2 (2-3)=-1 (3-3)=0 (4-3)=1 (6-3)=3 (X-M)2 (-2)2=4 1 9 f(X-M)2 1(4)=4 3 2 9
Esercizio: Calcolare σ 1 2 4 5 X f 1 2 4 5 (X-2,8) -1,8 -0,8 1,2 2,2 (X-2,8)2 3,24 0,64 1,44 4,84 f(X-2,8)2 3,24 1,28 1,44 4,84
σ formula semplificata DOVE ΣX2 è la somma dei quadrati di ciascuna X (ΣX)2 è la somma delle X, successivamente elevata al quadrato
σ formula semplificata tab di freq DOVE ΣfX2 è la somma di ciascun quadrato di X moltiplicato per f (ΣfX)2 è la somma delle fX elevata al quadrato
X f (X)2 fX2 (fX) 1 2 3 4 12 6 9 16 32 8 36 ∑fX2 =90 - ∑fX=242/8
σ e s Se si vuole calcolare la deviazione standard della popolazione a partire dai punteggi del campione è necessario stimarla, ossia trovare s (deviazione standard stimata). Il calcolo di s è del tutto identico a quello di σ tranne per il fatto che, in quanto stima, è necessario dividere per N-1, piuttosto che per N. s dunque sarà sempre maggiore di σ (poiche N-1 < N).
Formule per il calcolo di s
Calcolare s, sui punteggi di QI X f 73 1 85 90 2 100 3 110 115 127 (X-M) (X-M)2 f(X-M)2 -27 729 -15 225 -10 100 200 10 15 27
Istogramma del QI sul campione
Informazione di s sulla popolazione s indica la percentuale di punteggi che si trova ad una certa distanza dalla media. MEDIA ± s comprende più del 68,3% dei valori MEDIA ± 2s comprende più del 95,4% dei valori MEDIA ± 3s comprende più del 99,7% dei valori
Esempio QI QI: Media=100; s=15 Il 68,3% dei soggetti si colloca tra 85-115 Il 95,4% dei soggetti si colloca tra 70-130 Il 99,7% dei soggetti si colloca tra 55-145
Proprietà della Deviazione standard Proprietà dell’addizione e della sottrazione: “Aggiungendo o sottraendo ai punteggi originali una costante K, σ rimane invariato”. Il motivo è che sia ciascun punteggio, sia la media aumenteranno (o diminuiranno) di K, ma gli scarti tra ciascuna X e la media rimarranno identici. Ad esempio: su 1 2 3 con Media=2 aggiungendo k=1; si avrà: 2 3 4 con Media=3
Proprietà della Deviazione standard Proprietà della moltiplicazione e della divisione: “moltiplicando o dividendo i punteggi per una costante K, σ sarà uguale a σ originale per o diviso la costante. In questo caso moltiplicando (o dividendo) sia ciascun punteggio sia la media gli scarti risulteranno moltiplicati (o divisi) per K. Ad esempio: su 1 2 3 con Media=2 Moltiplicando k=2; si avrà: 2 4 6 e Media=4
Varianza La Varianza è uguale al quadrato della deviazione standard. Essendo il quadrato, non è molto usato nella statistica descrittiva, poiché descrive il campione (o la popolazione), ma con unità di misura differente (Es. cm o cm2). σ2 e s2 sono indici molto utilizzati, invece, nella statistica inferenziale.
Formule per il calcolo di σ2 (distribuzione sparsa)
Formule per il calcolo di σ2 (tabelle di frequenza)
Formule per il calcolo di s2 (distribuzione sparsa)
Formule per il calcolo di s2 (tabelle di frequenza)
Calcolare la varianza (σ2) 3 4 5 6 X f X-M (X-M)2 F(X-M)2 2 3 -1,44 2,07 6,22 -0,44 0,19 0,39 4 0,56 0,31 0,63 5 1 1,56 2,43 6 2,56 6,55 =Σ16,22 /N=1,80