Statistica descrittiva Obiettivo: riassumere e descrivere le caratteristiche di un insieme di dati in modo chiaro e sintetico (Es. la media universitaria è un indice riassuntivo dei voti ottenuti negli esami sostenuti). Tra le tecniche utilizzate: - Distribuzioni e grafici di frequenza: servono a semplificare la lettura dei dati.
Voto esame psicometria La matrice dei dati Unità Genere Voto scuola media Voto esame psicometria Numero di Bocciature Alice F Suff. 30 Giulia Distinto 28 Marco M Ottimo 27 Marta 25 1 Giuseppe Buono 2 Elisa Franca 22 Rita 18 Paolo
1) Distribuzioni di frequenza Distribuzione: insieme dei punteggi o delle modalità relative ad una variabile. Esempio: F F M F M F F F M Frequenza: numero di volte con cui è presente un punteggio o una modalità. Calcolo della frequenza semplice: Conteggio del numero di volte con cui è presente ciascun punteggio o modalità. Calcolo della frequenza cumulata: Somma delle frequenze semplici immediatamente successive.
Costruire la tabella di freq (genere: 1=F; 2=M) Unità Genere Voto scuola media Voto esame psicometria Numero di Bocciature Alice 1 30 Giulia 3 28 Marco 2 4 27 Marta 25 Giuseppe Elisa Franca 22 Rita 18 Paolo
Tabella di frequenza semplice: variabile genere X (punteggio o modalità) F (frequenza) Fc (frequenza cumulata) 1 6 2 3 9 Adesso tocca a voi: Costruire una tabella di frequenza rispetto alla variabile “Voto esame Psicometria”
COME costruire una tabella di frequenza… Fare un elenco su un foglio di ogni possibile valore (cioè un numero o punteggio), dal minore al maggiore. Nel voto esame psicometria, l’elenco va da 18 (il minore valore possibile) a 30 (il maggiore valore possibile). Inserire anche i valori fra 18 e 30 che non sono usati. 2) Scorrere uno a uno i punteggi, spuntando ciascun valore nell’elenco. 3) Costruire una tabella che riporta quante volte ciascun valore dell’elenco viene usato.
X F Fc 18 19 20 21 22 23 24 25 26 27 28 29 30
X F Fc 18 1 ? 19 20 21 22 23 24 25 26 27 28 2 29 30 3
COME costruire una tabella di frequenza cumulata… La costruzione di una Distribuzione di frequenza cumulata inizia da una distribuzione di frequenza semplice. Bisogna formare una nuova colonna di frequenze cumulate in cui inserire, partendo dal punteggio più basso, la somma progressiva delle frequenze osservate.
X F Fc 18 1 19 20 21 22 2 23 24 25 3 26 27 4 28 6 29 30 9
Rappresentazioni grafiche Per rendere ancora più semplice la lettura dei dati, è possibile riportare le frequenze su alcuni grafici. In particolare vi sono: Grafici a barre Istogrammi a barre Poligoni di frequenza semplice Poligoni di frequenza cumulata
Grafici e istogramma a barre Grafici e istogrammi a barre sono molti simili I grafici a barre sono indicati per variabili nominali e ordinali: le barre sono separate l’una dall’altra Gli istogrammi a barre sono indicati per variabili intervallo/rapporto: le barre sono contigue fra loro Ogni frequenza è rappresentata da una barra La lunghezza di ogni barra è proporzionale alla frequenza: barre più lunghe indicano frequenze più elevate Negli istogrammi anche l’area di una barra è proporzionale alla frequenza
Grafico a barre Quando si usa: Si usa per rappresentare le variabili discrete. Costruzione di un grafico a barre Disporre le frequenze sull’asse verticale e le X sull’asse orizzontale (in ordine crescente). Si costruiscono delle barre in corrispondenza di ciascuna X, con altezza pari alla frequenza. N.B. Le barre non sono adiacenti
COME costruire un grafico a barre… Costruire la tabella di frequenza. 2) Mettere i valori (Es. VOTO ESAME PSICOMETRIA) lungo la parte bassa del foglio (da sinistra a destra, dal minore al maggiore, quindi 18,19,20,21 -> 30). 3) Creare una scala delle frequenze (0,1,2,3,4) lungo il margine sinistro del foglio (andando da 0 in basso, fino alla frequenza maggiore). 4) Disegnare un rettangolo (la barra) per ogni valore (con un’altezza uguale alla frequenza di quel valore).
Grafici a barre: var. discrete
Istogrammi a barre Quando si usa: Si usa per rappresentare le variabili continue. Costruzione degli istogrammi a barre Disporre le frequenze sull’asse verticale e le X sull’asse orizzontale (in ordine crescente). Si costruiscono delle barre in corrispondenza di ciascuna X, con altezza pari alla frequenza. N.B. Le barre sono adiacenti
Istogrammi a barre: var. continue
COME costruire una distribuzione di frequenza per classi… Non elencare ciascun singolo punteggio nello spazio dei punteggi (Es. 18,19,20,21,…) Scegliere l’ampiezza dell’intervallo (Es. 3 punti), in modo da raggruppare i punteggi in intervalli di classe sempre uguale (Es. 18,19,20,5 - 21,22,23,5 - …) fino a che l’intero spettro dei punteggi ottenuti non è coperto. 3) Riferire le frequenze ai suddetti intervalli. N.B. La distr. di freq. per classi non fornisce la frequenza esatta di ciascun punteggio. Utile quando i dati sono >15.
Rappresentazioni grafiche Per rendere ancora più semplice la lettura dei dati, è possibile riportare le frequenze su alcuni grafici. In particolare vi sono: Grafici a barre Istogrammi a barre Poligoni di frequenza semplice Poligoni di frequenza cumulata
Poligoni di frequenza semplice e cumulata Quando si usano: Si usano per variabili discrete o continue. Costruzione del poligono di frequenza semplice Disporre le frequenze semplici sull’asse verticale e le X sull’asse orizzontale (in ordine crescente). Si segnano i punti in corrispondenza della frequenza di ciascuna X. Si uniscono i punti delle X adiacenti.
Poligono di frequenza semplice
Poligoni di frequenza cumulata Quando si usano: Si usano per variabili discrete o continue. Costruzione del poligono di frequenza semplice Disporre le frequenze cumulate sull’asse verticale e le X sull’asse orizzontale (in ordine crescente). Si segnano i punti in corrispondenza della frequenza cumulata di ciascuna X. Si uniscono i punti delle X adiacenti.
Poligono di frequenza cumulata
RIEPILOGO… La statistica descrittiva serve per rappresentare e riassumere un insieme di dati. Un “valore” è un numero o una categoria; una variabile è una caratteristica che può avere diversi valori. Una tabella di frequenza organizza, in uno schema, i punteggi di ciascuno dei possibili valori con la frequenza dei punteggi con quel valore. Quando ci sono molti valori diversi (>15) è utile una tabella in classi di frequenza. L’andamento delle frequenze in una distribuzione può essere rappresentato graficamente.
Es: costruire una tabella di frequenza È stato richiesto agli studenti di un corso di psicologia di tenere un diario contenente le proprie interazioni sociali per una settimana. Ogni volta che un partecipante (ogni studente) aveva una interazione sociale che durava almeno 10 minuti doveva compilare una scheda. La scheda conteneva domande riguardanti diversi aspetti della conversazione e riguardo il partner della conversazione.
Es: costruire una tabella di frequenza Il numero di interazioni sociali di almeno 10 minuti in una settimana per questi studenti è stato: 48, 15, 33, 3, 21, 19, 17, 16, 44, 25, 30, 3, 5, 9, 35, 32, 26, 13, 14, 14, 47, 47, 18, 11, 5, 19, 24, 17, 6, 25, 8, 18, 29, 1, 18, 22, 3, 22, 29, 2, 6, 10, 29, 10, 29, 21, 38, 41, 16, 17, 8, 40, 8, 10, 18, 7, 4, 4, 8, 11, 3, 23, 10, 19, 21, 13, 12, 10, 4, 17, 11, 21, 9, 8, 7, 5, 3, 22, 14, 25, 4, 11, 10, 18, 1, 28, 27, 19, 24, 35, 9, 30, 8, 26.
COME costruire una tabella di frequenza… 1) Fare un elenco su un foglio di ogni possibile valore (cioè il numero di interazioni), dal minore al maggiore. In questo campione (N=94), il numero minimo di interazioni è 0 e il numero massimo di interazioni è 48. 2) Scorrere uno a uno i punteggi, spuntando ciascun valore nell’elenco. 3) Costruire una tabella che riporta quante volte ciascun valore dell’elenco viene usato.
1) e 2) 17 34 1 18 35 2 19 36 3 20 37 4 21 38 5 22 39 6 23 40 7 24 41 8 25 42 9 26 43 10 27 44 11 28 45 12 29 46 13 30 47 14 31 48 15 32 16 33
3) Tabella di frequenza numero di interazioni sociali in una settima di 94 studenti universitari Punteggio Frequenza 17 4 34 1 2 18 5 35 19 36 3 20 37 21 38 22 39 6 23 40 7 24 41 8 25 42 9 26 43 10 27 44 11 28 45 12 29 46 13 30 47 14 31 48 15 32 16 33
COME costruire una tabella in classi di frequenza Scegliere l’ampiezza dell’intervallo (Es. 2,3,5 o 10 punti), che crei da 5 a 15 intervalli circa, in modo da raggruppare i punteggi in intervalli di classe sempre uguale fino a che l’intero spettro dei punteggi ottenuti non è coperto. Quando si costruisce effettivamente la tabella, assicurarsi di aver stabilito l’inizio di ogni intervallo a un multiplo dell’ampiezza dell’intervallo e il limite superiore di ogni intervallo appena sotto l’inizio dell’intervallo successivo.
COME costruire una tabella in classi di frequenza In questo caso si è scelto di utilizzare 10 intervalli con un’ampiezza di intervallo di 5. Gli intervalli sono: 0-4, 5-9, 10-14, 15-19 ecc. Il limite superiore di ogni intervallo (4,9,14,19, ecc.) è il numero appena sotto l’inizio dell’intervallo successivo (5,10,15,20 ecc.
Tabella in classi di frequenza Intervallo Frequenza 0-4 12 5-9 16 10-14 15-19 20-24 10 25-29 11 30-34 4 35-39 3 40-44 45-49
Esercitazione M Licenza media 24 F Laurea 25 Licenza superiore 30 27 Genere Titolo di studio Età M Licenza media 24 F Laurea 25 Licenza superiore 30 27 28 35 Per le prime due variabili, costruire tutti i grafici adeguati.
Esercitazione: Genere e titolo di studio: Grafici a barre Poligoni di frequenza (semplice e cumulata) Età in classi: Istogrammi a barre
Genere (1=F; 2=M) Tabella di frequenza X F Fc 1 4 2 8
Genere (1=F; 2=M): poligono semplice
Genere (1=F; 2=M): poligono cumulata
Titolo di studio (1=media; 2=superiore; 3=laurea) Tabella di frequenza X F Fc 1 2 4 6 3 8 X= 1) LICENZA MEDIA 2) LICENZA SUPERIORE 3) LAUREA
Titolo di studio: Poligono frequenza semplice
Titolo di studio: Poligono frequenza cumulata