“Una delle più grandi scoperte che un uomo può fare, una delle sue più grandi sorprese, è scoprire che può fare ciò che aveva paura di non poter fare”. Henry Ford “I hear and I forget. I see and I remember. I do and I understand”. Confucius
CONCETTI CHIAVE… La VARIABILE è ciò che si intende misurare nei casi (unità) e può avere diversi valori. Un VALORE è un numero o una categoria. Il valore della risposta di ogni unità è il PUNTEGGIO. Variabile -> Stress Valore -> Da 0 a 10 Punteggio -> 6
Statistica descrittiva Distribuzioni, tabelle e grafici di frequenza Indici di: tendenza centrale, di posizione e di variabilità Punti z e distribuzione normale
Indici di tendenza centrale Un indice di tendenza centrale è un valore che descrive e riassume il centro di una distribuzione di dati.
Indici di tendenza centrale Un gruppo di punteggi può essere descritto attraverso un valore rappresentativo (o tipico). Un valore rappresentativo esprime la tendenza centrale di un gruppo di punteggi. Un valore rappresentativo è un modo semplice di descrivere con un unico numero, un gruppo di punteggi.
Indici di tendenza centrale Sono dei singoli numeri che descrivono la posizione del punto centrale di una distribuzione. Gli indici di tendenza centrale sono: Moda -> valore con la frequenza maggiore -> Mo Media -> valore medio di un gruppo di punteggi -> Mediana -> valore che occupa la posizione centrale -> Mdn N.B. Ogni misura di tendenza centrale usa un proprio metodo specifico per trovare un singolo numero che rappresenti il centro di un gruppo di punteggi.
Indice di tendenza centrale: Moda La moda (Mo) di una distribuzione di dati rilevati su una variabile, è il valore che si presenta con la frequenza maggiore in una distribuzione. Distribuzione: 1 1 1 2 2 2 2 3 3 3 Mo= 2
Moda La moda (Mo) è il valore che ha la frequenza maggiore in X f 18 1 19 20 21 22 23 24 25 26 27 28 2 29 30 3 La moda (Mo) è il valore che ha la frequenza maggiore in una tabella di frequenza. È l’unico indice per le variabili nominali.
Moda Una distribuzione può avere anche 2 X f 18 1 19 20 21 22 23 24 25 26 27 28 2 29 3 30 Una distribuzione può avere anche 2 o più mode, dato che è possibile che due punteggi vengano ottenuti con la stessa frequenza. Se c’è una sola moda, la distribuzione si dice Unimodale; Se sono 2, Bimodale; Se sono più di 2, Multimodale.
Mo= 2 (ma non ha molto senso) Moda Se ci sono molte categorie, oppure poche categorie con frequenze simili, la moda non ha molto senso. 1 1 1 2 2 2 2 3 3 3 Mo= 2 (ma non ha molto senso)
Qual è la Moda? Rispetto alla variabile “NUMERO DI SOGNI in una in una settimana 7 8 3 1 9 6 Qual è la Moda? Rispetto alla variabile “NUMERO DI SOGNI in una settimana”, la moda è la modalità 8 a cui è associata una frequenza di 3.
Qual è la Moda? Rispetto alla variabile “Numero di figli”, la Codice mamma Numero di figli 1 2 3 4 5 6 7 8 9 10 11 12 Rispetto alla variabile “Numero di figli”, la moda è la modalità 0 a cui è associata una frequenza di 5.
Indice di tendenza centrale: Media La media di una distribuzione di dati rilevati su una variabile, è il valore dato dalla somma di tutti i valori, diviso per il numero di unità statistiche (N). La media si indica con il simbolo N.B. Per indicare la media, quando ci si riferisce a popolazioni, piuttosto che a campioni, si usa la lettera greca μ (mi ) al posto di
X sta per tutti i valori nella distribuzione della variabile X. Media campionaria È l’indice di tendenza centrale più utilizzato. Formula: MEDIA DEL CAMPIONE SOMMA DEI PUNTEGGI NUMERO TOTALE DEI CASI (Sigma) sta per somma di… Significa sommare tutti i punteggi che seguono. X sta per tutti i valori nella distribuzione della variabile X. N sta per numero totale.
Es. calcolo della Media (10; 15; 16; 18; 20; 24; 32; 35; 38; 40)=24.8 10+15+16+18+20+24+32+35+38+40=248/10
Caratteristiche principali: Media campionaria Caratteristiche principali: Considera tutti i punteggi; È “sensibile” ai valori estremi; È sempre interna; Può essere calcolata solo per scale a intervalli e a rapporti equivalenti.
Calcolare la media Esercizio* 1, 2, 3, 4, 5 Soluzione* (1+2+3+4+5)/5=15/5= 3 Esercizio** 3, 4, 5, 6, 7 Soluzione** (3+4+5+6+7)/5=25/5= 5 Esercizio*** 2, 4, 6, 8, 10 Soluzione*** (2+4+6+8+10)/5=30/5= 6
Es. Calcolare la media della variabile “stress” Ad un gruppo di studenti universitari, è stato chiesto di rispondere ad una domanda per indagare il loro livello di stress nella prima settimana del corso di psicometria. D: “Usando una scala da 0 a 10, con zero equivalente a per nulla stressato e dieci equivalente a più stressato possibile, quanto ti sei sentito stressato nelle ultime due settimane?”
Esempio: Calcolare la media della variabile “stress” N = 30 8, 7, 4, 10, 8, 6, 8, 9, 9, 7, 3, 7, 6, 5, 0, 9, 10, 7, 7, 3, 6, 7, 5, 2, 1, 6, 7, 10, 8, 8 8 + 7 + 4 + 10 + 8 + 6 + 8 + 9 + 9 + 7 + 3 + 7 + 6 + 5 + 0 + 9 + 10 + 7 + 7 + 3 + 6 + 7 + 5 + 2 + 1 + 6 + 7 + 10 + 8 + 8 = 193 193 / 30 = 6.43
Es. Calcolare la media della variabile “voto esame psicometria” Unità Genere Voto scuola media Voto esame psicometria Numero di Bocciature Alice 1 30 Giulia 3 28 Marco 2 4 27 Marta 25 Giuseppe Elisa Franca 22 Rita 18 Paolo
Calcolo della Media attraverso la tabella di frequenza Formula: Ossia: Moltiplicare ciascuna X con la relativa frequenza; Sommare i prodotti; Dividere per N.
Calcolo della Media attraverso la tabella di frequenza Punteggi rappresentati sotto forma di una distribuzione di frequenza: 1, 1, 1, 2, 2, 2, 2, 2, 2, 3, 3 = 1.9 X f fX 1 3 2 6 12 11 21 Tabella dove per ogni valore (X) indichiamo a fianco la frequenza (f) con cui compare. 21 = = 1.9 11
Esempio Distribuzione: 18 22 25 27 28 28 30 30 30 Voto Frequenza 18 1 18 22 25 27 28 28 30 30 30 Voto Frequenza 18 1 22 25 27 28 2 30 3 Somma f X 18 22 25 27 56 90 238 Media 238/9 26,44
Media ponderata La “media ponderata” o “pesata” si utilizza quando i punteggi (X) hanno un peso (P) diverso. Il calcolo consiste nel: Moltiplicare ciascun punteggio per il relativo peso; Sommare i prodotti; Dividere per la somma dei pesi.
Media ponderata Esempio: Calcolare la media ponderata, sapendo che i voti sono 30, 25 e 28 con crediti rispettivamente di 12, 10 e 6. La media corretta è 27,79 (e non 27,66 che non considera i pesi). Voto Crediti 30 12 25 10 28 6 Voto x crediti 360 250 168 Somma 28 778 Media ponderata 778/28 27,79
Proprietà 1) Aggiungendo o sottraendo una costante (k), la media sarà uguale alla media originaria più (o meno) la costante. ES: distribuzione 3 4 8 = 5; se sommiamo K=2 alle X iniziali, avremo 3+2, 4+2; 8+2 Ossia 5 6 10 con media uguale a ? = 5+2
Utilità delle proprietà 1 Es 1 Calcolare la media della seguente distribuzione senza calcolatrice 11352 11356 11346 11354 Sottraggo il punteggio più basso (11346) a tutti i punteggi ottenendo: 6 10 0 8 Calcolo “nuova” media: 24/4 = 6 Calcolo la media originale sommando 6 al numero che avevo precedentemente sottratto: 6 + 11346= 11352
Proprietà 2) 2) Moltiplicando o dividendo per una costante (k), la media sarà uguale alla media originaria per (o diviso) la costante. ES: distribuzione 3 4 8 = 5; se moltiplichiamo K=2 alle X iniziali: 3*2, 4*2; 8*2 Ossia 6 8 16 con media uguale a ? = 5*2
Utilità delle proprietà 2 Es 2 Trasformare la media ponderata in voto di laurea? Voto laurea = *110/30 ES media errata: VL (27,66) = 27,66*110/30=101,42 voto 101 ES media corretta: VL (27,79) = 27,79*110/30=101,90 voto 102
Proprietà 3) 3) La somma delle deviazioni (scarti o differenze) dei punteggi dalla media è uguale a 0. X 1 2 3 8 = 3 1 - 3 2 - 3 3 - 3 8 - 3 X-3 -2 -1 5
Proprietà 3) Federico Sabrina Paolo Euro 22.0 Sara TOTALE A TESTA 18 + 16.5 + 22.0 + 17.5 = 74 74 / 4 = 18.5 Ovvero 18.5 * 4 = 74
Proprietà 3) Qualcuno paga di più e qualcuno di meno, ma, alla fine, il “di più” si annulla con il “di meno”. = 18.5 X X - Federico 18.0 18 - 18.5 = 0.5 Sabrina 16.5 16.5 - 18.5 = 2.0 Paolo 22.0 22.0 - 18.5 = -3.5 Sara 17.5 17.5 - 18.5 = 1.0 TOTALE 74.0 74.0 - 74.0 = 0
Proprietà: Tabella di frequenza Anche per le tabelle di frequenza la somma delle deviazioni dei punteggi dalla media è uguale a 0. In questo caso è necessario moltiplicare le deviazioni per le frequenze. X f 1 2 3 8 X-3 1-3 = -2 2-3 = -1 3-3 = 0 8-3 = 5 f(X-3) -2*2 = -4 -1*1= -1 0*0 = 0 5*1 = 5 -4 + -1 + 0 + 5 = 0
Esercitazione Verificare che la somma degli scarti dei punteggi dalla media è uguale a 0. Voto Frequenza 2 1 3 4 5 X-4 -2 -1 1 f (X-4) -2 4
Indice di tendenza centrale: Mediana La mediana di una distribuzione di dati ordinati (in ordine crescente) rilevati sulla variabile X, è il dato che occupa la posizione centrale rispetto alla distribuzione dei dati. La mediana si indica con il simbolo Mdn. È un indice di tendenza centrale che consente di suddividere la distribuzione in due parti uguali, ossia di individuare il punteggio sotto il quale si colloca il 50% del campione. La mediana non è influenzata da valori estremi.
Calcolo della mediana Assicurarsi che le variabili siano su scala ad intervalli. La distribuzione dei punteggi deve essere ordinata dal valore minore a quello maggiore. Se N (numerosità totale) è dispari la Mdn è il valore in posizione centrale, corrispondente a (N+1)/2 Se N (numerosità totale) è pari la Mdn è calcolata facendo la semisomma tra i due punteggi centrali cioè N/2 e N/2+1.
Calcolo della mediana punteggi dispari Voto di 5 studenti esame di psicometria 18; 28; 19; 18; 22 Ordinare i punteggi dal più piccolo al più grande: 18, 18, 19, 22, 28 Calcolare la posizione mediana del dato corrispondente alla mediana utilizzando la formula -> N+1/2 = 5+1/2 = 3 Posizione mediana = 3 Mdn = 19
Calcolo della mediana punteggi pari Se N è pari la Mdn è il valore fra le 2 posizioni centrali. Se i due valori sono uguali, quello è il valore della Mdn. Voto di 6 studenti esame di psicometria 24; 29; 30; 22; 22; 26 Ordinare i voti dal più piccolo al più grande: 22; 22; 24; 26; 29; 30 Calcolare le posizioni centrali utilizzando la formula -> N/2 e N/2 +1 = 6/2= 3 e 6/2 + 1= 4 La Mdn dei dati è compresa tra 24 e 26.
Calcolo della mediana punteggi pari Se N è pari e i dati oltre che ordinali sono anche continui è possibile stimare la Mdn attraverso l’interpolazione lineare. Calcolare la Mdn utilizzando la seguente formula -> Mdn= Xinf + Xsup /2 Voto di 6 studenti esame di psicometria 22; 22; 24; 26; 29; 30 Mdn= 24+26/2= 50/2= 25 La Mdn è 25.
Mediana: uso della frequenza (n dispari) Posizione Mediana: (n+1)/2 = (7+1) / 2 = 8/2 = 4 4 è la posizione che occupa il punteggio, ma non è la mediana!!! X f fc 1 3 2 4 5 6 39 7 mediana posizione
Mediana: uso della frequenza (n pari) Posizione Mediana: (n+1)/2 = (8 + 1) / 2 = 9/2 = 4,5 Significa che la mediana si trova tra le fc 4 e 5: bisogna calcolare la media dei punteggi corrispondenti alla 4° e 5° posizione. X f fc 1 3 2 4 5 6 39 8 posizione mediana: 2+3/2=2,5
Mediana: uso della percentuale Calcolare la percentuale dei punteggi della seguente distribuzione: 18 22 25 27 28 28 30 30 30 X f fc 18 1 22 2 25 3 27 4 28 6 30 9 Calcolo della percentuale: %X= (f/N)100 %18=(1/9) 100= 11,11
Calcolo della mediana: % cumulata X f fc % 18 1 11,11% 22 2 25 3 27 4 28 6 22,22% 30 9 33,33% %c 11,11% 22,22% 33,33% 44,44% 66,66% 100,0% la mediana è il punteggio sotto il quale si trova il 50% della distribuzione
Calcolo della mediana: % cumulata Calcolare la mediana, attraverso la percentuale cumulata, sulla seguente distribuzione: 1 1 2 4 X f fc % 1 2 50% 3 25% 4 %c 50% 75% 100% Se si raggiunge esattamente il 50% è necessario calcolare la media dei due punteggi Posizione=(N+1)/2= (4+1)/2=2,5 Mdn si trova tra le posizioni 2 e 3 di fc Mdn=(1+2)/2=1,5
Calcolare la Mediana Esercizio* 3, 5, 7, 9, 11 Soluzione* N=5; pos Mdn=3; Mdn=7 Esercizio** 2,3,5,7,9,11,12 Soluzione** N=7; pos Mdn=4 Mdn=7 Esercizio*** 3,4,5,6,7,8 Soluzione*** N=6; pos Mdn=3 e 4 Mdn=5;6 (5.5)
Scale e indici di tendenza centrale Moda Mediana Media Nominale Si Ordinale Intervalli Rapporti Applicabilità degli indici a seconda della scala di misura
Esercitazione Moda, Media e Mediana Scrivere la formula per la media e definire ognuno dei simboli. Calcolare la Media dei seguenti punteggi: 2, 3, 3, 6, 6 ( X )/N (2+3+3+6+6)/5= 4 Per i seguenti punteggi, trovare Moda, Media e Mediana 5, 3, 2, 13, 2 Mo= 2; Media= 5; Mdn= 3