STATISTICHE DESCRITTIVE Parte I
ARGOMENTI DELLA LEZIONE concetti introduttivi indici di tendenza centrale
concetti introduttivi Unità statistiche elementi che costituiscono l’oggetto dell’osservazione e le cui proprietà vengono rilevate; Popolazione insieme delle unità statistiche oggetto dell’osservazione; Variabili proprietà, caratteristiche, attributi delle unità di analisi che variano da caso a caso Modalità ogni diversa presentazione della variabile osservata su ciascuna unità di analisi Un insieme (di individui o animali o oggetti o squadre di pallavolo o. . . ) costituisce la parte del mondo che interessa, quella su cui dobbiamo produrre nuove conoscenze, quella che e coinvolta nelle decisioni da prendere. Questo insieme viene chiamato convenzionalmente la polazione di riferimento. Gli elementi della popolazione sono chiamati genericamente unita statistiche. Alcune caratteristiche di tutte o di una parte delle unita statistiche vengono rilevate/misurate. Il risultato di questo rilevare/misurare costituisce quello che chiamiamo i dati. Le unita statistiche sono disomogenee rispetto ai fenomeni rilevati.
distribuzione di frequenza Le distribuzioni di frequenza dipendono dal tipo di dati che vengono raccolti ESEMPIO X = { 2, 1, 1, 1, 2, 2, 3, 3, 3, 4, 3, 4, 4, 5, 4, 4, 5, 5, 6, 7, 5, 5, 6, 7, 8} x 1 2 3 4 5 6 7 8 f
INDICI DI TENDENZA CENTRALE Si tratta di statistiche che consentono di rappresentare, con un unico valore, un insieme di misure. SOMMARIO Moda Mediana Media media aritmetica media geometrica media armonica
moda Si indica con il simbolo Mo. ESEMPIO Dato l’insieme La moda di un insieme di dati è il valore che si presenta con la massima frequenza Si indica con il simbolo Mo. ESEMPIO Dato l’insieme A = 2, 3, 4, 5, 6, 8, 7, 8, 5, 8, 11 si ha Mo = 8 in quanto 8 è il valore che si presenta più frequentemente.
mediana si indica con il simbolo Mdn o Me Se abbiamo un insieme di dati ordinati, definiamo mediana il dato che occupa la posizione centrale nella distribuzione dei dati stessi si indica con il simbolo Mdn o Me il calcolo della mediana differisce a seconda se si hanno dati non raggruppati in classi oppure dati raggruppati in classi
mediana Dati non raggruppati se n è dispari la mediana è il valore centrale della serie stessa; il numero i fornisce la posizione del dato all’interno della serie con la seguente formula
mediana Dati non raggruppati ESEMPIO Consideriamo la serie abbiamo n = 11 e pertanto Mdn = 17, ossia il sesto dato della serie.
mediana Dati non raggruppati se n è pari nessuno dei valori è il valore centrale della serie stessa; la mediana si trova fra i due valori centrali e la sua posizione i sarà
mediana Dati non raggruppati ESEMPIO Consideriamo la serie abbiamo n = 6 e pertanto la mediana è compresa tra 8 e 12, ossia tra il terzo ed il quarto dato della serie.
mediana Dati non raggruppati Si tenga presente che, se i dati sono in scala a intervalli, è possibile definire il valore esatto della mediana come valore medio fra i due dati centrali: Nell’Esempio precedente il valore esatto della mediana sarà : Mdn = (8 + 12)/2 = 10
mediana Dati raggruppati Se i dati sono continui, discretizzati e raggruppati in classi di frequenza la mediana si calcola per interpolazione lineare: dove Linf, fm e sono rispettivamente limite inferiore, frequenza e ampiezza della classe mediana; n la numerosità dei casi e Finf la frequenza cumulata fino al limite inferiore della classe.
Esempio[1] Nella seguente tabella sono raccolti i dati relativi al peso dei giocatori di una rosa di una squadra di calcio (n=23). Indice i Peso in Kg fi Fi 1 60 - 65 2 65 - 70 3 70 - 75 4 7 75 - 80 6 13 5 80 - 85 19 85 - 90 21 90 - 95 22 8 95 - 100 23 Calcolare la mediana della distribuzione data. Nota: gli intervalli di frequenza si intendono del tipo “primo valore incluso – secondo valore escluso”.
Esempio[2] Per prima cosa, identifichiamo la classe mediana. Quindi la classe che contiene la mediana è la quarta ( i=4 ). Applicando infine la formula per il calcolo della mediana otteniamo: Si può quindi affermare che il 50% dei calciatori della squadra pesa meno di 78.75 Kg.
media aritmetica La media aritmetica è una funzione che associa ad ogni insieme di n dati un valore numerico pari alla somma dei dati diviso il numero n dei dati stessi. il calcolo della media ha procedure diverse a seconda che i dati siano o meno raggruppati in classi
media aritmetica Dati non raggruppati ESEMPIO Dato l’insieme si ha
media aritmetica Dati raggruppati se i dati sono raggruppati in una tabella del tipo xi x1 x2 … xj xn fi f1 f2 fj fn la media si calcola con
media aritmetica Dati raggruppati xi 3 7 10 22 30 fi 2 4 1 ESEMPIO sia data la seguente tabella di frequenza xi 3 7 10 22 30 fi 2 4 1 la media sarà
Esempio[1] - dati raggruppati in classi - Nella seguente tabella sono raccolti i dati relativi al peso dei giocatori di una rosa di una squadra di calcio (n=23). Indice i Peso in Kg fi Fi 1 60 - 65 2 65 - 70 3 70 - 75 4 7 75 - 80 6 13 5 80 - 85 19 85 - 90 21 90 - 95 22 8 95 - 100 23 Calcolare la media della distribuzione data. Nota: gli intervalli di frequenza si intendono del tipo “primo valore incluso – secondo valore escluso”.
Esempio[2] - dati raggruppati in classi - Per calcolare la media dei dati si dovrà ricorrere alla seguente formula: Dove xvci rappresenta il valore centrale della classe i-esima. (Per valore centrale di una classe di frequenza, si intende la media tra il limite inferiore e il limite superiore della classe stessa). Ad esempio il valore centrale della seconda classe ( i=2 ) sarà:
Esempio[3] - dati raggruppati in classi - Applicando la formula per il calcolo della media si ottiene: Il peso medio dei calciatori e quindi pari 78.8 Kg.
media geometrica La media geometrica si usa quando le grandezze si susseguono in progressione geometrica o per grandezze che misurano variabili relative per dati non raggruppati si usa per dati raggruppati
media armonica La media armonica si definisce con la seguente relazione: se i dati non sono raggruppati in classi se i dati sono raggruppati
Moda, Mediana, Media - considerazioni finali - Sia la moda, sia la mediana, sia la media sono dette misure di tendenza centrale, ossia sono considerate un indice dell'andamento della parte centrale della distribuzione; tali indici differiscono fra loro in vari modi. La moda è significante a livello della scala nominale, la mediana è significante a livello della scala ordinale e la media a livello della scala ad intervalli.