La Statistica Istituto Comprensivo “ M. G. Cutuli” E’ la scienza che studia i fenomeni collettivi utilizzando strumenti matematici Nello studio della statistica un parametro molto importante è la frequenza di un fenomeno Professoressa Giovanna Scicchitano
Sull’ intera popolazione Rilevamento o indagine totale Indagine statistica Sull’ intera popolazione Rilevamento o indagine totale (es: censimento ) STATISTICA DESCRITTIVA Trarre indicazioni sull’intera popolazione (descrivere il fenomeno) Su un campione della popolazione statistica (rilevamento o indagine campionaria) STATISTICA INDUTTIVA Trarre indicazioni dal campione che siano valide per l’intera popolazione Professoressa Giovanna Scicchitano
Variabile statistica Categorica (classificazione) Ordinale Qualitativa quando assume valori non numerici es: sport praticato Categorica (classificazione) Ordinale (ordinamento) Quantitativa quando assume valori numerici es: ore dedicate allo sport Discreta (conteggio) Continua (misurazione) Professoressa Giovanna Scicchitano
Fasi di un’indagine statistica Rilevamento dati Tabulazione dati Trascrizione dati Elaborazione dati Rappresentazione dati Interpretazione dati Professoressa Giovanna Scicchitano
Rilevamento, Tabulazione e Trascrizione dei dati I dati codificati di una rilevazione statistica effettuata su n unità statistiche con riferimento a p variabili, vengono raccolti in una tabella che viene chiamata “matrice dei dati” Professoressa Giovanna Scicchitano
Elaborazione dei dati Avviene con: Frequenza assoluta Frequenza relativa Frequenza cumulata Indici statistici Professoressa Giovanna Scicchitano
Elaborazione dei dati La frequenza assoluta di un evento o di un fenomeno è il numero delle volte in cui esso si è presentato nell’indagine La frequenza relativa f di un evento o di un fenomeno è il rapporto tra la frequenza assoluta e il numero totale dei casi esaminati Se addizioniamo ad una frequenza (assoluta o relativa) tutte le frequenze che la precedono, otteniamo la frequenza cumulata Professoressa Giovanna Scicchitano
es. sport praticato Sport praticato Frequenza assoluta cumulata relativa In % calcio 8 8/23=0,3478 34,78% tennis 4 12 4/23=0,1739 17,39% nuoto 3 15 3/23=0,1304 13,04% basket 2 17 2/23=0,0869 8,69% pallavolo 19 danza 23 totale 1 100% Professoressa Giovanna Scicchitano
INDICI STATISTICI di POSIZIONE DISPERSIONE Professoressa Giovanna Scicchitano
INDICI DI POSIZIONE MODA (o valore modale) MEDIA MEDIANA QUANTILI Professoressa Giovanna Scicchitano
MEDIA ARITMETICA E’ un carattere quantitativo e ci fornisce la posizione del valore più corretto per rappresentare i dati. Si calcola sommando di tutti i valori delle variabili della popolazione diviso il numero di unità della popolazione (n) Es: (290+303+309+290+267+283+300+289+286+234)/10= 285,1 290 303 309 267 283 300 289 286 234 Professoressa Giovanna Scicchitano
MEDIA PONDERATA Si calcola moltiplicando ogni valore di una serie per la sua relativa frequenza, sommarli tra loro e dividere il tutto per la somma delle frequenze. Es. Serie di valori: 1,2,3,4,5 Frequenze: 4,6,3,5,7 (1*4)+(2*6)+(3*3)+(4*5)+(5*7) /(4+6+3+5+7)= 80/25= 3,2 Professoressa Giovanna Scicchitano
MODA E’ un carattere qualitativo e ci fornisce la posizione del dato che si presenta con la maggior frequenza. La moda è il valore più frequente di una distribuzione, o meglio, la modalità più ricorrente della variabile (cioè quelle a cui corrisponde la frequenza più elevata). Es: 290 303 309 267 283 300 289 286 234 Professoressa Giovanna Scicchitano
MEDIANA E’ un carattere quantitativo, rappresenta il valore che occupa la posizione centrale in un insieme ordinato di dati. Altro non è che il secondo quartile Q2 Per calcolare la mediana di un gruppo di dati, bisogna: 1. disporre i valori in ordine crescente oppure decrescente e contare il numero totale n di dati; 2. se il numero (n) di dati è dispari, la mediana corrisponde al valore numerico del dato centrale, quello che occupa la posizione (n+1)/2; 3. se il numero (n) di dati è pari, la mediana è stimata utilizzando i due valori centrali che occupano le posizioni n/2 e n/2+1: Professoressa Giovanna Scicchitano
es. i numeri n è pari quindi (289+290)/2= 289,5 290 303 309 267 283 300 289 286 234 Vanno ordinati in modo crescente 234 267 283 286 289 290 300 303 309 n è pari quindi (289+290)/2= 289,5 Professoressa Giovanna Scicchitano
QUANTILI I quantili sono una famiglia di misure, a cui appartiene anche la mediana, che si distinguono a seconda del numero di parti uguali in cui suddividono una distribuzione. I quartili ripartiscono la distribuzione in 4 parti di pari frequenza, dove ogni parte contiene la stessa frazione di osservazioni: Il primo quartile è definito come il numero Q1 per il quale il 25% dei dati statistici è minore o uguale a Q1. Il secondo quartile è definito come il numero Q2 per il quale il 50% dei dati statistici è minore o uguale a Q2. Il secondo quartile corrisponde alla mediana Il terzo quartile è definito come un numero Q3 per il quale il 75% dei dati statistici è minore o uguale a Q3. Professoressa Giovanna Scicchitano
formano il ‘Riassunto a due numeri’ Valore MIN = 234 Valore MAX =309 MIN = 234 Q2 (mediana)= 289,5 MAX =309 formano il ‘Riassunto a tre numeri’
formano il ‘Riassunto a cinque numeri’ Q1 (primo quartile) MIN Q2 (mediana) MAX Q3 (terzo quartile) Scarto interquartile detto anche Distanza Interquartile IQR (Inter Quartile Range) è la differenza tra terzo quartile - primo quartile = Q3 – Q1 Professoressa Giovanna Scicchitano
Scarto interquartile detto anche Distanza Interquartile IQR (Inter Quartile Range) E’ la differenza tra terzo quartile - primo quartile = Q3 – Q1 E’ un indice di dispersione ( o indice di variabilità o di variazione), serve per descrivere una distribuzione statistica quantitativa, ovvero è una misura che ci indica di quanto i valori si allontanino da un valore centrale es. media o mediana
Rappresentazione grafica dei dati Si può effettuare con: ideogrammi: disegni stilizzati che visualizzano i dati stessi ortogrammi: rappresentano la frequenza assoluta areogrammi: rappresentano la frequenza relativa grafici cartesiani: utili per visualizzare l’andamento della variazione dei dati scatola – baffi: visualizza Q1, MIN, Q2, MAX e Q3 Professoressa Giovanna Scicchitano
ortogramma Professoressa Giovanna Scicchitano
Areogramma Professoressa Giovanna Scicchitano
Grafico cartesiano Professoressa Giovanna Scicchitano
Box-plot o Scatola - baffi 234 267 283 Q1 283,75 286 MIN 289 Mediana 289,5 290 MAX 309 Q3 297,5 300 303 Professoressa Giovanna Scicchitano
Box-plot o Scatola - baffi E’ una rappresentazione grafica utilizzata per descrivere la distribuzione di un campione tramite Indici di dispersione e Indici di posizione
Indici di dispersione Sono indici che danno una misura o della variabilità dei valori della distribuzione rispetto a una media o di quanto i valori stessi differiscono tra loro
CAMPO DI VARIAZIONE VARIANZA Indici di dispersione Professoressa Giovanna Scicchitano
Campo di variazione (o “range”) Il campo di variazione di una distribuzione è la differenza tra il dato più grande e quello più piccolo della distribuzione: C= xmax - xmin 290 303 309 267 283 300 289 286 234 (309 – 234) = 75 Professoressa Giovanna Scicchitano
ANALISI della Dispersione Ci fornisce informazioni su quanto i dati in nostro possesso sono concentrati vicino alla media o al valore centrale. La base dell’analisi di dispersione è lo studio degli scarti. Lo scarto assoluto è il valore assoluto della differenza fra la media aritmetica del campione e il valore statistico considerato. Lo scarto medio assoluto è la media degli scarti assoluti dei singoli dati Professoressa Giovanna Scicchitano
Misura di distorsione La misura di distorsione è data dalla media di ogni singolo campione meno la lunghezza bersaglio Es: La lunghezza bersaglio è 200 290 303 309 267 283 300 289 286 234 Professoressa Giovanna Scicchitano
Si calcola nel seguente modo 290 – 200= 90 303 – 200= 103 309 – 200= 109 290 – 200= 90 267 – 200= 67 283 – 200 = 83 300 – 200= 100 289 – 200= 89 286 – 200= 86 234 – 200= 34 Punteggio di distorsione: (90+103+109+90+67+83+100+89+86+34)/10= 85,1 Professoressa Giovanna Scicchitano
Varianza Misura che caratterizza molto bene la variabilità di una popolazione es: Calcoliamo la media (290+303+309+290+267+283+300+289+286+234)/10= 285,1 Calcoliamo la varianza (290-285,1) +(303-285,1) +(309-285,1) +(290-285,1) +(267-285,1) + +(283-285,1) +(300-285,1) +(289-285,1) +(286-285,1) +(234-285,1) /(10-1)= 1155,52:9= 128,39 290 303 309 267 283 300 289 286 234 2 2 2 2 2 2 2 2 2 2 Professoressa Giovanna Scicchitano
Devianza Nel calcolo di alcune statistiche si ricorre alla devianza, data dal numeratore della varianza: 1155,52 Professoressa Giovanna Scicchitano