la statistica A cura di: Manuela Mangione
Cos’è? Una scienza che studia dei fenomeni collettivi fornendo strumenti che servono per ottenere tutte le informazioni che possono interessare Perché studiare la statistica? Una delle esigenze fondamentali della società moderna è la possibilità di avere informazioni corrette e in modo rapido sintesi di dati sotto forma di sondaggi, grafici,...
Statistica descrittiva Si occupa della raccolta, del riordino, nonché della presentazione e dell’analisi dei dati ottenuti dalla studio di un fenomeno collettivo Statistica inferenziale Si occupa di estendere i risultati ottenuti con la statistica descrittiva a insiemi più numerosi di quelli studiati (sondaggi di voto e exit-pool).
Note storiche 2300 a. C. : scritti cinesi con annotazioni su misure di terreni e numerazioni degli abitanti Bibbia : censimenti degli Ebrei da parte degli Egizi; censimenti demografici e catasti da parte del popolo egizio Impero Romano : varie registrazioni dei dati relativi all’Impero Medioevo : scarsa documentazione 1600 1700 : tabelle comparative delle risorse geografiche ed economiche dei vari Stati 1800 Laplace : calcolo delle probabilità, si associa modelli probabilistici allo studio di fenomeni statistici 1900 : statistica come scienza autonoma , formalizzazione dell’inferenza statistica
LINGUAGGIO DELLA STATISTICA Popolazione statistica (universo) Unità statistiche Carattere (proprietà oggetto di studio) Carattere qualitativo (mutabile) e quantitativo (variabile) Variabili discrete e continue (carattere quantitativo) Modalità (dati) Frequenze assolute, relative, percentuali, cumulate
Fasi di un indagine statistica Definizione degli obiettivi Individuazione del fenomeno e del collettivo Raccolta dei dati Spoglio e trascrizione dei dati Elaborazione dei dati Interpretazione dei risultati e divulgazione
Raccolta dei dati Natura dei dati Metodi di raccolta dei dati (globale o campionaria) Rilevazioni preliminari o definitive; occasionali, periodiche o continue Tecnica di raccolta dei dati ( uso di registri , intervista, compilazione di questionari con risposta aperta o chiusa) Organi predisposti alla raccolta dei dati
Spoglio e trascrizione dei dati Enumerazione dei dati Classificazione Trascrizione in tabelle (semplici , complesse, a doppia entrata) (serie e seriazioni)
ELABORAZIONE DEI DATI
ELABORAZIONE DEI DATI Esercizio proposto Ad un concorso partecipano 398 persone le quali provengono da diverse scuole secondo quanto mostra la seguente tabella: Calcolare qual è il peso di ciascuna scuola sul numero totale dei candidati. (Rapporti di composizione)
Misure di tendenza centrali Misure di concentrazione ELABORAZIONE DEI DATI Misure di tendenza centrali Misure di variabilità Misure di concentrazione
Misure di tendenza centrali ELABORAZIONE DEI DATI Misure di tendenza centrali Data una distribuzione di dati disposti in ordine crescente o decrescente si definisce media un qualunque valore non minore del più piccolo e non maggiore del più grande Esempio: 7 10 20 52 Importanza: fornisce un’indicazione sintetica dei dati di una distribuzione secondo un criterio stabilito a priori Medie di calcolo (medie ferme) Medie di posizione
Medie di calcolo: Media aritmetica ELABORAZIONE DEI DATI Medie di calcolo: Media aritmetica Media aritmetica semplice: (proporre ad allievi) Esempio 1: Consideriamo gli arrivi di ospiti stranieri, nella totalità degli esercizi ricettivi italiani, per i mesi estivi dell’anno xxxx: Calcolare la presenza media di stranieri nei mesi estivi M = 2643 migliaia
Medie di calcolo: Media aritmetica Media aritm ponderata= ELABORAZIONE DEI DATI Medie di calcolo: Media aritmetica Esempio 2 (proporre ad allievi): Calcolare il numero medio dei vani delle abitazioni occupate in una certa provincia italiana con i dati della seguente tabella: Media aritm ponderata= 3,71
Medie di calcolo: Media aritmetica ELABORAZIONE DEI DATI Medie di calcolo: Media aritmetica xi n I =1 Media aritmetica semplice: xipi I =1 n Media aritmetica ponderata: n pi i = 1 Caratteristiche e proprietà della media aritmetica: la somma degli scarti dalla media aritmetica è nulla; la somma dei quadrati degli scarti dalla media è minima
ELABORAZIONE DEI DATI (ancora un esempio di media aritmetica nel caso di distribuzione per classi) Media 31,25 NB = il calcolo, in questo caso, viene effettuato sostituendo a ciascuna classe il termine centrale
Altre medie di calcolo Media geometrica semplice e ponderata (Mg) Media quadratica semplice e ponderata (M2) Media armonica semplice e ponderata (Ma) In pratica qual è meglio usare? Non è possibile fissare regole precise: dipenderà dal tipo di problema che suggerirà di usare una piuttosto che l’altra…. M2 > M > Mg > Ma
Altre medie di calcolo (esercizi da proporre agli allievi) 1) Deposito un capitale di 1 euro in banca per 3 anni. La banca mi calcola gli interessi ad un tasso composto annuo del 7% per il primo anno, 7.5% per il secondo, 8% per il terzo. Determinare il tasso medio applicato dalla banca. 2) Con una bilancia di precisione sono state determinate le differenze di peso tra 4 lamine di titanio rispetto a una di riferimento, ottenendo i seguenti valori - 4, 3, 5, - 3. Determinare la differenza media del peso delle lamine da quella di riferimento. 3) Per 3 anni consecutivi ho speso, per riscaldare il mio appartamento, sempre lo stesso importo di 500 euro, acquistando il metano a euro 0,29 /MC il primo anno, a euro 0,32/MC il secondo e a euro 0,32/MC il terzo. Voglio determinare il costo medio di un MC di metano per l’intero periodo.
Medie di posizione: Moda ELABORAZIONE DEI DATI Medie di posizione: Moda Moda o termine modale di una distribuzione è il termine al quale corrisponde la massima frequenza Es: Nota la distribuzione Esito lancio di un dado: 1 2 3 4 5 6 Frequenze 7 11 9 14 6 3 Totale 50 Moda? 4 N. B. = Non si può parlare di moda nel caso di una distribuzione non ponderata oppure nel caso in cui, pur essendo la distribuzione ponderata , i termini si presentano tutti con la stessa frequenza (sono tutte mode!!).
Medie di posizione: Moda ELABORAZIONE DEI DATI Medie di posizione: Moda Caso di distribuzione per classi A) se le classi hanno tutte uguale ampiezza, si dice classe modale quella a cui corrisponde la maggiore frequenza B) se le classi non hanno uguale ampiezza, la classe modale è quella a cui corrisponde il più alto rapporto tra frequenza e ampiezza della classe Classe modale 400-600
Medie di posizione: Mediana ELABORAZIONE DEI DATI Medie di posizione: Mediana La mediana è il termine che occupa il posto centrale nella distribuzione quando i dati son disposti in ordine cresecente Es Distribuzioni semplici: 3, 8, 6, 21, 15 Me :8 e se aggiungessi anche il termine 45? Me= (8+15)/2=11,5 Distribuzioni ponderate: 60/2=30 Me = 21
Medie di posizione: Mediana ELABORAZIONE DEI DATI Medie di posizione: Mediana 400/2= 200 Me= 40 + x 48:114=x:10 x = 4,21 Me = 44,21 Ipotesi:i dati si distribuiscono all’interno della classe in modo uniforme Distribuzioni per classi: