Statistica Scienza che studia i fenomeni collettivi. per esempio: età dei cittadini di un certo paese, la lunghezza delle foglie di un certo tipo di pianta, la durata delle lampadine di una certa marca, ecc… Raccolta di metodi e strumenti matematici utili per organizzare e descrivere una o più serie di dati. Serve a descrivere in modo sintetico i modi in cui un fenomeno si manifesta e a trarre conclusioni generali applicabili ad una scala più amplia.
Statistica descrittiva Ha lo scopo di descrivere una situazione, un fenomeno usando dei numeri. Le caratteristiche della popolazione italiana (censimento); le automobili circolanti in Italia; l’energia prodotta da tutte le contrali elettriche italiane, ecc.. Si tratta principalmente di conteggi estesi a tutta la popolazione statistica e della loro elaborazione per rendere la descrizione oggettiva. Statistica inferenziale In altri casi il conteggio è troppo dispendioso o impossibile da fare perché così lungo che la situazione può cambiare prima di finirlo (es quante persone lavorano e quante sono disoccupate, i telespettatori di un certo programma ecc….); Allora si studia un piccolo gruppo estratto dalla popolazione (cioè un “campione statistico”) e si generalizza il risultato dato dal campione a tutta la popolazione d’origine.
Statistica inferenziale
Statistica descrittiva Raccolta delle informazioni Popolazione STATISTICA Il fenomeno collettivo si presenta in modo diverso in ciascuna unità statistica e prende perciò il nome di VARIABILE. Soggetti interessati al fenomeno. Ciascun soggetto della popolazione prende il nome di UNITÀ STATISTICA. VARIABILI STATISTICHE QUALITATIVE QUANTITATIVE Quando assumono valori numerici: Discreti (numero componenti di un nucleo familiare, numero di vani di un appartamento, ecc); Continui (es. altezza, peso, ecc). Per esempio: nazionalità, colore preferito, sport praticato ecc
Esempio Indagine sul numero di addetti negli esercizi commerciali di una cittadina Variabile considerata: numero degli addetti (variabile quantitativa discreta) Dati raccolti: Numero di unità statistiche: 40
Statistica descrittiva Ha lo scopo di rendere evidenti le caratteristiche salienti del fenomeno studiato; È diversa a seconda del tipo di variabile che si sta studiando. Analisi delle informazioni Tabella delle frequenze Rappresentazione grafica delle frequenze Elaborazione statistica dei dati
Statistica descrittiva Analisi delle informazioni Tabella delle frequenze Frequenza assoluta di un dato (= numero di unità statistiche che presentano quel dato). Frequenza relativa di un dato (= rapporto tra la frequenza assoluta e il numero totale di unità statistiche): Numero decimale compreso tra zero e 1; Percentuale. Nota Nel caso delle variabili continue è necessario raggruppare i dati in classi di eguale ampiezza.
Esempio Dati raccolti: Tabella delle frequenze: Numero totale delle unità statistiche: 40.
Statistica descrittiva Analisi delle informazioni Rappresentazione grafica delle frequenze Ideogramma: visualizzazione tramite un simbolo legato al dato statistico, le cui dimensioni (o il cui numero) è proporzionale alla frequenza del dato stesso. Istogramma: rettangoli (o parallelepipedi) aventi stessa base e altezza proporzionale alla frequenza del dato. Areogramma (o diagramma a torta): usato per rappresentare le frequenze percentuali tramite settori circolari con ampiezze proporzionali alle frequenze stesse.
Esempio Tabella delle frequenze: Numero totale delle unità statistiche: 40. Rappresentazioni grafiche:
Analisi delle informazioni Statistica descrittiva Analisi delle informazioni 3. Elaborazione statistica dei dati: gli indici statistici Sono numeri che esprimono in modo sintetico come si è manifestata la proprietà in esame nella popolazione studiata. Li possiamo interpretare come i valori che meglio sintetizzano i dati raccolti, possono essere il valore più frequente oppure quello che occupa la posizione intermedia nella distribuzione. Moda valore più frequente. Media somma di tutti i valori registrati divisa per il numero totale di valori Mediana valore che occupa la posizione centrale
Moda Valore più frequente. La si può ricavare per tutti i tipi di variabile (qualitative e quantitative). Viene usata solo per scopi descrittivi (non nella statistica inferenziale). Facile da identificare quanto si ha la rappresentazioni delle frequenze sotto forma di istogrammi. Se in una serie di dati c’è un solo valore più frequente si parla di distribuzione unimodale, se ce ne sono 2 di distribuzione bimodale, se sono di più di distribuzione multimodale. Per le variabili continue può variare a seconda di come si definiscono le classi di distribuzione Esempio: La moda è 1005
Media È la somma di tutti i valori registrati divisa per il numero totale di valori. Calcolo: La si può calcolare solo per le variabili quantitative. Esempio:
Mediana Valore che occupa la posizione centrale in un insieme ordinato di dati. È una misura poco influenzata dalla presenza di dati anomali. Calcolo: Disporre i dati in ordine crescente (o decrescente) e contare quanti sono (n); Se n è dispari allora la mediana è il dato centrale (in posizione ); Se n è pari allora la mediana è la media aritmetica dei due dati centrali. La si può calcolare solo per le variabili quantitative. Esempio: 1. 2.
La deviazione standard σ APPROFONDIMENTO La deviazione standard σ Dà una misura della dispersione dei dati intorno alla media. Calcolo:
APPROFONDIMENTO I quartili
Esempio di calcolo dei quartili