1 A.A STATISTICA E CALCOLO DELLE PROBABILITA’ Docenti: Stefania Mignani Maurizio Brizzi
2 ANALISI DEI DATI ANALISI "STATISTICA" DEI DATI Definizione di Statistica "Statistica è la scienza che sviluppa metodi per l’analisi dei fenomeni collettivi"
3 Studio di un fenomeno Ricerca di tendenzedi tendenze comportamenti tipicicomportamenti tipiciVerifica di ipotesidi ipotesi AsserzioniAsserzioni proposizioniproposizioni Strategie conoscitive Strategie operative
4 RILEVAZIONE DELLE OSSERVAZIONI RILEVAZIONE DELLE OSSERVAZIONI · costruzione della base di dati esperimenti interviste banche dati · unità dell'analisi livello popolazione oggetto di studio · rilevazione totale campionaria ·
5 SISTEMAZIONE DEI DATI PREPARAZIONE DEL DATA SET codifiche controllo errori supporto informatico ANALISI STATISTICA ANALISI STATISTICA
6 STATISTICA DESCRITTIVA (ESPLORATIVA) riassumere e descrivere le caratteristiche di un insieme di dati
7 STATISTICA INFERENZIALE desumere le caratteristiche dell'intera popolazione sulla base dei risultati del campione ANALISI UNIVARIATE ANALISI MULTIVARIATE · associazioni · dipendenza
8 Statistica: Statistica: metodo Oggetto: Oggetto: insiemi di unità Analisi: Analisi: caratteristiche variabili
9 Esempi di insiemi di unità statistiche: abitanti di un quartiere; comuni di una regione; addetti a un ramo di attività economica; imprese di un’area industriale; pezzi prodotti da una macchina automatica; molecole di una nube di gas; cellule di un tessuto organico…
10 Una pluralità di “oggetti” dotati di almeno un carattere comune (variabile o mutabile) costituisce un “insieme statistico” Ciascun oggetto è una “unità statistica” e come tale concorre alla determinazione delle proprietà (statistiche) dell'insieme.
11 1.n unità statistiche (donne) 2.Variabili (figli avuti, posizione occupazionale,titolo di studio,…) SINTESI DELLE INFORMAZIONI Una prima sintesi si attua riunendo le unità in classi “omogenee” Classificazione in k sottoinsiemi (k<n) Astrazione classificatoria Modalità disgiuntive e frequenze
12 3, occupata, scuola superiore 4, casalinga, licenza elementare 2, non occupata, licenza elementare 1, occupata, laurea 1, casalinga, scuola media 0, in cerca di occupazione, laurea 0, occupata, scuola media …
13
14 DistribuzioniStatistiche univariate (una alla volta) Bivariate (due simultaneamente) Multivariate (tre o più simultaneamente)
15 Donne occupate (in attività lavorative), secondo il numero dei figli avuti n° figli n° o più totale (Dati ISTAT)
16 Imprese artigiane secondo il numero di addetti
17 Famiglie italiane per intervalli di reddito annuo
18 Modalità intervallari variabili continue -> scelta di necessità variabili discrete -> scelta di opportunità
19 In simboli n-pla di stati di grandezza di una variabile X insieme statistico di n unità (x 1, x 2,…,x j,…, x n-1, x n ) { x j ; j=1,…,n }
20 Distribuzioni statistiche univariate: variabile discreta
21 Distribuzioni statistiche univariate: variabile continua
22 E’ data la distribuzione di 1863 famiglie italiane secondo il numero di componenti. Esempio Numero di componenti (x i ) Numero di famiglie (n i ) totale1863
23 Distribuzioni 1.Le frequenze relative 2.Le frequenze cumulate non decrescenti 3.Le frequenze relative cumulate non decrescenti
24 Numero di componenti (x i ) Numero di famiglie (n i ) tot1863 Frequenze relative (f i ) 332/ / / / / / /1863 fifi Frequenze relative
25 X <= x i <= 1 <= 2 <= 3 <= 4 <= 5 <= 6 Frequenze cumulate (N i ) NiNi Frequenze cumulate Numero di famiglie (n i ) Tot. 1863
26 FiFi Relative cumulate Frequenze relative cumulate (F i ) 332/ / / / / /1863 X <= x i <= 1 <= 2 <= 3 <= 4 <= 5 <= 6 NiNi