La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Lezione 2 CARATTERI DEI DATI: approfondimento (Borra-Di Ciaccio, cap

Presentazioni simili


Presentazione sul tema: "Lezione 2 CARATTERI DEI DATI: approfondimento (Borra-Di Ciaccio, cap"— Transcript della presentazione:

1 Lezione 2 CARATTERI DEI DATI: approfondimento (Borra-Di Ciaccio, cap
STATISTICA L-33 – a.a. 2016/17 Prof. G. Pellegrini Facoltà di Scienze Politiche – “La Sapienza”

2 Collettivo e Unità Statistiche
Una pluralità di “oggetti” dotati di almeno un carattere comune (variabile, cioè quantitativa, o mutabile, cioè qualitativa) costituisce un “collettivo, o insieme, statistico” Ciascun oggetto è una “unità statistica” e come tale concorre alla determinazione delle proprietà (statistiche) dell'insieme. Il carattere o variabile statistica è un aspetto che caratterizza i fenomeno e può assumere varie modalità, qualitative o quantitative. STATISTICA L-33 – a.a. 2011/12 - Prof. G. Pellegrini Facoltà di Scienze Politiche – “La Sapienza”

3 Un esempio di dati osservati
Nome Età Sesso Titolo di studio Attività Peso (kg) Punteggio esercizi Rossi M. 32 M laurea occupato 72 65 Bianchi G. 39 F 55 Nicoletti C. 46 diploma disoccupato 79 53 Marcelli F. 28 studente 63 78 Petrone A. 51 casalinga 64 21

4 Suddivisione in classi
n. di classi adeguato al problema classi disgiunte includere tutte le modalità del carattere quale ampiezza delle classi? intervalli aperti a destra o a sinistra STATISTICA L-33 – a.a. 2011/12 - Prof. G. Pellegrini Facoltà di Scienze Politiche – “La Sapienza”

5 Classi di caratteri continui (1)
Come rilevare e classificare i caratteri quantitativi continui, poiché esiste sempre un limite alla misurazione? (es. altezza in cm o mm ecc.) Costruire delle classi di modalità, all’interno delle quali esiste continuità di carattere (es. altezza da 1,60 a 1,70; da 1,70 a 1,80 ecc.) Le classi devono essere disgiunte (ovvero non si devono sovrapporre) e esaustive (contenere tutte le modalità possibili del carattere) STATISTICA A-D – a.a. 2010/11 - Prof. G. Pellegrini Facoltà di Scienze Politiche – Università “La Sapienza” di Roma

6 Classi di caratteri continui (2)
Quindi non ci deve essere ambiguità nell’attribuire una unità ad una classe e non ad un’altra, e dobbiamo poter collocare tutte le unità statistiche. Come scrivere le classi in modo univoco? Si usa questa simbologia: |-| o -| o |- La barra verticale | indica che l’estremo è compreso all’interno della classe: 14-|25=la modalità 25 è compresa, quella 26 no 25-|30= la modalità 25 non è compresa, 30 si STATISTICA A-D – a.a. 2010/11 - Prof. G. Pellegrini Facoltà di Scienze Politiche – Università “La Sapienza” di Roma

7 Classi di caratteri continui
Esempio: Tabella Studenti Sesso Anni Altezza Guido M ,80 Stefano M ,75 Monica F ,68 Damiano M ,78 Classi di altezza n 1,60 |– 1,70 1 1,70 |– 1,80 2 1,80 |– … 1

8 Classi di caratteri continui
Modalità intervallari o per intervalli variabili continue -> scelta di necessità variabili discrete -> scelta di opportunità (in caso di caratteri discreti in intervalli, non è strettamente necessario ma è consigliabile la precedente notazione: è equivalente a 0-| | |50

9 Esempio Dalla tabella precedente: ore di studio
Frequenze Classi di frequenze Ore ni Ore ni | 5 7 | 6 4 | 8 3 6 4 7 2 8 1

10 Esempio Si noti che l’uso di frequenze comporta comunque la perdita di informazioni Esempio: sigarette fumate al giorno Ind. ni Classi di frequenze ni |- 5 3 | 3 0 4 5 5 7 6 9

11 Distribuzione delle aziende secondo il numero di dipendenti
xi ni 0-|10 14 10-|20 4 20-|30 2 30-|40 3 40-|60 60-|80 1 Totale 27

12 Famiglie italiane per intervalli di reddito annuo

13 Esempio E’ data la distribuzione di 1863 famiglie italiane secondo il numero di componenti. Numero di componenti (xi) Numero di famiglie (ni) 1 2 3 4 5 6 332 440 412 401 177 101 totale 1863

14 Frequenze relative Numero di componenti (xi) Numero di famiglie (ni) 1
332 2 440 3 412 4 401 5 177 6 101 tot 1863 Frequenze relative (fi) 332/1863 440/1863 412/1863 401/1863 177/1863 101/1863 1863/1863 fi 0.178 0.236 0.221 0.215 0.096 0.054 1

15 Frequenze cumulate (non decrescenti)
Numero di famiglie (ni) 332 440 412 401 177 101 Tot. 1863 X <= xi <= 1 <= 2 <= 3 <= 4 <= 5 <= 6 Frequenze cumulate (Ni) 332 Ni 332 772 1184 1585 1762 1863

16 Frequenze relative cumulate (Fi)
Frequenze relative cumulate (non decrescenti) X <= xi <= 1 <= 2 <= 3 <= 4 <= 5 <= 6 Ni 332 772 1184 1585 1762 1863 Frequenze relative cumulate (Fi) 332/1863 772/1863 1184/1863 1585/1863 1762/1863 1863/1863 Fi 0.178 0.414 0.636 0.851 0.946 1.000


Scaricare ppt "Lezione 2 CARATTERI DEI DATI: approfondimento (Borra-Di Ciaccio, cap"

Presentazioni simili


Annunci Google