Lezione 2 CARATTERI DEI DATI: approfondimento (Borra-Di Ciaccio, cap

Slides:



Advertisements
Presentazioni simili
Capitolo 1 Caratteri, unità statistiche e collettivo
Advertisements

Esercizio 1. Quesiti esercizio 1 Distribuzione congiunta: dalla definizione di distribuzione condizionale.
1 A.A STATISTICA E CALCOLO DELLE PROBABILITA’ Docenti: Stefania Mignani Maurizio Brizzi.
LA MISURA IN PSICOLOGIA. Scopo del corso Il corso si propone di offrire allo studente:  un’introduzione alle tematiche connesse alla misura in psicologia.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
LA STATISTICA. Cenni storici ● In Egitto: si rilevava l'ammontare della popolazione e i vari beni ai fini fiscali; si tenevano elenchi delle famiglie.
Rappresentazioni grafiche di una distribuzione di frequenze 1)Istogramma e poligono delle frequenze ● Dati raggruppati in classi ● Costituito da un insieme.
1 Variabili. 2 Tipi di variabili Una variabile è qualche proprietà di un evento che è stata misurata. Le variabili sono attributi dei fenomeni e pertanto.
In collaborazione con ISTAT Classe III G Prof.ssa Cozzolino Maria Dott.ssa La Faci Antonella A.S. 2015/16.
Germana Scepi Corso di Statistica Anno accademico 2016-’17 Lezione:Argomento: Gli indici di variabilità4.
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
Il trattamento statistico dei dati
Universita’ di Milano Bicocca Corso di Basi di dati 1 in eLearning
LA STATISTICA DESCRITTIVA
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Statistica descrittiva
ESERCITAZIONE RIEPILOGO di Statistica Descrittiva
Analisi monovariata: frequenze
DALLA TABELLA DELLE OSSERVAZIONI ALLA TABELLA DELLE FREQUENZE
Precorso di Statistica per le Lauree Magistrali
Variabili casuali a più dimensioni
Corso di Analisi Statistica per le Imprese Cross tabulation e relazioni tra variabili Prof. L. Neri a.a
Esercizio 1 Prezzo in euro libri
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
L’indagine statistica
Il trattamento statistico dei dati
Esercitazioni su testi d’esame
STATISTICA Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo.
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Universita’ di Milano Bicocca Corso di Basi di Dati 1 in eLearning C
Insiemi di punti: altre caratteristiche
Università Politecnica delle Marche – Facoltà di Medicina e Chirurgia
La statistica A cura di: Manuela Mangione.
Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill
facoltà di scienze politiche, sociologia, comunicazione
Statistica sociale Modulo B
misure di eterogeneità
La Statistica Istituto Comprensivo “ M. G. Cutuli”
Esercitazione di Statistica Economica
Statistica descrittiva bivariata
ANALISI DELLE DISTRIBUZIONI STATISTICHE
Esercitazione di Statistica Economica
Esercitazione di Statistica
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Esercitazioni psicometria
Statistica descrittiva
L’indagine statistica
Statistica Scienza che studia i fenomeni collettivi.
Basi di dati - Fondamenti
Statistica.
Intervalli di confidenza
Statistica descrittiva bivariata
Statistica descrittiva bivariata
Riduzione dei Dati.
SCALE DI MISURA CARATTERI QUALITATIVI CARATTERI QUANTITATIVI
“Sabina Universitas” - Università degli Studi di Roma “La Sapienza”
Distribuzioni Bivariate
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Esercizio 1 Prezzo in euro libri
Corso di Analisi Statistica per le Imprese
Associazione tra variabili qualitative
Frequenza a) Compilare una tabella classificando i compagni di classe secondo lo sport che preferiscono b) Compilare una tabella classificando i compagni.
Corso di Analisi Statistica per le Imprese
Statistica e probabilità Università degli Studi di Sassari Facoltà di Medicina veterinaria Corso di Laurea in Medicina veterinaria Anno Accademico 2017/2018.
Statistica descrittiva bivariata
13/11/
EserciZI di Statistica
Transcript della presentazione:

Lezione 2 CARATTERI DEI DATI: approfondimento (Borra-Di Ciaccio, cap STATISTICA L-33 – a.a. 2016/17 Prof. G. Pellegrini Facoltà di Scienze Politiche – “La Sapienza”

Collettivo e Unità Statistiche Una pluralità di “oggetti” dotati di almeno un carattere comune (variabile, cioè quantitativa, o mutabile, cioè qualitativa) costituisce un “collettivo, o insieme, statistico” Ciascun oggetto è una “unità statistica” e come tale concorre alla determinazione delle proprietà (statistiche) dell'insieme. Il carattere o variabile statistica è un aspetto che caratterizza i fenomeno e può assumere varie modalità, qualitative o quantitative. STATISTICA L-33 – a.a. 2011/12 - Prof. G. Pellegrini Facoltà di Scienze Politiche – “La Sapienza”

Un esempio di dati osservati Nome Età Sesso Titolo di studio Attività Peso (kg) Punteggio esercizi Rossi M. 32 M laurea occupato 72 65 Bianchi G. 39 F 55 Nicoletti C. 46 diploma disoccupato 79 53 Marcelli F. 28 studente 63 78 Petrone A. 51 casalinga 64 21

Suddivisione in classi n. di classi adeguato al problema classi disgiunte includere tutte le modalità del carattere quale ampiezza delle classi? intervalli aperti a destra o a sinistra STATISTICA L-33 – a.a. 2011/12 - Prof. G. Pellegrini Facoltà di Scienze Politiche – “La Sapienza”

Classi di caratteri continui (1) Come rilevare e classificare i caratteri quantitativi continui, poiché esiste sempre un limite alla misurazione? (es. altezza in cm o mm ecc.) Costruire delle classi di modalità, all’interno delle quali esiste continuità di carattere (es. altezza da 1,60 a 1,70; da 1,70 a 1,80 ecc.) Le classi devono essere disgiunte (ovvero non si devono sovrapporre) e esaustive (contenere tutte le modalità possibili del carattere) STATISTICA A-D – a.a. 2010/11 - Prof. G. Pellegrini Facoltà di Scienze Politiche – Università “La Sapienza” di Roma

Classi di caratteri continui (2) Quindi non ci deve essere ambiguità nell’attribuire una unità ad una classe e non ad un’altra, e dobbiamo poter collocare tutte le unità statistiche. Come scrivere le classi in modo univoco? Si usa questa simbologia: |-| o -| o |- La barra verticale | indica che l’estremo è compreso all’interno della classe: 14-|25=la modalità 25 è compresa, quella 26 no 25-|30= la modalità 25 non è compresa, 30 si STATISTICA A-D – a.a. 2010/11 - Prof. G. Pellegrini Facoltà di Scienze Politiche – Università “La Sapienza” di Roma

Classi di caratteri continui Esempio: Tabella Studenti Sesso Anni Altezza Guido M 19 1,80 Stefano M 18 1,75 Monica F 19 1,68 Damiano M 20 1,78 Classi di altezza n 1,60 |– 1,70 1 1,70 |– 1,80 2 1,80 |– … 1

Classi di caratteri continui Modalità intervallari o per intervalli variabili continue -> scelta di necessità variabili discrete -> scelta di opportunità (in caso di caratteri discreti in intervalli, non è strettamente necessario ma è consigliabile la precedente notazione: 1-10 11-30 31-50 è equivalente a 0-|10 10-|30 30-|50

Esempio Dalla tabella precedente: ore di studio Frequenze Classi di frequenze Ore ni Ore ni 3 1 2 -| 5 7 4 4 5 -| 6 4 5 2 6 -| 8 3 6 4 7 2 8 1

Esempio Si noti che l’uso di frequenze comporta comunque la perdita di informazioni Esempio: sigarette fumate al giorno Ind. ni Classi di frequenze ni 1 0 0 |- 5 3 2 0 5 |- 10 3 3 0 4 5 5 7 6 9

Distribuzione delle aziende secondo il numero di dipendenti xi ni 0-|10 14 10-|20 4 20-|30 2 30-|40 3 40-|60 60-|80 1 Totale 27

Famiglie italiane per intervalli di reddito annuo

Esempio E’ data la distribuzione di 1863 famiglie italiane secondo il numero di componenti. Numero di componenti (xi) Numero di famiglie (ni) 1 2 3 4 5 6 332 440 412 401 177 101 totale 1863

Frequenze relative Numero di componenti (xi) Numero di famiglie (ni) 1 332 2 440 3 412 4 401 5 177 6 101 tot 1863 Frequenze relative (fi) 332/1863 440/1863 412/1863 401/1863 177/1863 101/1863 1863/1863 fi 0.178 0.236 0.221 0.215 0.096 0.054 1

Frequenze cumulate (non decrescenti) Numero di famiglie (ni) 332 440 412 401 177 101 Tot. 1863 X <= xi <= 1 <= 2 <= 3 <= 4 <= 5 <= 6 Frequenze cumulate (Ni) 332 332+440 332+440+412 332+440+..+401 332+440+..+ 177 332+440+..+ 101 Ni 332 772 1184 1585 1762 1863

Frequenze relative cumulate (Fi) Frequenze relative cumulate (non decrescenti) X <= xi <= 1 <= 2 <= 3 <= 4 <= 5 <= 6 Ni 332 772 1184 1585 1762 1863 Frequenze relative cumulate (Fi) 332/1863 772/1863 1184/1863 1585/1863 1762/1863 1863/1863 Fi 0.178 0.414 0.636 0.851 0.946 1.000