Corso di Analisi Statistica per le Imprese Rappresentazione dei dati

Slides:



Advertisements
Presentazioni simili
Le rappresentazioni grafiche
Advertisements

Le rappresentazioni grafiche
Le rappresentazioni grafiche
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.
Rappresentazioni grafiche di una distribuzione di frequenze 1)Istogramma e poligono delle frequenze ● Dati raggruppati in classi ● Costituito da un insieme.
Elaborazione delle Immagini Operatori Puntuali Luigi Cinque
1 Corso di Analisi Statistica per le Imprese Rappresentazione dei dati Prof. L. Neri a.a
Organizzazione dei dati AnnoQ [m 3 /s]
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
Il trattamento statistico dei dati
Statistica I Grafici Seconda Parte.
LA STATISTICA DESCRITTIVA
Corso di Analisi Statistica per le Imprese Concetti di base e Uso della Statistica Prof. L. Neri a.a Corso di Statistica per l'impresa– Univ.
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
ESERCITAZIONE RIEPILOGO di Statistica Descrittiva
Analisi monovariata: frequenze
Modalità rappresentazione dei dati Tabelle, percentuali, grafici …
DALLA TABELLA DELLE OSSERVAZIONI ALLA TABELLA DELLE FREQUENZE
Le principali grandezze macroeconomiche
Lezione 2 CARATTERI DEI DATI: approfondimento (Borra-Di Ciaccio, cap
Analisi dei Dati – Tabelle e Grafici
Variabili casuali a più dimensioni
Corso di Analisi Statistica per le Imprese Cross tabulation e relazioni tra variabili Prof. L. Neri a.a
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Il trattamento statistico dei dati
Esercitazioni su testi d’esame
STATISTICA Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo.
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
L’analisi monovariata
DISTRIBUZIONI TEORICHE DI PROBABILITA’
La Statistica si occupa dei modi
misure di eterogeneità
Ripasso dei concetti fondamentali
La Statistica Istituto Comprensivo “ M. G. Cutuli”
Fisica: lezioni e problemi
Numeri indice di prezzi e quantità
Esercitazione di Statistica Economica
Statistica descrittiva bivariata
L’analisi monovariata
I 7 strumenti della qualità
La rappresentazione della realtà
ANALISI DELLE DISTRIBUZIONI STATISTICHE
Esercitazione di Statistica Economica
Corso di Analisi Statistica per le Imprese 2
Organizzazione dei dati
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Esercitazioni psicometria
Statistica descrittiva
L’indagine statistica
Statistica Scienza che studia i fenomeni collettivi.
Università degli Studi di Modena e Reggio Emilia
Statistica.
La rappresentazione della realtà
STATISTICA Giovanni Barbaro.
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
SCALE DI MISURA CARATTERI QUALITATIVI CARATTERI QUANTITATIVI
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Corso di Analisi Statistica per le Imprese Vocabolario di base e Uso della Statistica Prof. L. Neri a.a Corso di Statistica per l'impresa–
Esercizio 1 Si vuole studiare la mobilità di voto degli elettori di una certa circoscrizione. Da un sondaggio telefonico risulta che: Si calcolino le distribuzioni.
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
Corso di Analisi Statistica per le Imprese Vocabolario di base e Uso della Statistica Prof. L. Neri a.a Corso di Statistica per l'impresa–
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
Numeri indice di prezzi e quantità
Frequenza a) Compilare una tabella classificando i compagni di classe secondo lo sport che preferiscono b) Compilare una tabella classificando i compagni.
Modalità rappresentazione dei dati Grafici, percentuali, tabelle …
Statistica descrittiva bivariata
EserciZI di Statistica
Transcript della presentazione:

Corso di Analisi Statistica per le Imprese Rappresentazione dei dati Prof. L. Neri a.a. 2017-2018 1

La rappresentazione dei dati Il manager è consapevole che presentare le informazioni raccolte in forma di matrice dei dati non ha senso È utile invece rappresentarle in forma organizzata e sintetica allo scopo di: evidenziarne le caratteristiche principali facilitarne la lettura e l’interpretazione Rappresentazione tabellare Rappresentazione grafica 2

Rappresentazioni tabellari Distribuzione di frequenze Distribuzione di quantità Serie storica Serie territoriale 3

Distribuzione di frequenze Organizzazione dei dati mediante una tabella risultante dalle operazioni di: Classificazione Conteggio Ad ogni modalità di un carattere (qualitativo o quantitativo) si fa corrispondere il numero di volte che esso si presenta nel collettivo (la sua frequenza assoluta) 4

Distribuzione di frequenze Punti vendita Addetti 1 6 2 3 10 4 5 7 8 9 Addetti (valori distinti) Numero punti vendita (frequenze) 3 4 6 7 10 2 1 3 1 2 Quanti sono i punti vendita con 3 addetti? 2 Quanti sono i punti vendita con 4 addetti? 1 Quanti sono i punti vendita con 6 addetti? 3 Quanti sono i punti vendita con 7 addetti? 1 Quanti sono i punti vendita con 10 addetti? 2 5

Distribuzione semplice di frequenze X Freq. x1 n1 x2 n2 … xj nj xk nk Totale n x1, x2,…,xK sono le modalità distinte che assume il carattere X nel collettivo di n unità esaminato n1, n2,…,nK sono le freq. assolute associate a ciascuna modalità n1 indica quante unità presentano la modalità x1 del carattere X La somma delle frequenze assolute è uguale al numero totale di unità del collettivo 6

Frequenze relative e frequenze relative percentuali La frequenza relativa è data dal rapporto tra frequenza assoluta e numero totale di unità del collettivo per la j-esima modalità Vale che La frequenza relativa percentuale altro non è che la frequenza relativa moltiplicata per 100 7

Calcolo delle frequenze relative e percentuali Addetti Frequenze assolute 3 2 4 1 6 7 10 Tot n=9 Frequenze relative 2/9=0,22 1/9=0,11 3/9=0,34 1,00 Frequenze rel. perc. 22,2 11,1 33,3 100,0 La somma delle freq. rel. perc. è pari a 100 (in questo caso è stata arrotondata perché risultava pari a 99,9) I punti vendita con 3 addetti sono 2 (freq. ass.) Rappresentano il 22% del totale dei punti vendita 8

Perché si calcolano le frequenze relative e percentuali? Le frequenze assolute dipendono da n Quindi non possono essere utilizzate per effettuare confronti tra collettivi con diversa numerosità Al contrario, le frequenze relative e quelle percentuali sono numeri puri Si utilizzano per confrontare distribuzioni di frequenza riferite a collettivi di diversa numerosità 9

Esempio di utilizzo delle freq. rel. perc. Supponiamo che il manager dell’azienda debba valutare se la distribuzione dei punti vendita per numero di addetti in Campania è diversa da quella di una regione spagnola, la Catalogna Si sospetta che in Campania ci siano più punti vendita con pochi addetti rispetto alla Catalogna 10

Confronto tra distrib. di frequenze Campania Catalogna Addetti Freq ass. 3 2 4 1 6 7 10 Tot n=9 Addetti Freq. ass. 3 4 5 11 6 15 8 10 Tot n=48 Confrontando le freq. ass., si conclude che il numero dei punti vendita con 3 addetti è minore in Campania rispetto alla Catalogna (2 contro 4) e lo stesso vale per i p.v. con 4 addetti (1 contro 4) Questo risultato sembra ribaltare le supposizioni iniziali Ma il confronto fatto in questo modo è errato! 11

Confronto tra distrib. di frequenze Campania Catalogna Addetti Freq ass. 3 2 4 1 6 7 10 Tot n=9 Freq. rel. perc. 22,2 11,1 33,3 100 Addetti Freq. ass. 3 4 5 11 6 15 8 10 Tot n=48 Freq. rel. perc. 8,3 22,9 31,3 16,7 12,5 100,0 In termini di freq. rel. perc., i 2 p.v. con 3 addetti costiituiscono il 22,2 % del totale dei p.v. in Campania e solo l’8,3% del totale dei p.v. in Catalogna L’incidenza dei p.v. con pochi addetti è maggiore in Campania, come si supponeva 12

Frequenze cumulate Addetti (valori distinti) Numero punti vendita (frequenze) 3 2 4 1 6 7 10 frequenze cumulate Le freq. cum. si definiscono solo se le modalità del carattere sono ordinate 2 3 6 7 9 Quanti sono i punti vendita con al max 3 addetti? 2 Quanti sono i punti vendita con al max 4 addetti? 2+1 Quanti sono i punti vendita con al max 6 addetti? 2+1+3 Quanti sono i punti vendita con al max 7 addetti? 2+1+3+1 Quanti sono i punti vendita con al max 10 addetti? 2+1+3+1+2 13

Frequenze cumulate Dalla lettura delle freq. perc. cum. Pj, Addetti Freq. ass. nj Freq. ass. cum. Nj Freq. rel. cum. Fj Freq. perc. cum. Pj 3 2 0,22 22,2 4 1 0,33 33,3 6 0,67 66,6 7 0,78 77,7 10 9 1,00 100,0 Dalla lettura delle freq. perc. cum. Pj, si ricava che il 66,6% dei punti vendita (cioè i 2/3) ha un numero di addetti inferiore o uguale a 6 14

Distribuzione in classi di valori Una variabile quantitativa continua usualmente viene rappresentata mediante una tabella di frequenze associate a classi di valori Le classi sono formate da gruppi contigui di modalità Le classi non devono sovrapporsi Una modalità deve appartenere ad una sola classe 15

Distribuzione di frequenze in classi della variabile Ricavi Per ricavare la corrispondente distribuzione in classi di valori, potremmo pensare di definire classi tali che: abbiano più o meno la stessa frequenza abbiano più o meno la stessa ampiezza corrispondano a livelli del fenomeno che possiamo individuare come (basso, medio, alto) oppure (basso, alto) avendo in mente specifiche soglie Ricavi (valori ordinati) 180 200 205 270 280 340 350 500 600 16

Distribuzione di frequenze in classi della variabile Ricavi Scelgo di formare 3 classi di ricavi: Fino a 250 (incluso) Da 250 (escluso) a 350 (incluso) Oltre 350 Ricavi (valori ordinati) 180 200 205 270 280 340 350 500 600   Classi di ricavo Freq. ass. (0 – 250] (250 – 350] Oltre 350   3  4  2   Qual è la frequenza associata alla prima classe? Quanti sono i p.v. i cui ricavi sono al massimo 250?  17

Serie storica Tabella che ad ogni riferimento temporale (ad esempio, l’anno, il mese, il giorno) associa l’ammontare del carattere X in esame Evidenzia la dinamica di un certo fenomeno nel tempo Esempi: il valore aggiunto di un’azienda negli ultimi cinque anni l’indice S&P/Mib alla Borsa di Milano nell’ultima settimana 18

Serie storica (esempio) Facendo riferimento al nostro esempio base, la banca può richiedere il R.O. (risultato operativo) di ogni punto vendita degli ultimi quattro anni Per ogni punto vendita si ha una serie storica del tipo: anni R.O. (migliaia euro) 2004 85 2005 120 2006 215 2007 161 19

Serie territoriale Tabella che ad ogni unità territoriale (ad esempio paese, regione, distretto industriale) fa corrispondere l’ammontare del carattere X in esame Mostra la distribuzione del fenomeno in rapporto al territorio Esempi: il tasso di inflazione nei paesi UE le emissioni di CO2 nei capoluoghi di regione italiani 20

Serie territoriale (esempio) Valori del PIL pro-capite in alcuni Paesi (Dati del Fondo Monetario Internazionale 2007) Paese PIL nominale (in dollari USA) Italia 31.802 Spagna 27.951 Regno Unito 39.681 Svezia 43.190 21

Esercizi di riepilogo Esercizio 1. Supponete di disporre dei seguenti dati del fatturato in migliaia di euro di un’azienda 120 123 221 135 146 123 167 123 123 121 135 136 136 221 222 223 167 135 135 121 Costruire la tabella di frequenza in classi. Decidete di costruire tre classi 22

Distribuzione in classi del fatturato Classi di fatturato nj fj pj (110-130] 7 0.35 35% (130-200] 9 0.45 45% Oltre 200 4 0.20 20% 23

Rappresentazioni grafiche Grafici a barre o a nastri Grafici a torta Diagrammi cartesiani (per serie storiche) Cartogrammi (per serie territoriali) Istogrammi 24

Grafici a barre o a nastri Generalmente si utilizzano per caratteri qualitativi e quantitativi discreti Ad ogni modalità corrisponde un nastro o una barra Le altezze delle barre o le larghezze dei nastri sono proporzionali alla frequenza o alla quantità (totale, media, proporzione di un carattere) che si vuole rappresentare Si usano anche per evidenziare graduatorie tra Paesi, regioni, città,…  25

Grafico a barre  26

Grafico a nastri 27

Grafico a barre 28

Grafici a torta Si utilizzano per caratteri qualitativi per evidenziare la composizione di un fenomeno A ciascuna modalità del carattere corrisponde una fetta della torta proporzionale alla corrispondente frequenza o intensità Generalmente il numero delle modalità è limitato  29

Grafici a torta  30

Grafici a torta  31

Grafici a torta  32

Grafici di serie temporali Sono diagrammi cartesiani In ascissa viene riportato il tempo di riferimento (anno, mese, giorno) e in ordinata il carattere osservato 33

Grafici di serie temporali 34

Grafici di serie territoriali Utilizzano una mappa geografica Ad ogni area territoriale (provincia, regione, nazione,…) corrisponde una colorazione differente a seconda della frequenza o della quantità del fenomeno Una legenda aiuta la lettura del grafico, attribuendo ad ogni colore un valore o una classe di valori 35

Grafici di serie territoriali  36

Grafici di serie territoriali 37

Istogramma per caratteri quantitativi continui Composto da una serie di rettangoli affiancati, uno per ogni classe di valori Essendo una rappresentazione areale, l’area di ogni rettangolo deve essere uguale (o proporzionale) alla frequenza di ciascuna classe di valori in modo che l’area complessiva di tutti i rettangoli sia uguale (o proporzionale) alla numerosità n del collettivo 38

Istogramma per caratteri quantitativi continui classe frequenza ampiezza classe aj densità di frequenza hj … (xj; xj+1) nj xj+1 - xj nj/(xj+1 – xj) Base del rettangolo = Ampiezza della classe (in ascissa) Altezza del rettangolo = Densità di frequenza (in ordinata) 39

Costruzione dell’istogramma 1 Classi di superficie (in ettari) Numero aziende (nj) 0-1 120 1-2 160 2-3 220 3-5 212 5-10 205 10-20 110 20-40 65 21 Ampiezza classe (aj) 1 2 5 10 20 40 Densità di freq (hj) 120 160 220 106 41 11 3,25 0,525 40-80 Base del rettangolo Altezza del rettangolo  40

Istogramma dj 80 5 10 20 40 Superficie  41

Istogramma per le prime 5 classi (precedente esempio) 220 Classi di superf. Freq. 0-1 120 1-2 160 2-3 220 3-5 212 5-10 205 Ampiezza (aj) Dens di freq (hj) 1 120 160 220 2 106 5 41 hj 160 120 106 212 è l’area di questo rettangolo 41 10 1 2 3 5 Superficie  42