1 Corso di Analisi Statistica per le Imprese Rappresentazione dei dati Prof. L. Neri a.a
Il manager è consapevole che presentare le informazioni raccolte in forma di matrice dei dati non ha senso È utile invece rappresentarle in forma organizzata e sintetica allo scopo di: evidenziarne le caratteristiche principali facilitarne la lettura e l’interpretazione Rappresentazione tabellare Rappresentazione grafica La rappresentazione dei dati 2
Distribuzione di frequenze Distribuzione di quantità Serie storica Serie territoriale Rappresentazioni tabellari 3
Organizzazione dei dati mediante una tabella risultante dalle operazioni di: Classificazione Conteggio Ad ogni modalità di un carattere (qualitativo o quantitativo) si fa corrispondere il numero di volte che esso si presenta nel collettivo (la sua frequenza assoluta) Distribuzione di frequenze 4
Punti vendita Addetti Addetti (valori distinti) Numero punti vendita (frequenze) Quanti sono i punti vendita con 3 addetti?2 2 Quanti sono i punti vendita con 4 addetti?1 1 Quanti sono i punti vendita con 6 addetti? 3 3 Quanti sono i punti vendita con 7 addetti?1 1 Quanti sono i punti vendita con 10 addetti?2 2 5
Distribuzione semplice di frequenze XFreq. x1x1 n1n1 x2x2 n2n2 …… xjxj njnj …… xkxk nknk Totalen La somma delle frequenze assolute è uguale al numero totale di unità del collettivo x 1, x 2,…,x K sono le modalità distinte che assume il carattere X nel collettivo di n unità esaminato n 1, n 2,…,n K sono le freq. assolute associate a ciascuna modalità n 1 indica quante unità presentano la modalità x 1 del carattere X 6
Frequenze relative e frequenze relative percentuali La frequenza relativa è data dal rapporto tra frequenza assoluta e numero totale di unità del collettivo per la j-esima modalità Vale che La frequenza relativa percentuale altro non è che la frequenza relativa moltiplicata per 100 7
Calcolo delle frequenze relative e percentuali AddettiFrequenze assolute Totn=9 Frequenze relative 2/9=0,22 1/9=0,11 3/9=0,34 1/9=0,11 2/9=0,22 1,00 Frequenze rel. perc. 22,2 11,1 33,3 11,1 22,2 100,0 I punti vendita con 3 addetti sono 2 (freq. ass.) Rappresentano il 22% del totale dei punti vendita La somma delle freq. rel. perc. è pari a 100 (in questo caso è stata arrotondata perché risultava pari a 99,9) 8
Perché si calcolano le frequenze relative e percentuali? Le frequenze assolute dipendono da n Quindi non possono essere utilizzate per effettuare confronti tra collettivi con diversa numerosità Al contrario, le frequenze relative e quelle percentuali sono numeri puri Si utilizzano per confrontare distribuzioni di frequenza riferite a collettivi di diversa numerosità 9
Esempio di utilizzo delle freq. rel. perc. Supponiamo che il manager dell’azienda debba valutare se la distribuzione dei punti vendita per numero di addetti in Campania è diversa da quella di una regione spagnola, la Catalogna Si sospetta che in Campania ci siano più punti vendita con pochi addetti rispetto alla Catalogna 10
Confronto tra distrib. di frequenze AddettiFreq ass Totn=9 AddettiFreq. ass Totn=48 CampaniaCatalogna Confrontando le freq. ass., si conclude che il numero dei punti vendita con 3 addetti è minore in Campania rispetto alla Catalogna (2 contro 4) e lo stesso vale per i p.v. con 4 addetti (1 contro 4) Ma il confronto fatto in questo modo è errato! Questo risultato sembra ribaltare le supposizioni iniziali 11
AddettiFreq ass Totn=9 Freq. rel. perc. 22,2 11,1 33,3 11,1 22,2 100 AddettiFreq. ass Totn=48 Freq. rel. perc. 8,3 22,9 31,3 16,7 12,5 100,0 CampaniaCatalogna In termini di freq. rel. perc., i 2 p.v. con 3 addetti costiituiscono il 22,2 % del totale dei p.v. in Campania e solo l’8,3% del totale dei p.v. in Catalogna Confronto tra distrib. di frequenze L’incidenza dei p.v. con pochi addetti è maggiore in Campania, come si supponeva 12
Frequenze cumulate Addetti (valori distinti) Numero punti vendita (frequenze) frequenze cumulate Quanti sono i punti vendita con al max 3 addetti?2 Quanti sono i punti vendita con al max 4 addetti? Quanti sono i punti vendita con al max 6 addetti? Quanti sono i punti vendita con al max 7 addetti? Quanti sono i punti vendita con al max 10 addetti? Le freq. cum. si definiscono solo se le modalità del carattere sono ordinate 13
Frequenze cumulate AddettiFreq. ass. n j Freq. ass. cum. N j Freq. rel. cum. F j Freq. perc. cum. P j 3220,2222,2 4130,3333,3 6360,6766,6 7170,7877, ,00100,0 Dalla lettura delle freq. perc. cum. P j, si ricava che il 66,6% dei punti vendita (cioè i 2/3) ha un numero di addetti inferiore o uguale a 6 14
Distribuzione in classi di valori Una variabile quantitativa continua usualmente viene rappresentata mediante una tabella di frequenze associate a classi di valori Le classi sono formate da gruppi contigui di modalità Le classi non devono sovrapporsi Una modalità deve appartenere ad una sola classe 15
Distribuzione di frequenze in classi della variabile Ricavi Ricavi (valori ordinati) Per ricavare la corrispondente distribuzione in classi di valori, potremmo pensare di definire classi tali che: abbiano più o meno la stessa frequenza abbiano più o meno la stessa ampiezza corrispondano a livelli del fenomeno che possiamo individuare come (basso, medio, alto) oppure (basso, alto) avendo in mente specifiche soglie 16
Distribuzione di frequenze in classi della variabile Ricavi Ricavi (valori ordinati) Classi di ricavo Freq. ass. (0 – 250] (250 – 350] Oltre 350 Scelgo di formare 3 classi di ricavi: -Fino a 250 (incluso) -Da 250 (escluso) a 350 (incluso) -Oltre Qual è la frequenza associata alla prima classe? Quanti sono i p.v. i cui ricavi sono al massimo 250? 17
Organizzazione dei dati mediante una tabella risultante dalle operazioni di: Classificazione Misurazione di un fenomeno Ad ogni modalità di un carattere si fa corrispondere una misurazione (per es. una somma o una media) di un carattere quantitativo Distribuzione di quantit à 18
Esempio distribuzione di quantità Classifico in base agli addetti Per ogni modalità del carattere “Addetti” calcolo la somma e la media dei ricavi Punti vendita AddettiRicavi AddettiRicavo totale Ricavo medio , , Come si ricava la quantità 385 (ricavo totale) in corrispondenza del numero di addetti pari a 3? Dalla somma di 180 e 205, i ricavi dei p.v. che hanno 3 addetti 19
Serie storica Tabella che ad ogni riferimento temporale (ad esempio, l’anno, il mese, il giorno) associa l’ammontare del carattere X in esame Evidenzia la dinamica di un certo fenomeno nel tempo Esempi: il valore aggiunto di un’azienda negli ultimi cinque anni l’indice S&P/Mib alla Borsa di Milano nell’ultima settimana 20
Serie storica (esempio) Facendo riferimento al nostro esempio base, la banca può richiedere il R.O. (risultato operativo) di ogni punto vendita degli ultimi quattro anni Per ogni punto vendita si ha una serie storica del tipo: anniR.O. (migliaia euro)
Serie territoriale Tabella che ad ogni unità territoriale (ad esempio paese, regione, distretto industriale) fa corrispondere l’ammontare del carattere X in esame Mostra la distribuzione del fenomeno in rapporto al territorio Esempi: il tasso di inflazione nei paesi UE le emissioni di CO 2 nei capoluoghi di regione italiani 22
Serie territoriale (esempio) PaesePIL nominale (in dollari USA) Italia Spagna Regno Unito Svezia Valori del PIL pro-capite in alcuni Paesi (Dati del Fondo Monetario Internazionale 2007) 23
Esercizio 1. Supponete di disporre dei seguenti dati del fatturato in migliaia di euro di un’azienda Costruire la tabella di frequenza in classi. Decidete di costruire tre classi Esercizi di riepilogo 24
Distribuzione in classi del fatturato Classi di fatturato njnj fjfj pjpj ( ] % ( ] % ( % 25
Grafici a barre o a nastri Grafici a torta Diagrammi cartesiani (per serie storiche) Cartogrammi (per serie territoriali) Istogrammi Rappresentazioni grafiche 26
Generalmente si utilizzano per caratteri qualitativi e quantitativi discreti Ad ogni modalità corrisponde un nastro o una barra Le altezze delle barre o le larghezze dei nastri sono proporzionali alla frequenza o alla quantità (totale, media, proporzione di un carattere) che si vuole rappresentare Si usano anche per evidenziare graduatorie tra Paesi, regioni, città,… Grafici a barre o a nastri 27
Grafico a barre 28
Grafico a nastri 29
Grafico a barre 30
Grafici a torta Si utilizzano per caratteri qualitativi per evidenziare la composizione di un fenomeno A ciascuna modalità del carattere corrisponde una fetta della torta proporzionale alla corrispondente frequenza o intensità Generalmente il numero delle modalità è limitato 31
Grafici a torta 32
Grafici a torta 33
Grafici a torta 34
Grafici di serie temporali Sono diagrammi cartesiani In ascissa viene riportato il tempo di riferimento (anno, mese, giorno) e in ordinata il carattere osservato 35
Grafici di serie temporali 36
Grafici di serie territoriali Utilizzano una mappa geografica Ad ogni area territoriale (provincia, regione, nazione,…) corrisponde una colorazione differente a seconda della frequenza o della quantità del fenomeno Una legenda aiuta la lettura del grafico, attribuendo ad ogni colore un valore o una classe di valori 37
Grafici di serie territoriali 38
Grafici di serie territoriali 39
Istogramma per caratteri quantitativi continui Composto da una serie di rettangoli affiancati, uno per ogni classe di valori Rappresentazione areale: L’area di ogni rettangolo deve essere uguale (o proporzionale) alla frequenza di ciascuna classe di valori in modo che l’area complessiva di tutti i rettangoli sia uguale (o proporzionale) alla numerosità n del collettivo 40
Istogramma per caratteri quantitativi continui Base del rettangolo = Ampiezza della classe (in ascissa) Altezza del rettangolo = Densità di frequenza (in ordinata) classefrequenzaampiezza classe a j densità di frequenza h j ………… (x j ; x j+1 )njnj x j+1 - x j n j /(x j+1 – x j ) ………… 41
Costruzione dell’istogramma 1 Classi di superficie (in ettari) Numero aziende (n j ) Ampiezza classe (a j ) Base del rettangoloAltezza del rettangolo Densità di freq (h j ) ,25 0,
Istogramma Superficie djdj
Istogramma per le prime 5 classi (precedente esempio) Superficie hjhj Classi di superf. Freq Ampiezza (a j ) Dens di freq (h j ) è l’area di questo rettangolo 44