Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoRachele Giusti Modificato 7 anni fa
1
Modalità rappresentazione dei dati Tabelle, percentuali, grafici …
Dopo aver raccolto i dati, occorre contarli, ordinarli in modo che possano essere facilmente utilizzati: questa operazione è detta spoglio dei dati. Dopo lo spoglio si procede alla tabulazione dei dati, cioè alla loro organizzazione in tabelle, affinché possano essere letti, analizzati ed interpretati agevolmente. Le tabelle che si utilizzano per tabulare i dati sono di tre tipi: Semplici Multiple A doppia entrata Consideriamo la tabella a fianco: Essa si riferisce ad un’indagine sugli alunni di una scuola che riguarda solo un carattere, lo sport praticato, con le cinque modalità: calcio, nuoto, tennis, volley e basket. Una tabella di questo tipo si dice semplice Nella prima colonna sono elencate le modalità dell’unico carattere oggetto dell’indagine e nella seconda colonna il numero di volte in cui ciascuna modalità si è manifestata nei dati raccolti. Sport Num. Alunni calcio 40 nuoto 29 tennis 35 volley 85 basket 51 La tabella è, pertanto, un modo di organizzare i dati in righe e colonne in modo che essi siano più facilmente leggibili
2
PRESENTAZIONE dEi risultati / ORGANIZZAZIONE DEI DATI
Tabella multipla Se nella tabella precedente le preferenze degli alunni vengono anche ripartite per sesso, si ottiene la tabella multipla, come quella sotto riportata: Modalità Numero alunni Maschi Femmine calcio 32 8 nuoto 10 19 tennis 23 12 volley 30 55 basket 31 20
3
PRESENTAZIONE dei risultati / ORGANIZZAZIONE DEI DATI
Tabella a doppia entrata La seguente tabella è relativa ad un’indagine fra i possessori di una casa per le vacanze riguardo alla località in cui essa si trova ( tre modalità: campagna, montagna, mare) ed al numero dei locali da cui è costituita (quattro modalità: 1 stanza, 2 stanze, 3 stanze, 4 stanze): N. stanze Località Campagna Montagna Mare 1 2 15 36 4 19 18 3 5 6 Si tratta di una tabella a doppia entrata, perché in essa sono considerati due diversi caratteri di una stessa popolazione statistica; la tabella si legge non solo per righe, come una tabella semplice, ma anche per righe e per colonne: infatti, ad esempio, all’incrocio della terza riga con la seconda colonna si può rilevare che sono 6 le case con 3 stanze in montagna N.B. I dati delle tabelle, per una loro migliore e più rapida comprensione, sovente sono anche rappresentati graficamente con ortogrammi, istogrammi, areogrammi, diagrammi cartesiani, ecc… come più in avanti vedremo!
4
Organizzazione dei dati
Distribuzione di frequenza Supponiamo di avere rilevato, in una classe di una scuola, il colore degli occhi degli allievi. Il risultato della rilevazione fornisce i cosiddetti dati grezzi, che riportiamo qui sotto: nero, marrone, azzurro, nero, marrone, nero, azzurro, verde, marrone, verde, marrone, nero, verde, nero, verde, nero, marrone, nero Questi risultati li possiamo raccogliere nella seguente tabella in cui, ad ogni unità statistica (cioè a ogni studente) è stata associata la modalità del carattere osservata, cioè il colore nero (N), marrone (M), verde (V), o azzurro (A). Studente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Colore occhi N M A V Una prima forma di elaborazione dati, volta ad ottenere una maggiore sintesi, consiste nel costruire una tabella in cui riportare, per ciascuna delle modalità osservate, (N, M, A, V) il numero di individui su cui è stata rilevata. Si definisce frequenza assoluta ( o semplicemente frequenza) di una modalità il numero di volte in cui la modalità è stata osservata. Associando ad ogni modalità la sua frequenza si ottiene la tabella sottostante in cui i dati sono più organizzati e meglio leggibili. Colore degli occhi Numero di studenti nero 7 marrone 5 azzurro 2 verde 4 La distribuzione di frequenza, è una tabella a due colonne, nella prima delle quali sono riportate le modalità e nella seconda delle quali sono riportate le frequenze.
5
Organizzazione dei dati
Supponiamo di aver rilevato il carattere colore degli occhi , oltre che nella classe scolastica (costituita da 18 alunni), che prodotto i dati riportati nella tabella sottostante, anche in un’altra classe, formata da 28 studenti, i cui dati sono riportati in quest’ altra tabella: Classe A Classe B Colore degli occhi Numero di studenti nero 7 marrone 5 azzurro 2 verde 4 Colore degli occhi Numero di studenti nero 10 marrone 8 azzurro 4 verde 6 Se vogliamo confrontare le distribuzioni delle frequenze nelle due classi di studenti, dobbiamo tenere conto del fatto che queste sono composte da numeri diversi di alunni; le frequenze assolute osservate nella seconda classe risulteranno maggiori di quelle osservate nella prima, ma ciò è dovuto unicamente dal fatto che la seconda classe è più numerosa della prima. Per ovviare a questo inconveniente, è necessario fare in modo che ci si riferisca ad uno stesso numero di alunni per classe. A tale scopo si introduce il concetto di frequenza relativa. Si definisce frequenza relativa di una modalità il rapporto fra la sue frequenza assoluta ed il numero complessivo di individui presi n esame. Le frequenze relative sono dei rapporti in cui il denominatore è sempre maggiore (o al più uguale) del numeratore, quindi sono espresse da frazioni comprese tra 0 ed 1. La frequenza relativa si può esprimere sotto forma di percentuale (moltiplicando per 100) ; in tal caso si ha appunto la frequenza percentuale.
6
Organizzazione dei dati
Distribuzione di frequenze relative e percentuali Costruiamo, a fianco della colonna delle frequenze assolute, due nuove colonne, dove riportiamo le frequenze relative e quelle percentuali. Colore degli occhi Frequenza assoluta Frequenza relativa Frequenza percentuale nero 7 7/18 = 0,389 38,90% marrone 5 8/18 = 0,278 27,80% azzurro 2 2/18 = 0,111 11,10% verde 4 4/18 = 0,222 22,20% Totale 18 1 100% Tabella A Facciamo lo stesso con la seconda tabella e otteniamo: Colore degli occhi Frequenza assoluta Frequenza relativa Frequenza percentuale nero 10 10/28 = 0,357 35,50% marrone 8 8/28 = 0,286 28,60% azzurro 4 4/28 = 0,143 14,30% verde 6 6/28 = 0,214 21,40% Totale 28 1 100% Tabella B Osserviamo che nella seconda classe, il nero ed il marrone pur avendo frequenza assoluta maggiore della prima classe, hanno frequenza relativa e percentuale minore. Questo significa che se avessimo due classi entrambe di 100 alunni, nella prima classe il colore nero si avrebbe 38,9 mentre nella seconda classe 35,5.
7
Organizzazione dei dati
Colore degli occhi Frequenza assoluta Frequenza relativa Frequenza percentuale nero 10 10/28 = 0,357 35,50% marrone 8 8/28 = 0,286 28,60% azzurro 4 4/28 = 0,143 14,30% verde 6 6/28 = 0,214 21,40% Totale 28 1 100% Tabella B Riflettendo sulle due tabelle di cui sopra, (è riportata sopra solo la tabella B), si può osservare che: La somma delle frequenze assolute di tutte le modalità è sempre uguale al numero complessivo di individui presi in esame; La somma delle frequenze relative è sempre uguale ad 1; La somma delle frequenze percentuali è sempre 100%.
8
Organizzazione dei dati
Altro esempio: importanza della frequenza relativa Supponiamo che in due classi di due scuole diverse : “Radice” e “Galilei” si siano ottenuti i seguenti dati riportati nelle due tabelle: Radice Galilei Sport Num. Alunni calcio 60 nuoto 30 tennis 40 volley 100 basket 70 Sport Num. Alunni calcio 80 nuoto 50 tennis 30 volley 140 basket 200 e di voler sapere in quale scuola è maggiormente praticato il calcio. Poiché le due scuole sono frequentate da un numero di alunni diverso, è errato basarsi sulla frequenza assoluta e rispondere: Galilei. In questo caso occorre calcolare le frequenze relative percentuali, per cui: Radice = Galilei = Il risultato dice che se le due scuole avessero uno stesso numero di alunni (100) la frequenza maggiore si avrebbe al Radice 20, mentre al Galilei solo 16.
9
Organizzazione dei dati
Distribuzione delle frequenze per classi Andiamo a misurare la statura di 18 ragazzi di una scuola e supponiamo di avere ottenuto i seguenti dati grezzi: Studente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Altezza (in cm) 173 164 174 180 182 176 184 185 170 172 186 167 188 183 168 178 Rispetto al caso precedente, quando si misurava il colore degli occhi, il carattere oggetto di studio (la statura degli studenti), presenta ora molte più modalità, tutte con frequenza 1 o al massimo 2. Se costruissimo la distribuzione delle frequenze, non otterremmo una sintesi significativa, perché otterremo una tabella che si discosterebbe di poco dalla tabella sopra riportata. Per ovviare a questo inconveniente è utile raggruppare (accorpare) preliminarmente le modalità in intervalli tra loro disgiunti, detti classi, quindi costruire la tabella di distribuzione di frequenze delle classi. Per esempio, possiamo suddividere le possibili altezze degli studenti ( misurate in centimetri) nei seguenti intervalli: ( 160 – 165] ; (165 – 170] ; ( 170 – 175] ; (175 – 180] ; ( 180 – 185] ; ( 185 – 190] A questo punto possiamo costruire una tabella in cui associamo ad ogni classe la sua frequenza, cioè il numero di modalità che vi appartengono. Otteniamo così la distribuzione di frequenze rappresentata in tabella (slide 10) Il significato matematico delle parentesi tonde e quadre è il seguente, relativamente alla prima classe: cioè quelli alti da 160,1 fino a 165 stanno nella prima classe; se uno è alto 165,1 sta nella seconda ecc…
10
Organizzazione dei dati
Distribuzione delle frequenze per classi Altezza degli studenti ( in cm) Numero di studenti (160 – 165] 1 (165 – 170] 3 (170 – 175] (175 – 180] 4 (180 – 185] 5 (185 – 190] 2 Adesso i dati, distribuiti per classi sono di facile lettura. Data una classe, di intervallo di estremi a e b con a < b si definisce ampiezza della classe il numero b – a; mentre il valore centrale della classe è il numero: Le classi in cui vengono suddivisi i dati possono avere tutti la stessa ampiezza (come nell’esempio precedente) o ampiezza diversa tra loro; nel nostro caso, tutte le classi hanno ampiezza = 4: Il valore centrale, per la prima classe è: mentre per la seconda classe è: per la terza classe è: per la quarta classe è: per la quinta classe è:
11
Organizzazione dei dati
Distribuzione di frequenze cumulate Riconsideriamo lo studio del carattere altezza di 18 ragazzi di una scuola che ha prodotto i risultati riportati in tabella. Dal momento che il carattere studiato è quantitativo, possiamo ordinare le varie modalità osservate e porci ad esempio la domanda : quanti sono gli studenti che hanno altezza minore o uguale a 175 cm? Rispondere a questa domanda equivale a sommare (in statistica si dice cumulare) le frequenze assolute di tutte le modalità minori o uguale a 175 cm. Si introduce a questo punto il seguente concetto: Consideriamo un carattere quantitativo; si chiama frequenza cumulata relativa ad una data modalità la somma delle frequenze di tutte le modalità minoro o uguale ad essa. Altezza degli studenti (in cm) Numero di studenti Frequenza cumulata (161 – 165] 1 (165 – 170] 3 1 + 3 = 4 (170 – 175] 4 + 3 = 7 (175 – 180] 4 7 + 4 = 11 (180 – 185] 5 = 16 (185 – 190] 2 = 18 Dalla colonna delle frequenze cumulate possiamo leggere immediatamente la risposta alla domanda che è stata posta all’inizio: gli studenti la cui altezza è minore o uguale a 175 cm sono 7.
12
Organizzazione dei dati
Rappresentazioni grafiche Un metodo spesso utilizzato per rappresentare sinteticamente ed efficacemente i risultati di una indagine statistica è quello grafico. La sintesi grafica permette una visione d’insieme immediata di una indagine nella sua globalità; inoltre consente un confronto chiaro fra due o più fenomeni studiati. Esiste una grande varietà di grafici utilizzati in statistica, ma i più importanti si possono raggruppare in quattro categorie: i diagrammi a barre (ortogrammi) i diagrammi circolari / areogrammi gli istogrammi i diagrammi cartesiani Analizziamoli un po’ in dettaglio.
13
Organizzazione dei dati
I dati della tabella si possono rappresentare graficamente con un ortogramma, che è un grafico a colonne adiacenti ma staccate, tutte della stessa base e con l’altezza proporzionale al numero delle modalità rilevato ( frequenza). Sport Num. Alunni calcio 40 nuoto 29 tennis 35 volley 85 basket 51 Gli ortogrammi si utilizzano per rappresentare i dati relativamente a caratteri di tipo qualitativo oppure di tipo quantitativo discreto.
14
Organizzazione dei dati
I dati della tabella si possono rappresentare graficamente anche con un barre disposte orizzontalmente : Sport Num. Alunni calcio 40 nuoto 29 tennis 35 volley 85 basket 51
15
Organizzazione dei dati
Se nella tabella precedente le preferenze degli alunni vengono anche ripartite per sesso, si ottiene la tabella multipla, come quella a fianco Tabella multipla Modalità Numero alunni Maschi Femmine calcio 32 8 nuoto 10 19 tennis 23 12 volley 30 55 basket 31 20 In questo caso i dati possono essere rappresentati in modo significativo con un ortogramma a due colonne, che consente un confronto immediato delle preferenze espresse dai due sessi:
16
Organizzazione dei dati
Oppure possiamo fare ricorso ad un diagramma circolare (a torta o areogramma), nei quali un cerchio è suddiviso in settori circolari di ampiezza proporzionale al numero delle preferenze rilevate per ciascuna modalità (frequenza assoluta). Sport Num. Alunni calcio 40 nuoto 29 tennis 35 volley 85 basket 51 Un diagramma circolare può anche avere le porzioni staccate, in tal caso si dice a torta esplosa. N.B. Questo tipo di grafico si utilizza per visualizzare le diverse parti in cui “un tutto” e’ suddiviso; per esempio si presta bene a visualizzare la composizione del Parlamento da parte dei diversi partiti politici.
17
Organizzazione dei dati Ore trascorse in palestra
I diagrammi cartesiani I diagrammi cartesiani si possono utilizzare per rappresentare le distribuzioni di frequenze di un carattere quantitativo. Per costruirli, si rappresentano anzitutto i punti che hanno come ascisse i valori osservati e come ordinate le corrispondenti quantità con cui le varie modalità si sono verificate (frequenze), poi si collegano i punti con dei segmenti, in modo da generare una poligonale. Esempio I gestori di una palestra vogliono elaborare i dati relativi ai loro iscritti. A tale proposito utilizzano un campione di 100 iscritti, suddividendoli in base al numero di ore settimanali trascorse in palestra da ciascuna unità statistica: Ore Ore trascorse in palestra 1 19 2 15 3 4 8 5 Totale 50
18
Organizzazione dei dati
In statistica il più frequente utilizzo dei diagrammi cartesiani riguarda la rappresentazione delle cosiddette serie temporali, cioè quei fenomeni che vengono osservati in determinati periodi di tempo (mesi o anni, per esempio). La rappresentazione tramite diagramma cartesiano consiste nel riportare in ascisse i tempi e sull’asse delle ordinate i corrispondenti valori osservati. Come nell’esempio precedente, i punti ottenuti vengono poi uniti da segmenti in modo da formare una poligonale che rappresenta con buona approssimazione l’andamento del fenomeno nel tempo. Rappresentazione tramite diagrammi cartesiani di serie storiche Esempio : In tabella è riportata la piovosità nell’anno 2012 Mese Piovosità (mm) gennaio 20 febbraio 15 marzo 10 aprile 8 maggio 4 giugno 2 luglio agosto settembre ottobre novembre dicembre 18
19
Organizzazione dei dati
Un istogramma è un grafico costituito da rettangoli non distanziati, ciascuno dei quali ha un’area proporzionale alla frequenza della classe che rappresenta. Se le basi hanno la stessa ampiezza, basta che l’altezza sia proporzionale alla frequenza (molto simile al diagramma a barre verticale). Tale grafico si utilizza per rappresentare graficamente distribuzioni di caratteri suddivisi in classi. In una ditta lavorano 72 impiegati la cui età si può raggruppare nelle seguenti classi: Classi di età Numero di impiegati [20 , 35) 16 [35 , 50) 34 [50 , 65) 12 [20 – 35) [35 – 50) [50 – 65)
20
Organizzazione dei dati
Altri tipi di grafici Esistono molti altri tipi di grafici talvolta utilizzati in statistica: vediamone altri due tipologie: Rappresentazione, per regione, del numero di pensioni INPS per 1000 abitanti al primo gennaio del Si tratta di un esempio di cartogramma: sulla cartina sono rappresentati i relativi alle varie regioni, variando l’intensità dei colori. Rappresentazione delle percentuali di vetro riciclato nel 2010 in alcuni paesi europei. Si tratta di un esempio di ideogramma, ossia di un grafico costruito con figure che illustrano il carattere studiato; la dimensione di ciascuna figura è proporzionale alla frequenza della modalità che rappresenta.
21
Organizzazione dei dati
22
Organizzazione dei dati
Altro esempio: Classi di frequenza Nei casi di indagine statistica rispetto a caratteri quantitativi, può capitare che le modalità (cioè i dati numerici raccolti), siano molto numerose e abbiano valori molto differenti tra loro. Ad esempio, su un’indagine sulla statura di un gruppo di 40 coetanei ha dato i seguenti risultati (in cm): Statura Frequenza 135 2 136 1 137 138 3 139 140 141 143 144 145 148 149 152 153 4 154 155 158 160 161 162 163 164 140 137 145 158 164 148 162 144 149 136 143 142 153 152 139 161 135 138 160 155 163 154 I valori variano da un minimo di 135 cm ad un massimo di 164 cm; se si calcola la frequenza assoluta di tutte le modalità, la tabella di distribuzione delle frequenze sarebbe molto grande e poco significativa. Si possono, invece, raggruppare i valori in cinque gruppi distinti della stessa ampiezza di 6 cm, che si dicono classi.
23
Organizzazione dei dati
Un’organizzazione dei dati per classe consente una visione più sintetica della loro distribuzione anche se meno dettagliata. Raggruppiamo i valori in cinque gruppi distinti della stessa ampiezza di 6 cm, che si dicono classi. Distribuzione della frequenza assoluta per classi Istogramma Classe Intervallo (cm) Frequenza assoluta 1° 135 ÷ 140 9 2° 141 ÷ 146 6 3° 147 ÷ 152 5 5° 153 ÷ 158 8 159 ÷ 164 12 Classe 3° Classe 1° Classe 2° Classe 4° Classe 5°
24
Organizzazione dei dati
Esempio 1 - classi di frequenza Un’indagine sul numero degli studenti che frequentano ciascuna delle 24 classi di una scuola ha dato i seguenti risultati: Compilare la tabella delle frequenze e calcola le frequenze relative e percentuali Numero alunni per classe Frequenza assoluta
25
Organizzazione dei dati Numero alunni per classe Frequenza percentuale
Esempio 1 - svolto Un’indagine sul numero degli studenti che frequentano ciascuna delle 24 classi di una scuola ha dato i seguenti risultati: Compilare la tabella delle frequenze e calcola le frequenze relative e percentuali Numero alunni per classe Frequenza assoluta 18 2 19 3 20 5 21 6 22 4 23 totale 24 Numero alunni per classe Frequenza assoluta Frequenza relativa Frequenza percentuale 18 2 2/24 = 0,08 0,08·100= 8% 19 3 3/24 = 0,12 0,12·100=12% 20 5 5/ 24 = 0,21 0,21·100= 21% 21 6 6/24 = 0,25 0,25·100=25% 22 4 4/24 = 0,17 0,17·100=17% 23 N.B.
26
Organizzazione dei dati
Esempio Classi di frequenza Ad una gara podistica partecipano 50 atleti, che hanno le seguenti età (in anni) : Compilare la tabella di distribuzioni delle frequenze assolute, relative e percentuali, suddividendo i dati per classe di ampiezza 2 anni. Disegnare il relativo istogramma Per le prime si classi abbiamo:
27
Organizzazione dei dati
Esempio svolto Classe Età Frequenza 1° 9 2° 4 3° 4° 2 5° 3 6° 7° 8° 9° 10° 6 11° 12° 13° 1 Per le prime si classi abbiamo: 1° 2° 3° 4° 5° 6° 7° 8° 9° 10° 11° 12° 13° Classe Età Frequenza assoluta relativa Percentuale 1° 9 9/50=0,18 18% 2° 4 4/50=0,08 8% 3° 4° 2 2/50=0,04 4% 5° 3 3/50=0,06 6% 6°
28
Organizzazione dei dati
Dal grafico alla tabella : esempio 1 Si sono lanciati due dadi alcune volte e si è annotato ogni volta il punteggio ottenuto addizionando i due numeri, compresi ciascuno tra 1 e 6. Il seguente istogramma illustra la situazione.: 2 3 4 5 6 7 8 9 10 11 12 Indicare il punteggio che ha ottenuto la frequenza maggiore e, successivamente, costruire una tabella che evidenzi quante volte si è ottenuto ciascun punteggio.
29
Organizzazione dei dati
Dal grafico alla tabella : esempio 1 - svolto Dall’esame del grafico si nota che il punteggio che ha ottenuto la frequenza maggiore è il 7. Riportiamo in una tabella quante volte si è ottenuto ciascun punteggio. Punteggio Frequenza 2 3 4 5 6 7 9 8 10 11 12 2 3 4 5 6 7 8 9 10 11 12
30
Organizzazione dei dati
Dal grafico alla tabella : esempio 2 L’areogramma riportato a fianco rappresenta i risultati delle preferenze sportive (in percentuale) espresse da un gruppo di 300 ragazzi. Calcolare quanti sono i ragazzi che preferiscono ciascun tipo di sport riportando i dati in una apposita tabella. Disegnare un ortogramma che illustri la situazione.
31
Organizzazione dei dati
Dal grafico alla tabella : esempio 2 - soluzione Sport Percentuale Frequenza relativa calcio 33% 0,33 volley 27% 0,27 nuoto 7% 0,07 tennis 13% 0,13 basket 20% 0,20 Supponiamo di sapere che tali dati si riferiscono ad una campione di 300 persone. N.B. Noi sappiamo che: Pertanto: Sport Percentuale Frequenza relativa Praticanti calcio 33% 0,33 99 volley 27% 0,27 81 nuoto 7% 0,07 21 tennis 13% 0,13 39 basket 20% 0,20 60 300
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.