Modalità rappresentazione dei dati Grafici, percentuali, tabelle …

Slides:



Advertisements
Presentazioni simili
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
Advertisements

LA STATISTICA. Cenni storici ● In Egitto: si rilevava l'ammontare della popolazione e i vari beni ai fini fiscali; si tenevano elenchi delle famiglie.
Rappresentazioni grafiche di una distribuzione di frequenze 1)Istogramma e poligono delle frequenze ● Dati raggruppati in classi ● Costituito da un insieme.
Indici di Posizione Giulio Vidotto Raffaele Cioffi.
1 Corso di Analisi Statistica per le Imprese Rappresentazione dei dati Prof. L. Neri a.a
Le Frazioni Prof.ssa A.Comis.
Statistica I Grafici Seconda Parte.
LA STATISTICA DESCRITTIVA
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Statistica descrittiva
ESERCITAZIONE RIEPILOGO di Statistica Descrittiva
Effetto scuola o Valore aggiunto
Le Frazioni.
Modalità rappresentazione dei dati Tabelle, percentuali, grafici …
DALLA TABELLA DELLE OSSERVAZIONI ALLA TABELLA DELLE FREQUENZE
Insiemi di numeri e insiemi di punti
Elaborazione dei dati Indici di posizione centrale
Esercizio 1 Prezzo in euro libri
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Misure dei valori centrali
Statistica Prima Parte I Dati.
STUDIA I FENOMENI COLLETTIVI CON METODI MATEMATICI
La circonferenza nel piano cartesiano
STATISTICA Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo.
x : variabile indipendente
L’analisi monovariata
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Le disequazioni DEFINIZIONE DISEQUAZIONI EQUIVALENTI
La circonferenza nel piano cartesiano
L'ABC della statistica LA MEDIA ARITMETICA
x : variabile indipendente
Didattica speciale : codici del linguaggio logico e matematico
Prof.ssa Carolina Sementa
La statistica A cura di: Manuela Mangione.
La frazione come numero razionale assoluto
La Statistica si occupa dei modi
I calcoli finanziari: l’interesse
misure di eterogeneità
Ripasso dei concetti fondamentali
La Statistica Istituto Comprensivo “ M. G. Cutuli”
Fisica: lezioni e problemi
Rapporti e proporzioni
Statistica descrittiva bivariata
L’analisi monovariata
I 7 strumenti della qualità
La rappresentazione della realtà
ANALISI DELLE DISTRIBUZIONI STATISTICHE
Indici di variabilità La variabilità è la ragione dell’esistenza della psicologia. Le persone hanno dei comportamenti diversi che non possono essere predetti.
Corso di Analisi Statistica per le Imprese Rappresentazione dei dati
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Esercitazioni psicometria
Statistica descrittiva
L’indagine statistica
Statistica Scienza che studia i fenomeni collettivi.
I numeri relativi DEFINIZIONE. Si dicono numeri relativi tutti i numeri interi, razionali e irrazionali dotati di segno (positivo o negativo). ESEMPI Numeri.
Confronto tra diversi soggetti:
Statistica.
32 = 9 x2 = 9 x = 3 32 = 9 √9 = 3 L’estrazione di radice
La rappresentazione della realtà
“Una delle più grandi scoperte che un uomo può fare, una delle sue più grandi sorprese, è scoprire che può fare ciò che aveva paura di non poter fare”.
La rappresentazione dei dati
SCALE DI MISURA CARATTERI QUALITATIVI CARATTERI QUANTITATIVI
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Esercizio 1 Si vuole studiare la mobilità di voto degli elettori di una certa circoscrizione. Da un sondaggio telefonico risulta che: Si calcolino le distribuzioni.
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Numeri indice di prezzi e quantità
Frequenza a) Compilare una tabella classificando i compagni di classe secondo lo sport che preferiscono b) Compilare una tabella classificando i compagni.
Statistica descrittiva bivariata
EserciZI di Statistica
Transcript della presentazione:

Modalità rappresentazione dei dati Grafici, percentuali, tabelle … Dopo aver raccolto i dati, occorre contarli, ordinarli in modo che possano essere facilmente utilizzati: questa operazione è detta spoglio dei dati. Dopo lo spoglio si procede alla tabulazione dei dati, cioè alla loro organizzazione in tabelle, affinché possano essere letti, analizzati ed interpretati agevolmente. Le tabelle che si utilizzano per tabulare i dati sono di tre tipi: Semplici Multiple A doppia entrata I dati delle tabelle, per una loro migliore e più rapida comprensione, sovente sono anche rappresentati graficamente con ortogrammi, istogrammi, areogrammi, diagrammi cartesiani, ecc… Consideriamo la tabella a fianco: Essa si riferisce ad un’indagine sugli alunni di una scuola che riguarda solo un carattere, lo sport praticato, con le cinque modalità: calcio, nuoto, tennis, volley e basket. Una tabella di questo tipo si dice semplice Nella prima colonna sono elencate le modalità dell’unico carattere oggetto dell’indagine e nella seconda colonna il numero di volte in cui ciascuna modalità si è manifestata nei dati raccolti. Sport Num. Alunni calcio 40 nuoto 29 tennis 35 volley 85 basket 51

Organizzazione dei dati Distribuzione di frequenza Supponiamo di avere rilevato, in una classe di una scuola, il colore degli occhi degli allievi. Il risultato della rilevazione fornisce i cosiddetti dati grezzi, che riportiamo qui sotto: nero, marrone, azzurro, nero, marrone, nero, azzurro, verde, marrone, verde, marrone, nero, verde, nero, verde, nero, marrone, nero Questi risultati li possiamo raccogliere nella seguente tabella in cui, ad ogni unità statistica (cioè a ogni studente) è stata associata la modalità del carattere osservata, cioè il colore nero (N) , marrone (M), verde (V), o azzurro (A). Studente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Colore occhi N M A V Una prima forma di elaborazione dati, volta ad ottenere una maggiore sintesi, consiste nel costruire una tabella in cui riportare, per ciascuna delle modalità osservate, (N.M. A, V) il numero di individui su cui è stata rilevata. Si definisce frequenza assoluta ( o semplicemente frequenza) di una modalità il numero di volte in cui la modalità è stata osservata. Associando ad ogni modalità la sua frequenza si ottiene la tabella sottostante in cui i dati sono più organizzati e meglio leggibili. Colore degli occhi Numero di studenti nero 7 marrone 5 azzurro 2 verde 4 La distribuzione di frequenza, è una tabella a due colonne, nella prima delle quali sono riportate le modalità e nella seconda delle quali sono riportate le frequenze.

Organizzazione dei dati Supponiamo di aver rilevato il carattere colore degli occhi , oltre che nella classe scolastica (costituita da 18 alunni), che prodotto i dati riportati nella tabella sottostante, anche in un’altra classe, formata da 28 studenti, i cui dati sono riportati in quest’ altra tabella: Classe A Classe B Colore degli occhi Numero di studenti nero 7 marrone 5 azzurro 2 verde 4 Colore degli occhi Numero di studenti nero 10 marrone 8 azzurro 4 verde 6 Se vogliamo confrontare le distribuzioni delle frequenze nelle due classi di studenti, dobbiamo tenere conto del fatto che queste sono composte da numeri diversi di alunni; le frequenze assolute osservate nella seconda classe risulteranno maggiori di quelle osservate nella prima, ma ciò è dovuto unicamente dal fatto che la seconda classe è più numerosa della prima. Per ovviare a questo inconveniente, è necessario fare in modo che ci si riferisca ad uno stesso numero di alunni per classe. A tale scopo si introduce il concetto di frequenza relativa. Si definisce frequenza relativa di una modalità il rapporto fra la sue frequenza assoluta ed il numero complessivo di individui presi n esame. Le frequenze relative sono dei rapporti in cui il denominatore è sempre maggiore (o al più uguale) del numeratore, quindi sono espresse da frazioni comprese tra 0 ed 1. La frequenza relativa si può esprimere sotto forma di percentuale (moltiplicando per 100) ; in tal caso si ha appunto la frequenza percentuale.

Organizzazione dei dati Distribuzione di frequenze relative e percentuali Costruiamo, a fianco della colonna delle frequenze assolute, due nuove colonne, dove riportiamo le frequenze relative e quelle percentuali. Colore degli occhi Frequenza assoluta Frequenza relativa Frequenza percentuale nero 7 7/18 = 0,389 38,90% marrone 5 5/18 = 0,278 27,80% azzurro 2 2/18 = 0,111 11,10% verde 4 4/18 = 0,222 22,20% Totale 18 1 100% Tabella A Facciamo lo stesso con la seconda tabella e otteniamo: Colore degli occhi Frequenza assoluta Frequenza relativa Frequenza percentuale nero 10 10/28 = 0,357 35,50% marrone 8 8/28 = 0,286 28,60% azzurro 4 4/28 = 0,143 14,30% verde 6 6/28 = 0,214 21,40% Totale 28 1 100% Tabella B Osserviamo che nella seconda classe, il nero ed il marrone pur avendo frequenza maggiore della prima classe, hanno frequenza relativa e percentuale minore. Questo significa che se avessimo due classi entrambe di 100 alunni, nella prima classe il colore nero si avrebbe 38,9 mentre nella seconda classe 35,5.

Organizzazione dei dati Colore degli occhi Frequenza assoluta Frequenza relativa Frequenza percentuale nero 10 10/28 = 0,357 35,50% marrone 8 8/28 = 0,286 28,60% azzurro 4 4/28 = 0,143 14,30% verde 6 6/28 = 0,214 21,40% Totale 28 1 100% Riflettendo sulle due tabelle di cui sopra si può osservare che: La somma delle frequenze assolute di tutte le modalità è sempre uguale al numero complessivo di individui presi in esame; La somma delle frequenze relative è sempre uguale ad 1; La somma delle frequenze percentuali è sempre 100%.

Organizzazione dei dati Altro esempio: importanza della frequenza relativa Supponiamo che in due classi di due scuole diverse : “Radice” e “Galilei” si siano ottenuti i seguenti dati riportati nelle due tabelle: Radice Galilei Sport Num. Alunni calcio 60 nuoto 30 tennis 40 volley 100 basket 70 Sport Num. Alunni calcio 80 nuoto 50 tennis 30 volley 140 basket 200 e di voler sapere in quale scuola è maggiormente praticato il calcio. Poiché le due scuole sono frequentate da un numero di alunni diverso, è errato basarsi sulla frequenza assoluta e rispondere: Galilei. In questo caso occorre calcolare le frequenze relative percentuali, per cui: Radice = Galilei = Il risultato dice che se le due scuole avessero uno stesso numero di alunni (100) la frequenza maggiore si avrebbe al Radice 20, mentre al Galilei solo 16.

Organizzazione dei dati Distribuzione delle frequenze per classi Andiamo a misurare la statura di 18 ragazzi di una scuola e supponiamo di avere ottenuto i seguenti dati grezzi: Studente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Altezza (in cm) 173 164 174 180 182 176 184 185 170 172 186 167 188 183 168 178 Rispetto al caso precedente, quando si misurava il colore degli occhi, il carattere oggetto di studio (la statura degli studenti), presenta ora molte più modalità, tutte con frequenza 1 o al massimo 2. Se costruiamo la distribuzione delle frequenze, non otteniamo una sintesi significativa, perché otterremmo una tabella che semplificherebbe di poco la tabella precedente. Per ovviare a questo inconveniente è utile raggruppare (accorpare) preliminarmente le modalità in intervalli tra loro disgiunti, detti classi, quindi costruire la tabella di distribuzione di frequenze delle classi. Per esempio, possiamo suddividere le possibili altezze degli studenti ( misurate in centimetri) nei seguenti intervalli: ( 161 – 165) ; (166 – 170) ; ( 171 – 175) ; ( 176 – 180) ; ( 181 – 185) ; ( 186 – 190) A questo punto possiamo costruire una tabella in cui associamo ad ogni classe la sua frequenza , cioè il numero di modalità che vi appartengono. Otteniamo così la distribuzione di frequenze rappresentata in tabella:

Organizzazione dei dati Distribuzione delle frequenze per classi Altezza degli studenti ( in cm) Numero di studenti (161 - 165) 1 (166 - 170) 3 (171 - 175) (176 - 180) 4 (181 - 185) 5 (186 - 190) 2 Adesso i dati, distribuiti per classi sono di facile lettura. Data una classe, di intervallo di estremi a e b con a < b si definisce ampiezza della classe il numero b – a; mentre il valore centrale della classe è il numero: Le classi in cui vengono suddivisi i dati possono avere tutti la stessa ampiezza (come nell’esempio precedente) o ampiezza diversa tra loro; nel nostro caso, tutte le classi hanno ampiezza = 4: Mentre il valore centrale, per la prima classe è: mentre per la seconda classe è: per la terza classe è: per la quarta classe è:

Organizzazione dei dati Distribuzione di frequenze cumulate Riconsideriamo lo studio del carattere altezza di 18 ragazzi di una scuola che ha prodotto i risultati riportati in tabella. Dal momento che il carattere studiato è quantitativo, possiamo ordinare le varie modalità osservate e porci ad esempio la domanda : quanti sono gli studenti che hanno altezza minore o uguale a 175 cm? Rispondere a questa domanda equivale a sommare (in statistica si dice cumulare) le frequenze assolute di tutte le modalità minori o uguale a 175 cm. Si introduce a questo punto il seguente concetto: Consideriamo un carattere quantitativo; si chiama frequenza cumulata relativa ad una data modalità la somma delle frequenze di tutte le modalità minoro o uguale ad essa. Altezza degli studenti (in cm) Numero di studenti Frequenza cumulata (161 - 165) 1 (166 - 170) 3 1 + 3 = 4 (171 - 175) 4 + 3 = 7 (176 - 180) 4 7 + 4 = 11 (181 - 185) 5 11 + 5 = 16 (186 - 190) 2 16 + 2 = 18 Dalla colonna delle frequenze cumulate possiamo leggere immediatamente la risposta alla domanda che è stata posta all’inizio: gli studenti la cui altezza è minore o uguale a 175 cm sono 7.

Organizzazione dei dati Rappresentazioni grafiche Un metodo spesso utilizzato per rappresentare sinteticamente ed efficacemente i risultati di una indagine statistica è quello grafico. La sintesi grafica permette una visione d’insieme immediata di una indagine nella sua globalità; inoltre consente un confronto chiaro fra due o più fenomeni studiati. Esiste una grande varietà di grafici utilizzati in statistica, ma i più importanti si possono raggruppare in quattro categorie: i diagrammi a barre (ortogrammi) i diagrammi circolari / areogrammi gli istogrammi i diagrammi cartesiani Analizziamoli un po’ in dettaglio.

Organizzazione dei dati I dati della tabella si possono rappresentare graficamente con un ortogramma, che è un grafico a colonne adiacenti ma staccate, tutte della stessa base e con l’altezza proporzionale al numero delle modalità rilevato ( frequenza). Sport Num. Alunni calcio 40 nuoto 29 tennis 35 volley 85 basket 51 Gli ortogrammi si utilizzano per rappresentare i dati relativamente a caratteri di tipo qualitativo oppure di tipo quantitativo discreto.

Organizzazione dei dati I dati della tabella si possono rappresentare graficamente anche con un barre disposte orizzontalmente : Sport Num. Alunni calcio 40 nuoto 29 tennis 35 volley 85 basket 51

Organizzazione dei dati Se nella tabella precedente le preferenze degli alunni vengono anche ripartite per sesso, si ottiene la tabella multipla, come quella a fianco Tabella multipla Modalità Numero alunni Maschi Femmine calcio 32 8 nuoto 10 19 tennis 23 12 volley 30 55 basket 31 20 In questo caso i dati possono essere rappresentati in modo significativo con un ortogramma a due colonne, che consente un confronto immediato delle preferenze espresse dai due sessi:

Organizzazione dei dati Oppure possiamo fare ricorso ad un diagramma circolare (areogramma), nei quali un cerchio è suddiviso in settori circolari di ampiezza proporzionale al numero delle preferenze rilevate per ciascuna modalità (frequenza assoluta). Sport Num. Alunni calcio 40 nuoto 29 tennis 35 volley 85 basket 51 Un diagramma circolare può anche avere le porzioni staccate, in tal caso si dice a torta esplosa.

Organizzazione dei dati Ore trascorse in palestra I diagrammi cartesiani I diagrammi cartesiani si possono utilizzare per rappresentare le distribuzioni di frequenze di un carattere quantitativo. Per costruirli, si rappresentano anzitutto i punti che hanno come ascisse i valori osservati e come ordinate le corrispondenti quantità con cui le varie modalità si sono verificate (frequenze), poi si collegano i punti con dei segmenti, in modo da generare una poligonale. Esempio I gestori di una palestra vogliono elaborare i dati relativi ai loro iscritti. A tale proposito utilizzano un campione di 100 iscritti, suddividendoli in base al numero di ore settimanali trascorse in palestra da ciascuna unità statistica: Ore Ore trascorse in palestra 1 19 2 15 3 4 8 5 Totale 50

Organizzazione dei dati In statistica il più frequente utilizzo dei diagrammi cartesiani riguarda la rappresentazione delle cosiddette serie temporali, cioè quei fenomeni che vengono osservati in determinati periodi di tempo (mesi o anni, per esempio). La rappresentazione tramite diagramma cartesiano consiste nel riportare in ascisse i tempi e sull’asse delle ordinate i corrispondenti valori osservati. Come nell’esempio precedente, i punti ottenuti vengono poi uniti da segmenti in modo da formare una poligonale che rappresenta con buona approssimazione l’andamento del fenomeno nel tempo. Rappresentazione tramite diagrammi cartesiani di serie storiche Esempio : In tabella è riportata la piovosità nell’anno 2012 Mese Piovosità (mm) gennaio 20 febbraio 15 marzo 10 aprile 8 maggio 4 giugno 2 luglio agosto settembre ottobre novembre dicembre 18

Organizzazione dei dati Un istogramma è un grafico costituito da rettangoli non distanziati, ciascuno dei quali ha un’area proporzionale alla frequenza della classe che rappresenta. Se le basi hanno la stessa ampiezza, basta che l’altezza sia proporzionale alla frequenza (molto simile al diagramma a barre verticale). Tale grafico si utilizza per rappresentare graficamente distribuzioni di caratteri suddivisi in classi. In una ditta lavorano 72 impiegati la cui età si può raggruppare nelle seguenti classi: Classi di età Numero di impiegati (20 , 35) 16 (36 , 50) 34 (51 , 65) 12 (20 – 35) (36 – 50) (51 – 65)

Organizzazione dei dati Altri tipi di grafici Esistono molti altri tipi di grafici talvolta utilizzati in statistica: vediamone altri due tipologie: Rappresentazione, per regione, del numero di pensioni INPS per 1000 abitanti al primo gennaio del 2012. Si tratta di un esempio di cartogramma: sulla cartina sono rappresentati i relativi alle varie regioni, variando l’intensità dei colori. Rappresentazione delle percentuali di vetro riciclato nel 2010 in alcuni paesi europei. Si tratta di un esempio di ideogramma, ossia di un grafico costruito con figure che illustrano il carattere studiato; la dimensione di ciascuna figura è proporzionale alla frequenza della modalità che rappresenta.

Organizzazione dei dati

Organizzazione dei dati Tabella a doppia entrata La seguente tabella è relativa ad un’indagine fra i possessori di una casa per le vacanze riguardo alla località in cui essa si trova ( tre modalità: campagna, montagna, mare) ed al numero dei locali da cui è costituita (quattro modalità: 1 stanza, 2 stanze, 3 stanze, 4 stanze): N. stanze Località Campagna Montagna Mare 1 2 15 36 4 19 18 3 5 6 Si tratta di una tabella a doppia entrata, perché in essa sono considerati due diversi caratteri di una stessa popolazione statistica; la tabella si legge non solo per righe, come una tabella semplice, ma anche per righe e per colonne: infatti, ad esempio, all’incrocio della terza riga con la seconda colonna si può rilevare che sono 6 le case con 3 stanze in montagna

Organizzazione dei dati Altro esempio: Classi di frequenza Nei casi di indagine statistica rispetto a caratteri quantitativi, può capitare che le modalità (cioè i dati numerici raccolti), siano molto numerose e abbiano valori molto differenti tra loro. Ad esempio, su un’indagine sulla statura di un gruppo di 40 coetanei ha dato i seguenti risultati (in cm): Statura Frequenza 135 2 136 1 137 138 3 139 140 141 143 144 145 148 149 152 153 4 154 155 158 160 161 162 163 164 140 137 145 158 164 148 162 144 149 136 143 142 153 152 139 161 135 138 160 155 163 154 I valori variano da un minimo di 135 cm ad un massimo di 164 cm; se si calcola la frequenza assoluta di tutte le modalità, la tabella di distribuzione delle frequenze sarebbe molto grande e poco significativa. Si possono, invece, raggruppare i valori in cinque gruppi distinti della stessa ampiezza di 6 cm, che si dicono classi.

Organizzazione dei dati Un’organizzazione dei dati per classe consente una visione più sintetica della loro distribuzione anche se meno dettagliata. Raggruppiamo i valori in cinque gruppi distinti della stessa ampiezza di 6 cm, che si dicono classi. Distribuzione della frequenza assoluta per classi Istogramma Classe Intervallo (cm) Frequenza assoluta 1° 135 ÷ 140 9 2° 141 ÷ 146 6 3° 147 ÷ 152 5 5° 153 ÷ 158 8 159 ÷ 164 12 Classe 3° Classe 1° Classe 2° Classe 4° Classe 5°

Organizzazione dei dati Esempio 1 Un’indagine sul numero degli studenti che frequentano ciascuna delle 24 classi di una scuola ha dato i seguenti risultati: 20 21 22 18 23 19 21 20 18 22 21 23 21 19 20 21 20 22 19 23 20 22 21 Compilare la tabella delle frequenze e calcola le frequenze relative e percentuali Numero alunni per classe Frequenza assoluta  

Organizzazione dei dati Dal grafico alla tabella : esempio 1 Si sono lanciati due dadi alcune volte e si è annotato ogni volta il punteggio ottenuto addizionando i due numeri, compresi ciascuno tra 1 e 6. Il seguente istogramma illustra la situazione.: Indicare il punteggio che ha ottenuto la frequenza maggiore e, successivamente, costruire una tabella che evidenzi quante volte si è ottenuto ciascun punteggio.

Organizzazione dei dati Dal grafico alla tabella : esempio 2 L’areogramma riportato a fianco rappresenta i risultati delle preferenze sportive (in percentuale) espresse da un gruppo di 300 ragazzi. Calcolare quanti sono i ragazzi che preferiscono ciascun tipo di sport riportando i dati in una apposita tabella. Disegnare un ortogramma che illustri la situazione.

Organizzazione dei dati Dal grafico alla tabella : esempio 2 - soluzione Sport Percentuale Frequenza relativa calcio 33% 0,33 volley 27% 0,27 nuoto 7% 0,07 tennis 13% 0,13 basket 20% 0,20 Supponiamo di sapere che tali dati si riferiscono ad una campione di 300 persone. Sport Percentuale Frequenza relativa Praticanti calcio 33% 0,33 99 volley 27% 0,27 81 nuoto 7% 0,07 21 tennis 13% 0,13 39 basket 20% 0,20 60 300

Organizzazione dei dati Numero alunni per classe Frequenza percentuale Esempio 1 Un’indagine sul numero degli studenti che frequentano ciascuna delle 24 classi di una scuola ha dato i seguenti risultati: 20 21 22 18 23 19 21 20 18 22 21 23 21 19 20 21 20 22 19 23 20 22 21 Compilare la tabella delle frequenze e calcola le frequenze relative e percentuali Numero alunni per classe Frequenza assoluta    18  2  19  3  20  5  21  6  22  4  23  totale 24  Numero alunni per classe Frequenza assoluta Frequenza relativa Frequenza percentuale  18  2 0,08 8%  19  3 0,13 13%  20  5 0,21 21%  21  6 0,25 25%  22  4 0,17 17%  23

Organizzazione dei dati Esempio 2 - Classi di frequenza Ad una gara podistica partecipano 50 atleti, che hanno le seguenti età (in anni) : 21 28 18 23 42 22 36 39 34 28 41 38 18 24 35 30 26 39 20 25 32 18 36 19 20 38 30 37 34 21 18 23 39 33 40 37 19 19 22 33 27 39 40 31 36 37 40 Compilare la tabella di distribuzioni delle frequenze assolute, relative e percentuali, suddividendo i dati per classe di ampiezza 2 anni. Disegnare il relativo istogramma

Organizzazione dei dati Esempio 2 - Classi di frequenza Classe Età Frequenza 1° 18 - 19 9 2° 20 - 21 4 3° 22 - 23 4° 24 - 25 2 5° 26 - 27 3 6° 28 - 29 7° 30 - 31 8° 32 - 33 9° 34 - 35 10° 36 - 37 6 11° 38 - 39 12° 40 - 41 13° 42 - 43 1 1° 2° 3° 4° 5° 6° 7° 8° 9° 10° 11° 12° 13°

Elaborazione dei dati Indici di posizione centrale Le tabelle dei dati, le tabelle di distribuzione delle frequenze e le relative rappresentazioni grafiche forniscono già un’idea, sia pur approssimata, dell’andamento del fenomeno in esame. E’ possibile valutare in modo più preciso alcune caratteristiche, elaborando i dati raccolti nell’indagine, cioè traendo da essi altre informazioni significative con procedimenti matematici. L’elaborazione dei dati riguarda in generale solo i caratteri di tipo quantitativo, le cui modalità sono espresse da numeri, e consiste in pratica nel calcolo di alcuni particolari indici, detti valori di sintesi. Tra questi valori abbiamo gli indici di posizione centrale o valori medi: Indici di posizione centrale Media aritmetica Moda Mediana

Elaborazione dei dati Media Si dice media aritmetica di un insieme di numeri, il rapporto tra la loro somma ed il loro numero Esempio I voti riportai da un alunno nel corso del 1° quadrimestre sono stati 6 4 5 7 8 6 7 5 6 La loro media aritmetica è: M = Nel caso di una distribuzione di dati numerici si può affermare che la media aritmetica è il valore che i dati assumerebbero se fossero tutti uguali fra loro. Riportiamo i dati in una tabella di frequenza: voto frequenza 6 3 4 1 5 2 7 8 La media aritmetica è: M = Quando i dati sono raggruppati in una tabella di distribuzione delle frequenze, la media aritmetica si calcola addizionando i prodotti di ciascun dato per la sua frequenza assoluta e dividendo la somma ottenuta per la somma delle frequenze assolute. In questi casi la media aritmetica si dice ponderata.

Organizzazione dei dati Moda Si dice moda o valore modale di una distribuzione di dati la modalità che ha la frequenza maggiore La tabelle sottostanti riguardano il colore preferito da un gruppo di studenti ed il peso di un gruppo di persone adulte Colore Frequenza assoluta rosso 19 verde 38 giallo 12 nero 4 blu 15 Peso (Kg) Frequenza assoluta 50 120 60 90 70 80 140 20 La moda è il colore verde nella prima tabella, (frequenza 38) e nella seconda è il peso di 80 Kg (frequenza 140) La moda è un carattere centrale che si può determinare nel caso di caratteri qualitativi sia nel caso di caratteri quantitativi

Elaborazione dei dati Mediana Si dice mediana di una distribuzione di dati numerici e ordinati il valore centrale della distribuzione Ad esempio, se i dati di un’indagine sono espressi dai numeri: 6 8 19 24 4 13 15 Dopo averli ordinati: 4 6 8 13 15 19 24 Il valore che occupa la posizione centrale è la mediana, nel nostro caso : 13 Se il numero dei dati è pari, non essendoci un valore centrale, la mediana è la media dei due valori centrali Dopo averli ordinati: 4 6 8 13 15 19 24 26 Nel nostro caso, presi i numeri 13 e 15, la loro media è: (13+15)/2= 14; pertanto 14 è la mediana.

Elaborazione dei dati Classi di frequenza Classe Intervallo (cm) Frequenza assoluta 1° 135 ÷ 140 9 2° 141 ÷ 146 6 3° 147 ÷ 152 5 4° 153 ÷ 158 8 5° 159 ÷ 164 12 Facciamo riferimento all’esempio su un’indagine sulla statura di un gruppo di 40 coetanei: Classe modale: 159 – 164 perché ha la frequenza assoluta maggiore Classe mediana: la media tra il valore centrale della classe (147 – 152) al 20° posto ed il valore centrale della classe (153 – 158) al 21 posto Il valore centrale della classe 147 – 152 è : Media ponderata Consideriamo il valore centrale di ogni classe: Classe Intervallo (cm) Valore centrale 1° 135 ÷ 140 137,5 2° 141 ÷ 146 143,5 3° 147 ÷ 152 149,5 4° 153 ÷ 158 155,5 5° 159 ÷ 164 161,5

Quale valore di posizione è piu’ opportuno? Abbiamo preso in esame tre indici di posizione: la moda, la mediana e la media aritmetica. In generale è buona pratica calcolare tutti e tre questi valori; infatti essi forniscono informazioni complementari, che descrivono aspetti differenti. Per esempio, in riferimento alla retribuzione annua netta dei dipendenti di una azienda: sapere che la media dei salari è 22.000 euro significa che, se il denaro complessivo speso per gli stipendi venisse distribuito in modo che il salario sia uguale per tutti, allora ciascuno riceverebbe 22.000 euro l’anno; sapere che la mediana dei salari è 20.000 euro, significa che la metà dei dipendenti percepisce uno stipendio superiore o uguale a 20.000 euro e circa l’altra metà uno stipendio inferiore o uguale a 20.00o euro. Sapere che la moda dei salari è 18.000 euro, significa che questo è il salario più frequente, cioè percepito dalla maggior parte di persone. Ancora Sebbene la media aritmetica sia certamente il valore più noto ed utilizzato, a seconda del particolare fenomeno preso in esame la mediana e la moda possono talvolta rivelarsi più idonei. Per esempio, se calcoliamo la media aritmetica tra i valori: 3, 4, 4, 6, 7, 8, 9, 100 troviamo come risultato m = 17,6 e possiamo notare che ben sette degli otto nume­ri sono più piccoli della media aritmetica. In questo caso la media aritmetica è poco rappresentativa dei dati, perché è eccessivamente influenzata dal valore anomalo 100; è più rappresentativa dei dati la mediana, che vale 6,5. Una situazione analoga si verifica, per esempio, nelle rilevazioni dei redditi o dei consumi, in cui i dati pos­sono presentare valori «anomali» molto grandi o molto piccoli: in tali casi la me­diana tende di solito a fornire un valore più rappresentativo della media aritmetica (troppo sensibile ai valori «anomali»). Se invece consideriamo, per esempio, il caso di un negoziante che deve scegliere la taglia di pantaloni di cui ordinare il maggiore numero di capi, allora è chiaro che il valore di sintesi più rappresentativo risulta la moda: il negoziante sceglierà la taglia più comune, ovvero quella acquistata più di frequente.