Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
1
Elaborazione Statistica dei Dati Sperimentali Facoltà di Scienze MM FF e NN, Università Sannio
Misure di posizione Giovanni Filatrella G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
2
Sintesi dei dati Un istogramma o una tabella di dati contengono molte informazioni E’ utile talvolta riassumere i dati con degli indicatori (indici) G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
3
“Indici” o “misure” di posizione
Frequenza rel. D: Esiste un singolo valore che possa dare qualche indicazione su come si distribuisce la variabile casuale? 0.4 0.3 0.2 0.1 tasso di fertilità G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
4
A cosa serve questo valore?
Per riassumere i dati occorre avere in mente una domanda A seconda del tipo di analisi che si vuole fare il tipo di “riassunto” dei dati è diverso. NON vi è una risposta in assoluto “corretta” G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
5
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Esempi Il tipo di analisi più comune è la media aritmetica: Proprietà di cui gode:conserva le trasformazioni di scala operate sui dati: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
6
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Alternative: Mediana: La mediana divide la distribuzione in due parti uguali. E’ definita come quel valore (centrale) che, una volta ordinati i dati del campione, lascia alla sua sinistra e alla sua destra la metà del campione, cioè divide a metà la distribuzione dei dati. Per esempio: 2, 5, 6, 8, 13, 15, 19, 22, 38 hanno mediana 13 (il 5° di valori) 3, 4, 8, 9, 13, 16, 17, 20, 21, 22 hanno mediana 14,5 (la media fra il 5° e il 6° di valori) G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
7
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Formalmente: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
8
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Procedura: 6, 6.7, 3.8, 7, 5.8 I valori ordinati sono: 3.8, 5.8, 6, 6.7, 7 mediana G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
9
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Esempio (2) 6, 6.7, 3.8, 7, 5.8, 9.975 I valori ordinati sono: 3.8, 5.8, 6, 6.7, 7, 9.975 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
10
Cosa fare se i dati sono già raggruppati in classi:
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
11
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Esempio La classe che contiene la mediana è la numero 3, (58 ┤ 70), Quindi la mediana è: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
12
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Importante La mediana non gode delle proprietà matematiche della media! G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
13
III esempio di indice di posizione: la MODA
Si definisce Moda il valore della variabile casuale della classe che si presenta con maggiore frequenza (rispetto alle classi adiacenti se esiste un ordinamento, variabili discrete o continue): G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
14
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
La moda di una distribuzione di dati potrebbe non corrispondere ad un solo valore: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
15
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Moda dai dati grezzi Per i dati sperimentali non si può calcolare un indice a prescindere dalla scelta di “individui” e “variabile casuale”: Tasso di fecondità totale per donne in età per regione di residenza - Anni Table 10.1 continue - Total fertility rate per women aged by region of residence - Years REGIONI E RIPARTIZIONI (a) Piemonte Valle d'Aosta Lombardia Trentino-Alto Adige Veneto Friuli-Venezia Giulia Liguria Emilia-Romagna Toscana Umbria Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Sardegna Nord Centro Sud ITALIA (a) Dati provvisori. (a) Provisional data. Fonte: ISTAT - Servizio "Popolazione e cultura". Source: ISTAT - Unit "Popolazione e cultura". G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
16
D: A quali dati si possono applicare i vari indici?
Media: solo alle variabili casuali intere o reali Mediana: solo alle variabili casuali intere o reali Moda: a qualsiasi distribuzione di dati (anche a quelli nominali) G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
17
Esempi di applicazione delle misure di posizione
I guasti in un sistema produttivo risultano causati da: Errore umano 12 Problemi dell’impianto 22 Malfunzionamenti software 7 Difetti dei materiali 5 Cause sconosciute 6 D.: Cosa scegliereste e perché? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
18
II esempio di applicazione delle misure di posizione
I guasti in un sistema produttivo hanno provocato delle interruzioni di: 0-1h 1-3h 3h-1d 1-7d D.: Cosa scegliereste e perché? e come procedereste con i calcoli? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
19
III esempio di applicazione delle misure di posizione
I tempi di attesa di un prodotto da parte dei clienti risultano essere stati: 0-2d 2-4d 4-6d 28d D.: Cosa scegliereste e perché? e come procedereste con i calcoli? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
20
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Attenzione: Sono riportate spesso delle relazioni empiriche fra moda, mediana e media. Non prendetele troppo sul serio! G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
21
Altra caratterizzazione delle distribuzioni: i percentili
Percentile: il p-mo percentile è il minimo dato di una lista tale che almeno p% dei valori della lista siano minori o uguali ad esso. Pertanto per ottenere i percentili da un insieme di dati è necessario ordinarli in una lista. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
22
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Nomenclatura: 25mo percentile I Quartile, o Lower Quartile 50mo percentile Mediana 75mo percentile III Quartile, o Upper Quartile G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
23
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Esercizio: Determinare: Classi di altezza Numero atleti 14 18 28 33 17 15 Totale 125 Media aritmetica Mediana Moda 10°, 50°, 90° percentile 1°, 2°, 3° Quartile G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.