La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Misure di posizione Giovanni Filatrella

Presentazioni simili


Presentazione sul tema: "Misure di posizione Giovanni Filatrella"— Transcript della presentazione:

1 Elaborazione Statistica dei Dati Sperimentali Facoltà di Scienze MM FF e NN, Università Sannio
Misure di posizione Giovanni Filatrella G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

2 Sintesi dei dati Un istogramma o una tabella di dati contengono molte informazioni E’ utile talvolta riassumere i dati con degli indicatori (indici) G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

3 “Indici” o “misure” di posizione
Frequenza rel. D: Esiste un singolo valore che possa dare qualche indicazione su come si distribuisce la variabile casuale? 0.4 0.3 0.2 0.1 tasso di fertilità G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

4 A cosa serve questo valore?
Per riassumere i dati occorre avere in mente una domanda A seconda del tipo di analisi che si vuole fare il tipo di “riassunto” dei dati è diverso. NON vi è una risposta in assoluto “corretta” G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

5 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Esempi Il tipo di analisi più comune è la media aritmetica: Proprietà di cui gode:conserva le trasformazioni di scala operate sui dati: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

6 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Alternative: Mediana: La mediana divide la distribuzione in due parti uguali. E’ definita come quel valore (centrale) che, una volta ordinati i dati del campione, lascia alla sua sinistra e alla sua destra la metà del campione, cioè divide a metà la distribuzione dei dati. Per esempio: 2, 5, 6, 8, 13, 15, 19, 22, 38     hanno mediana 13 (il 5° di valori) 3, 4, 8, 9, 13, 16, 17, 20, 21, 22   hanno mediana 14,5 (la media fra il 5° e il 6° di valori) G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

7 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Formalmente: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

8 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Procedura: 6, 6.7, 3.8, 7, 5.8 I valori ordinati sono: 3.8, 5.8, 6, 6.7, 7 mediana G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

9 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Esempio (2) 6, 6.7, 3.8, 7, 5.8, 9.975 I valori ordinati sono: 3.8, 5.8, 6, 6.7, 7, 9.975 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

10 Cosa fare se i dati sono già raggruppati in classi:
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

11 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Esempio La classe che contiene la mediana è la numero 3, (58 ┤ 70), Quindi la mediana è: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

12 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Importante La mediana non gode delle proprietà matematiche della media! G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

13 III esempio di indice di posizione: la MODA
Si definisce Moda il valore della variabile casuale della classe che si presenta con maggiore frequenza (rispetto alle classi adiacenti se esiste un ordinamento, variabili discrete o continue): G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

14 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
La moda di una distribuzione di dati potrebbe non corrispondere ad un solo valore: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

15 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Moda dai dati grezzi Per i dati sperimentali non si può calcolare un indice a prescindere dalla scelta di “individui” e “variabile casuale”:  Tasso di fecondità totale per donne in età per regione di residenza - Anni Table 10.1 continue - Total fertility rate per women aged by region of residence - Years REGIONI E RIPARTIZIONI (a) Piemonte Valle d'Aosta Lombardia Trentino-Alto Adige Veneto Friuli-Venezia Giulia Liguria Emilia-Romagna Toscana Umbria Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Sardegna Nord Centro Sud ITALIA   (a) Dati provvisori. (a) Provisional data. Fonte: ISTAT - Servizio "Popolazione e cultura". Source: ISTAT - Unit "Popolazione e cultura". G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

16 D: A quali dati si possono applicare i vari indici?
Media: solo alle variabili casuali intere o reali Mediana: solo alle variabili casuali intere o reali Moda: a qualsiasi distribuzione di dati (anche a quelli nominali) G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

17 Esempi di applicazione delle misure di posizione
I guasti in un sistema produttivo risultano causati da: Errore umano 12 Problemi dell’impianto 22 Malfunzionamenti software 7 Difetti dei materiali 5 Cause sconosciute 6 D.: Cosa scegliereste e perché? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

18 II esempio di applicazione delle misure di posizione
I guasti in un sistema produttivo hanno provocato delle interruzioni di: 0-1h 1-3h 3h-1d 1-7d D.: Cosa scegliereste e perché? e come procedereste con i calcoli? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

19 III esempio di applicazione delle misure di posizione
I tempi di attesa di un prodotto da parte dei clienti risultano essere stati: 0-2d 2-4d 4-6d 28d D.: Cosa scegliereste e perché? e come procedereste con i calcoli? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

20 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Attenzione: Sono riportate spesso delle relazioni empiriche fra moda, mediana e media. Non prendetele troppo sul serio! G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

21 Altra caratterizzazione delle distribuzioni: i percentili
Percentile: il p-mo percentile è il minimo dato di una lista tale che almeno p% dei valori della lista siano minori o uguali ad esso. Pertanto per ottenere i percentili da un insieme di dati è necessario ordinarli in una lista. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

22 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Nomenclatura: 25mo percentile  I Quartile, o Lower Quartile 50mo percentile  Mediana 75mo percentile  III Quartile, o Upper Quartile G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

23 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Esercizio: Determinare: Classi di altezza Numero atleti 14 18 28 33 17 15 Totale 125 Media aritmetica Mediana Moda 10°, 50°, 90° percentile 1°, 2°, 3° Quartile G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali


Scaricare ppt "Misure di posizione Giovanni Filatrella"

Presentazioni simili


Annunci Google