La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Misure di posizione Giovanni Filatrella ( ) Elaborazione.

Presentazioni simili


Presentazione sul tema: "G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Misure di posizione Giovanni Filatrella ( ) Elaborazione."— Transcript della presentazione:

1 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Misure di posizione Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione Statistica dei Dati Sperimentali Elaborazione Statistica dei Dati Sperimentali Facoltà di Scienze MM FF e NN, Università Sannio

2 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 2 Sintesi dei dati Un istogramma o una tabella di dati contengono molte informazioni E utile talvolta riassumere i dati con degli indicatori (indici)

3 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 3 1.0 1.2 1.4 1.6 1.8 2.0 Frequenza rel. 0.4 0.2 0.1 0.3 tasso di fertilità D: Esiste un singolo valore che possa dare qualche indicazione su come si distribuisce la variabile casuale? Indici o misure di posizione

4 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 4 A cosa serve questo valore? Per riassumere i dati occorre avere in mente una domanda A seconda del tipo di analisi che si vuole fare il tipo di riassunto dei dati è diverso. NON vi è una risposta in assoluto corretta

5 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 5 Esempi Il tipo di analisi più comune è la media aritmetica: Proprietà di cui gode:conserva le trasformazioni di scala operate sui dati:

6 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 6 Alternative: Mediana: La mediana divide la distribuzione in due parti uguali. E definita come quel valore (centrale) che, una volta ordinati i dati del campione, lascia alla sua sinistra e alla sua destra la metà del campione, cioè divide a metà la distribuzione dei dati. Per esempio: 2, 5, 6, 8, 13, 15, 19, 22, 38 hanno mediana 13 (il 5° di 9 valori) 3, 4, 8, 9, 13, 16, 17, 20, 21, 22 hanno mediana 14,5 (la media fra il 5° e il 6° di 10 valori)

7 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 7 Formalmente:

8 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 8 Procedura: I valori ordinati sono: 6, 6.7, 3.8, 7, 5.8 3.8, 5.8, 6, 6.7, 7 mediana

9 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 9 Esempio (2) 6, 6.7, 3.8, 7, 5.8, 9.975 3.8, 5.8, 6, 6.7, 7, 9.975 I valori ordinati sono:

10 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 10 Cosa fare se i dati sono già raggruppati in classi:

11 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 11 Esempio La classe che contiene la mediana è la numero 3, (58 70), Quindi la mediana è:

12 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 12 Importante La mediana non gode delle proprietà matematiche della media!

13 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 13 III esempio di indice di posizione: la MODA Si definisce Moda il valore della variabile casuale della classe che si presenta con maggiore frequenza (rispetto alle classi adiacenti se esiste un ordinamento, variabili discrete o continue):

14 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 14 La moda di una distribuzione di dati potrebbe non corrispondere ad un solo valore:

15 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 15 Moda dai dati grezzi Per i dati sperimentali non si può calcolare un indice a prescindere dalla scelta di individui e variabile casuale: Tasso di fecondità totale per 1.000 donne in età 15-49 per regione di residenza - Anni 1982-1997 Table 10.1 continue - Total fertility rate per 1.000 women aged 15-49 by region of residence - Years 1982-1997 REGIONI E RIPARTIZIONI19901991199219931994199519961997 (a) Piemonte11011124108010461026102810471088 Valle d'Aosta1.1831.1601.1161.0131.0821.1021.1961.314 Lombardia1.1471.1241.1251.1001.0681.0741.0991.141 Trentino-Alto Adige1.4021.4101.4201.3451.3391.3351.3851.436 Veneto.1591.1151.1381.0921.0641.0731.1011.150 Friuli-Venezia Giulia1.0291.0241.0439509429419751.02 Liguria1.0111.0071.027960928915938969 Emilia-Romagna1.0131.0079939689569671.0061.035 Toscana1.0821.0521.0481.0199829799951.03 Umbria1.1761.1621.1761.1081.0741.0611.0681.097 Marche1.2301.2071.1871.1311.0871.1071.0851.116 Lazio1.2801.2331.2591.2081.1681.1091.1211.167 Abruzzo1.3941.3531.3491.2961.2451.1751.1911.185 Molise1.4251.4061.4211.3261.2801.2091.1661.211 Campania1.8091.8101.7941.6631.6011.4991.5701.573 Puglia1.6541.6011.5841.4861.4371.3691.3671.386 Basilicata1.6601.5571.5701.4351.3631.3271.2691.284 Calabria1.7441.6681.6531.5641.4321.3961.3511.329 Sicilia1.8531.7751.7921.6701.5481.4551.4681.487 Sardegna1.3701.2911.2231.1641.0891.0551.0301.108 Nord1.1171.1041.1011.0641.0401.0431.0751.115 Centro1.2061.1691.1791.1341.0941.0681.0761.116 Sud1.7121.6641.6541.5471.4661.3911.4031.419 ITALIA1.3581.3281.3261.2621.2151.1871.2051.217 (a) Dati provvisori. (a) Provisional data. Fonte: ISTAT - Servizio "Popolazione e cultura". Source: ISTAT - Unit "Popolazione e cultura".

16 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 16 D: A quali dati si possono applicare i vari indici? Media: solo alle variabili casuali intere o reali Mediana: solo alle variabili casuali intere o reali Moda: a qualsiasi distribuzione di dati (anche a quelli nominali)

17 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 17 Esempi di applicazione delle misure di posizione I guasti in un sistema produttivo risultano causati da: 1.Errore umano12 2.Problemi dellimpianto22 3.Malfunzionamenti software7 4.Difetti dei materiali5 5.Cause sconosciute6 D.: Cosa scegliereste e perché?

18 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 18 II esempio di applicazione delle misure di posizione I guasti in un sistema produttivo hanno provocato delle interruzioni di: 1.0-1h26 2.1-3h10 3.3h-1d2 4.1-7d1 D.: Cosa scegliereste e perché? e come procedereste con i calcoli?

19 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 19 III esempio di applicazione delle misure di posizione I tempi di attesa di un prodotto da parte dei clienti risultano essere stati: 1.0-2d2 2.2-4d11 3.4-6d5 4.28d1 D.: Cosa scegliereste e perché? e come procedereste con i calcoli?

20 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 20 Attenzione: Sono riportate spesso delle relazioni empiriche fra moda, mediana e media. Non prendetele troppo sul serio!

21 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 21 Altra caratterizzazione delle distribuzioni: i percentili Percentile: il p-mo percentile è il minimo dato di una lista tale che almeno p% dei valori della lista siano minori o uguali ad esso. Pertanto per ottenere i percentili da un insieme di dati è necessario ordinarli in una lista.

22 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 22 Nomenclatura: 25mo percentile I Quartile, o Lower Quartile 50mo percentile Mediana 75mo percentile III Quartile, o Upper Quartile

23 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 23 Esercizio: Classi di altezza Numero atleti 171-17514 176-18018 181-18528 186-19033 191-19517 196-20015 Totale125 Determinare: 1.Media aritmetica 2.Mediana 3.Moda 4.10°, 50°, 90° percentile 5.1°, 2°, 3° Quartile


Scaricare ppt "G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Misure di posizione Giovanni Filatrella ( ) Elaborazione."

Presentazioni simili


Annunci Google