La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

4 - Le medie a.a. 2009101 LE MEDIE Elementi di Statistica.

Presentazioni simili


Presentazione sul tema: "4 - Le medie a.a. 2009101 LE MEDIE Elementi di Statistica."— Transcript della presentazione:

1 4 - Le medie a.a LE MEDIE Elementi di Statistica

2 4 - Le medie a.a Introduzione Si è visto che per effettuare lo studio di un fenomeno statistico è spesso opportuno raggruppare in classi le diverse unità statistiche in modo da ottenere delle distribuzioni da analizzare, da rappresentare graficamente, confrontare. Tale operazione è spesso laboriosa e il risultato non è sempre molto sintetico.

3 4 - Le medie a.a Introduzione Una domanda del tutto legittima è allora la seguente: come evidenziare, partendo dai dati o dalla loro riorganizzazione in distribuzione di frequenza, rapidamente e sinteticamente, le caratteristiche fondamentali di una variabile statistica?

4 4 - Le medie a.a Introduzione Per rispondere a questa domanda bisogna prima chiedersi quali sono le caratteristiche fondamentali che descrivono sinteticamente un qualsivoglia fenomeno statistico. In questa sede ne individueremo sopratutto due: la centralità e la dispersione. Le misure di centralità (o di tendenza centrale) esprimono sinteticamente il centro della distribuzione, vale a dire il valore intorno al quale sono disposti i dati. Le misure di dispersione (o di variabilità) forniscono informazioni per capire se i dati sono più o meno dispersi attorno al centro

5 4 - Le medie a.a Le misure di tendenza centrale informano sul centro della distribuzione

6 4 - Le medie a.a Le misure di variabilità sulla dispersione

7 4 - Le medie a.a INDICI STATISTICI UNIDIMENSIONALI Per gli indici statistici unidimensionali, si ha la seguente classificazione: 1) Medie. 2) Misure di variabilità (chiamate anche indici di variabilità). 3) Indici della forma di distribuzione.

8 4 - Le medie a.a

9 9 LE MEDIE Poiché i fenomeni sono molto disparati e le distribuzioni possono presentare forme molto diverse, non è possibile definire ununica misura di tendenza centrale. Infatti, sovente la definizione di centro ideale della distribuzione è strettamente connessa al tipo di fenomeno studiato.

10 4 - Le medie a.a CATEGORIE DI MEDIE: Convenzionalmente si suddividono in due grandi categorie: medie analitiche o algebriche; medie di posizione. Le medie analitiche vengono calcolate attraverso operazioni algebriche sui valori della variabile, che dovrà essere perciò necessariamente di tipo quantitativo. Le medie di posizione si possono calcolare, a determinate condizioni, anche per fenomeni qualitativi, poiché il loro calcolo coinvolge direttamente le sole frequenze, e indirettamente, solo particolari elementi della distribuzione.

11 4 - Le medie a.a LE MEDIE ANALITICHE: la media aritmetica Una media duna variabile quantitativa è un numero che si ritiene idoneo ad esprimere il cosiddetto ordine di grandezza o tendenza centrale dellinsieme dei dati rilevati.

12 4 - Le medie a.a CARATTERISTICHE DELLA MEDIA E sempre compresa tra il più piccolo ed il più grande dei valori osservati ed il suo scopo è quello di sintetizzare le informazioni, sostituendo alla pluralità dei valori originari (pari ad n) un unico numero.

13 4 - Le medie a.a DEFINIZIONE: MEDIA ARITMETICA Si dice media aritmetica di n valori x i (i = 1, …, n) duna variabile quantitativa X, e si indica con M, la somma di tali valori divisa per n:

14 4 - Le medie a.a a PROPRIETA DELLA MEDIA ARITMETICA La media aritmetica è il numero che sostituito ai singoli valori x i osservati (diversi tra loro) ne lascia invariata la somma:

15 4 - Le medie a.a a PROPRIETA DELLA MEDIA ARITMETICA La media aritmetica rende nulla la somma algebrica delle differenze (anche chiamate scostamenti o scarti) tra i singoli x i e la media stessa:

16 4 - Le medie a.a OSSERVAZIONE La media aritmetica attua quindi una perfetta compensazione tra i valori minori e quelli maggiori di essa.

17 4 - Le medie a.a Proprietà della media aritmetica: Trasformazione lineare: Y = a + bX

18 4 - Le medie a.a La media aritmetica: difetti La media aritmetica è un valore caratteristico intorno al quale si posizionano i valori della distribuzione. Tuttavia il maggior difetto della media aritmetica è che risente fortemente dei valori estremi, cosicché può accadere che il suo valore non sia ben rappresentativo dellinsieme dei valori osservati.

19 4 - Le medie a.a La trimmed mean Un modo che consente di diminuire leffetto dei valori estremi nel calcolo della media è quello è quello di effettuare il calcolo solo sui valori centrali. La media così ottenuta viene detta trimmed mean

20 4 - Le medie a.a Le medie di posizione: LA MEDIANA Si dice mediana di n numeri, e si indica con Me, il valore che occupa la posizione centrale nella successione dei numeri ordinati in senso non decrescente e precisamente: se n è dispari, il termine che occupa la posizione (n +1)/2; se n è pari, per convenzione, la semisomma dei termini che occupano le posizioni n/2 e (n/2 + 1)

21 4 - Le medie a.a Esempio:calcolo della media aritmetica

22 4 - Le medie a.a Esempio:calcolo della media trimmed Consideriamo il GDP dei 19 paesi fortemente indebitati da noi considerati in precedenza. Se calcoliamo la media solo sul80% dei valori centrali (escludiamo il 20%) si ottiene un GDP medio pari a 21, milioni di US$ contro il 46,164,4 milioni di US$ ottenuto considerando tutti i valori.

23 4 - Le medie a.a ESEMPIO 1 (n dispari) Consideriamo il GDP dei 19 paesi fortemente indebitati da noi considerati in precedenza ordiniamo i valori : 967, , , , , , , , , , , , , , , , , , ,1 Essendo n=19 dispari, il termine centrale è il decimo, al quale corrisponde il valore 9.741,4 milioni di US$ (che è il GDP dellAngola) e risulta molto minore del valore della media aritmetica (46.164,4 di milioni di US$).

24 4 - Le medie a.a Dati Esempio 1

25 4 - Le medie a.a ESEMPIO 2 Consideriamo il GDP dei primi 10 paesi fortemente indebitati da noi considerati in precedenza ordiniamo i valori : 967, , , , , , , , , ,1 Essendo n=10 pari, i due termini centrali sono il quinto ed il sesto, ai quali corrispondono rispettivamente i valori 8.829,1 e 9471,4, per cui la mediana risulta: Me = (8.829, ,4)/2 = 9150,3 milioni di US$.

26 4 - Le medie a.a OSSERVAZIONE Si parla dordinamento non decrescente dei termini – anziché di ordinamento crescente – poiché vi possono essere valori uguali della variabile.

27 4 - Le medie a.a a PROPRIETA DELLA MEDIANA E applicabile anche a variabili espresse su scala ordinale, poiché la sua definizione richiede semplicemente che i termini siano ordinabili.

28 4 - Le medie a.a Esempio Paesegruppo di appartenenza Burkina FasuLow Income Sierra Leone Low Income BoliviaLower Middle Income JordanLower Middle Income ChileUpper Middle Income CostaRIcaUpper Middle Income GermanyHigh Income SloveniaHigh Income SpainHigh Income

29 4 - Le medie a.a ESEMPIO Consideriamo l Income Group di appartenenza di 9 Paesi (secondo il 2003 GNI per capita, determinato utilizzando il World Bank Atlas method.Atlas method La mediana, che corrisponde al quinto termine della successione ordinata, è Upper Middle Income.

30 4 - Le medie a.a a PROPRIETA DELLA MEDIANA La mediana rimane invariata se si sostituiscono i termini minori (maggiori) di essa con altri diversi, ma comunque minori (maggiori) di Me. A differenza della media aritmetica, la mediana non risulta quindi influenzata dalleventuale presenza di valori anomali (valori eccessivamente grandi o particolarmente piccoli rispetto allinsieme degli altri termini).

31 4 - Le medie a.a I PERCENTILI Come generalizzazione della mediana si possono considerare i valori che suddividono linsieme dei termini (o delle modalità ordinali) in due parti, con quote percentuali prefissate.

32 4 - Le medie a.a DEFINIZIONE: PERCENTILE Si dice percentile di ordine z e si indica con x z (0 < z < 100%) il numero che suddivide la successione dei valori ordinati in senso non decrescente in due parti, tali che i valori minori o uguali a x z siano una percentuale uguale a z.

33 4 - Le medie a.a PERCENTILI DI PARTICOLARE INTERESSE La mediana è il percentile di ordine z = 50%. I quartili dividono la distribuzione in quattro parti uguali: x 25%, x 50%, x 75%. I decili, definiti come x 10%, x 20%, x 30%, x 40%, x 50%, x 60%, x 70%, x 80%, x 90%.

34 4 - Le medie a.a Percentili (Quantili) Quartili I quartili dividono la distribuzione in quattro parti uguali 25% (minimo)(massimo) (mediana)

35 4 - Le medie a.a Percentili (Quantili) 10% I decili dividono la distribuzione in dieci parti uguali Decili

36 4 - Le medie a.a Esempio: calcolo dei quartili

37 4 - Le medie a.a INTERPRETAZIONE Il nono decile, x 90%, ad esempio, è il valore che suddivide la distribuzione in due parti tali che le unità statistiche con valori della variabile minori o uguali ad x 90% siano il 90% del totale e le unità con valori maggiori siano il restante 10%.

38 4 - Le medie a.a ESEMPIO: Decili dei redditi delle famiglie italiane

39 4 - Le medie a.a INTERPRETAZIONE Il 10% delle famiglie più povere ha un reddito annuo sino a euro. Il valore che discrimina il 20% delle famiglie più povere dalle restanti è uguale a euro; …; lultimo 10% delle famiglie più ricche (nono decile, x 90% ) ha un reddito annuo maggiore di euro.

40 4 - Le medie a.a INTERPRETAZIONE DELLA MEDIANA La mediana, che coincide con il quinto decile, x 50%, è uguale a euro ed è il valore del reddito annuo che divide il primo 50% delle famiglie più povere dal restante 50% delle famiglie più ricche.

41 4 - Le medie a.a CONFRONTO CON LA MEDIA ARITMETICA Il valore medio del reddito annuo delle famiglie italiane, è uguale euro. La media aritmetica dei redditi è alquanto superiore alla mediana poiché alla determinazione del valore della media aritmetica concorrono anche i redditi più elevati, che invece non influenzano il calcolo della mediana.

42 4 - Le medie a.a LA MODA: DEFINIZIONE Si dice moda duna variabile discreta, quantitativa o qualitativa, e si indica con Mo, il numero o la modalità che presenta la massima frequenza.

43 4 - Le medie a.a ESERCITAZIONE 2 Riprendiamo lesempio analizzato nella ESERCITAZIONE 1 relativo ai tre modi per produrre.

44 4 - Le medie a.a ESERCITAZIONE 2 Le distribuzioni dei pezzi prodotti differiscono, come visto, sopratutto per la diversa posizione. Una domanda che sembra naturale è di quanto?.. Ad esempio, Nuova 2 sembra con i dati a disposizione migliore di Vecchia. Ma quanto migliore? Una possibile maniera per rispondere a questo tipo di domande si concretizza nel: 1. Sintetizzare le singole distribuzioni in un unico numero che, in una qualche senso, indichi dove la distribuzione stessa è posizionata. Ovvero, calcolare per ogni distribuzione una misura (o parametro o indice) di posizione; 2. Rispondere confrontando gli indici calcolati al punto precedente. I parametri di posizione che vengono di solito utilizzati sono: la media aritmetica, la mediana e i quantili.

45 4 - Le medie a.a Media e mediana: il caso delle tre riorganizzazioni del lavoro Vecchia Nuova 1 Nuova 2 media 705,5 700,8 719,2 mediana ,5 Come si vede risulta confermato i risultati precedenti. Indicano che nuova 2 potrebbe far aumentare la produzione di circa un 2%.

46 4 - Le medie a.a M =719,2 Me= 718,5 50%

47 4 - Le medie a.a ESEMPIO Consideriamo lincom group di 10 paesi fortemente indebitati ed ordiniamo i valori dal più piccolo al più grande: Low, Low, Lower – middle, Low, Low, Low, Lower – middle, Low, Low,Lower - middle La moda è uguale a Low (frequenza pari a 7 contro le altre frequenze pari ad 3).

48 4 - Le medie a.a PROPRIETA DELLA MODA La moda è lunica media calcolabile per una carattere qualitativo nominale Essa rende minimo il numero di valori (o delle modalità) diversi da essa.

49 4 - Le medie a.a SCELTA DELLA MEDIA Dipende dagli scopi di sintesi. In molti casi limpiego congiunto di tutte le medie è utile per fornire uninformazione più completa sul fenomeno Se il fenomeno è qualitativo ordinale, si possono calcolare la mediana e la moda. Se il fenomeno è qualitativo nominale lunico criterio di sintesi possibile è la moda. Se vi sono outliers è preferibile la mediana alla moda.

50 4 - Le medie a.a INDICI PONDERATI IN GENERALE Se le unità statistiche hanno una diversa dimensione o unimportanza differente, si attribuisce a ciascuna di esse un opportuno peso. Per il calcolo della media e di indici di variabilità si utilizzano delle formule ponderate.

51 4 - Le medie a.a FORMULE PONDERATE dove W è la variabile peso e w i è il valore del peso per la unità i-esima.

52 4 - Le medie a.a FORMULE PONDERATE Caso particolare: w i = 1/n media aritmetica semplice Confronto con media ponderata in distribuzione di frequenze

53 4 - Le medie a.a FORMULE PONDERATE MEDIA ARITMETICA PONDERATA ( distribuzione di frequenze) SIMBOLOGIA dove : il numeratore individua lammontare complessivo del fenomeno. Il denominatore la somma delle frequenze

54 4 - Le medie a.a OSSERVAZIONE Solitamente la ponderazione si applica nel calcolo di indici statistici in presenza di matrici dei dati derivati, in cui le variabili sono dei rapporti statistici.

55 4 - Le medie a.a ESEMPIO: INDICATORI STRUTTURALI Per il rapporto: Il peso è la popolazione in ciascun paese Con questo criterio di ponderazione il GDP/popolazione medio risulta uguale a quello che si ottiene dividendo il totale dei GDP nazionali per il totale delle popolazioni nazionali.

56 4 - Le medie a.a ESEMPIO

57 4 - Le medie a.a Scelta della media

58 4 - Le medie a.a I bilanci delle famiglie italiane nellanno 2000

59 4 - Le medie a.a I bilanci delle famiglie italiane nellanno 2000

60 4 - Le medie a.a ESAME DI STATISTICA ECONOMICA PROVA SCRITTA DEL 29 giugno ) Che informazione forniscono i quintili della distribuzione di redditi famigliari? la quantità di reddito ricevuta dai gruppi di 500 famiglie il numero di famiglie che ricevono un quinto di reddito totale la quantità di reddito ricevuta da un quinto delle famiglie


Scaricare ppt "4 - Le medie a.a. 2009101 LE MEDIE Elementi di Statistica."

Presentazioni simili


Annunci Google