La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Elementi di Statistica

Presentazioni simili


Presentazione sul tema: "Elementi di Statistica"— Transcript della presentazione:

1 Elementi di Statistica
LE MEDIE Elementi di Statistica 4 - Le medie a.a

2 Introduzione Si è visto che per effettuare lo studio di un fenomeno statistico è spesso opportuno raggruppare in classi le diverse unità statistiche in modo da ottenere delle distribuzioni da analizzare, da rappresentare graficamente, confrontare. Tale operazione è spesso laboriosa e il risultato non è sempre molto sintetico. 4 - Le medie a.a

3 Introduzione Una domanda del tutto legittima è allora la seguente: come evidenziare, partendo dai dati o dalla loro riorganizzazione in distribuzione di frequenza, rapidamente e sinteticamente, le caratteristiche fondamentali di una variabile statistica? 4 - Le medie a.a

4 Introduzione Per rispondere a questa domanda bisogna prima chiedersi quali sono le caratteristiche fondamentali che descrivono sinteticamente un qualsivoglia fenomeno statistico. In questa sede ne individueremo sopratutto due: la centralità e la dispersione. Le misure di centralità (o di tendenza centrale) esprimono sinteticamente il centro della distribuzione, vale a dire il valore intorno al quale sono disposti i dati. Le misure di dispersione (o di variabilità) forniscono informazioni per capire se i dati sono più o meno dispersi attorno al centro 4 - Le medie a.a

5 Le misure di tendenza centrale informano sul centro della distribuzione
4 - Le medie a.a

6 Le misure di variabilità sulla dispersione
4 - Le medie a.a

7 INDICI STATISTICI UNIDIMENSIONALI
Per gli indici statistici unidimensionali, si ha la seguente classificazione: 1) Medie. 2) Misure di variabilità (chiamate anche indici di variabilità). 3) Indici della forma di distribuzione. 4 - Le medie a.a

8 4 - Le medie a.a

9 LE MEDIE Poiché i fenomeni sono molto disparati e le distribuzioni possono presentare forme molto diverse, non è possibile definire un’unica misura di tendenza centrale. Infatti, sovente la definizione di centro ideale della distribuzione è strettamente connessa al tipo di fenomeno studiato. 4 - Le medie a.a

10 CATEGORIE DI MEDIE: Convenzionalmente si suddividono in due grandi categorie: medie analitiche o algebriche; medie di posizione. Le medie analitiche vengono calcolate attraverso operazioni algebriche sui valori della variabile, che dovrà essere perciò necessariamente di tipo quantitativo. Le medie di posizione si possono calcolare, a determinate condizioni, anche per fenomeni qualitativi, poiché il loro calcolo coinvolge direttamente le sole frequenze, e indirettamente, solo particolari elementi della distribuzione. 4 - Le medie a.a

11 LE MEDIE ANALITICHE: la media aritmetica
Una media d’una variabile quantitativa è un numero che si ritiene idoneo ad esprimere il cosiddetto “ordine di grandezza” o “tendenza centrale” dell’insieme dei dati rilevati. 4 - Le medie a.a

12 CARATTERISTICHE DELLA MEDIA
E’ sempre compresa tra il più piccolo ed il più grande dei valori osservati ed il suo scopo è quello di sintetizzare le informazioni, sostituendo alla pluralità dei valori originari (pari ad n) un unico numero. 4 - Le medie a.a

13 DEFINIZIONE: MEDIA ARITMETICA
Si dice media aritmetica di n valori xi (i = 1, …, n) d’una variabile quantitativa X, e si indica con M, la somma di tali valori divisa per n: 4 - Le medie a.a

14 1a PROPRIETA’ DELLA MEDIA ARITMETICA
La media aritmetica è il numero che sostituito ai singoli valori xi osservati (diversi tra loro) ne lascia invariata la somma: 4 - Le medie a.a

15 2a PROPRIETA’ DELLA MEDIA ARITMETICA
La media aritmetica rende nulla la somma algebrica delle differenze (anche chiamate “scostamenti” o “scarti”) tra i singoli xi e la media stessa: 4 - Le medie a.a

16 OSSERVAZIONE La media aritmetica attua quindi una perfetta compensazione tra i valori minori e quelli maggiori di essa. 4 - Le medie a.a

17 Proprietà della media aritmetica: Trasformazione lineare: Y = a + bX
4 - Le medie a.a

18 La media aritmetica: difetti
La media aritmetica è un valore caratteristico intorno al quale si posizionano i valori della distribuzione. Tuttavia il maggior difetto della media aritmetica è che risente fortemente dei valori estremi, cosicché può accadere che il suo valore non sia ben rappresentativo dell’insieme dei valori osservati. 4 - Le medie a.a

19 La trimmed mean Un modo che consente di diminuire l’effetto dei valori estremi nel calcolo della media è quello è quello di effettuare il calcolo solo sui valori centrali. La media così ottenuta viene detta trimmed mean 4 - Le medie a.a

20 Le medie di posizione: LA MEDIANA
Si dice mediana di n numeri, e si indica con Me, il valore che occupa la posizione centrale nella successione dei numeri ordinati in senso non decrescente e precisamente: se n è dispari, il termine che occupa la posizione (n +1)/2; se n è pari, per convenzione, la semisomma dei termini che occupano le posizioni n/2 e (n/2 + 1) 4 - Le medie a.a

21 Esempio:calcolo della media aritmetica
4 - Le medie a.a

22 Esempio:calcolo della media trimmed
Consideriamo il GDP dei 19 paesi fortemente indebitati da noi considerati in precedenza. Se calcoliamo la media solo sul’80% dei valori centrali (escludiamo il 20%) si ottiene un GDP medio pari a 21, milioni di US$ contro il 46,164,4 milioni di US$ ottenuto considerando tutti i valori. 4 - Le medie a.a

23 ESEMPIO 1 (n dispari) Consideriamo il GDP dei 19 paesi fortemente indebitati da noi considerati in precedenza ordiniamo i valori : 967, , , , , , , , , , , , , , , , , , ,1 Essendo n=19 dispari, il termine centrale è il decimo, al quale corrisponde il valore 9.741,4 milioni di US$ (che è il GDP dell’Angola) e risulta molto minore del valore della media aritmetica (46.164,4 di milioni di US$). 4 - Le medie a.a

24 Dati Esempio 1 4 - Le medie a.a

25 Me = (8.829,1 + 9.471,4)/2 = 9150,3 milioni di US$.
ESEMPIO 2 Consideriamo il GDP dei primi 10 paesi fortemente indebitati da noi considerati in precedenza ordiniamo i valori : 967, , , , , , , , , ,1 Essendo n=10 pari, i due termini centrali sono il quinto ed il sesto, ai quali corrispondono rispettivamente i valori 8.829,1 e 9471,4, per cui la mediana risulta: Me = (8.829, ,4)/2 = 9150,3 milioni di US$. 4 - Le medie a.a

26 OSSERVAZIONE Si parla d’ordinamento non decrescente dei termini – anziché di ordinamento crescente – poiché vi possono essere valori uguali della variabile. 4 - Le medie a.a

27 1a PROPRIETA’ DELLA MEDIANA
E’ applicabile anche a variabili espresse su scala ordinale, poiché la sua definizione richiede semplicemente che i termini siano ordinabili. 4 - Le medie a.a

28 Esempio 4 - Le medie a.a. 200910 Paese gruppo di appartenenza
Burkina Fasu Low Income Sierra Leone Bolivia Lower Middle Income Jordan Chile Upper Middle Income CostaRIca Germany High Income Slovenia Spain 4 - Le medie a.a

29 ESEMPIO Consideriamo l’ Income Group di appartenenza di 9 Paesi (secondo il 2003 GNI per capita, determinato utilizzando il World Bank Atlas method. La mediana, che corrisponde al quinto termine della successione ordinata, è “Upper Middle Income”. 4 - Le medie a.a

30 2a PROPRIETA’ DELLA MEDIANA
La mediana rimane invariata se si sostituiscono i termini minori (maggiori) di essa con altri diversi, ma comunque minori (maggiori) di Me. A differenza della media aritmetica, la mediana non risulta quindi influenzata dall’eventuale presenza di valori anomali (valori eccessivamente grandi o particolarmente piccoli rispetto all’insieme degli altri termini). 4 - Le medie a.a

31 I PERCENTILI Come generalizzazione della mediana si possono considerare i valori che suddividono l’insieme dei termini (o delle modalità ordinali) in due parti, con quote percentuali prefissate. 4 - Le medie a.a

32 DEFINIZIONE: PERCENTILE
Si dice percentile di ordine z e si indica con xz (0 < z < 100%) il numero che suddivide la successione dei valori ordinati in senso non decrescente in due parti, tali che i valori minori o uguali a xz siano una percentuale uguale a z. 4 - Le medie a.a

33 PERCENTILI DI PARTICOLARE INTERESSE
La mediana è il percentile di ordine z = 50%. I quartili dividono la distribuzione in quattro parti uguali: x25%, x50%, x75%. I decili, definiti come x10%, x20%, x30%, x40%, x50%, x60%, x70%, x80%, x90%. 4 - Le medie a.a

34 Percentili (Quantili)
Quartili I quartili dividono la distribuzione in quattro parti uguali 25% (minimo) (massimo) (mediana) 4 - Le medie a.a

35 Percentili (Quantili)
Decili 10% I decili dividono la distribuzione in dieci parti uguali 4 - Le medie a.a

36 Esempio: calcolo dei quartili
4 - Le medie a.a

37 INTERPRETAZIONE Il nono decile, x90%, ad esempio, è il valore che suddivide la distribuzione in due parti tali che le unità statistiche con valori della variabile minori o uguali ad x90% siano il 90% del totale e le unità con valori maggiori siano il restante 10%. 4 - Le medie a.a

38 ESEMPIO: Decili dei redditi delle famiglie italiane
4 - Le medie a.a

39 INTERPRETAZIONE Il 10% delle famiglie più povere ha un reddito annuo sino a euro. Il valore che discrimina il 20% delle famiglie più povere dalle restanti è uguale a euro; …; l’ultimo 10% delle famiglie più ricche (nono decile, x90%) ha un reddito annuo maggiore di euro. 4 - Le medie a.a

40 INTERPRETAZIONE DELLA MEDIANA
La mediana, che coincide con il quinto decile, x50%, è uguale a euro ed è il valore del reddito annuo che divide il primo 50% delle famiglie più povere dal restante 50% delle famiglie più ricche. 4 - Le medie a.a

41 CONFRONTO CON LA MEDIA ARITMETICA
Il valore medio del reddito annuo delle famiglie italiane, è uguale euro. La media aritmetica dei redditi è alquanto superiore alla mediana poiché alla determinazione del valore della media aritmetica concorrono anche i redditi più elevati, che invece non influenzano il calcolo della mediana. 4 - Le medie a.a

42 LA MODA: DEFINIZIONE Si dice moda d’una variabile discreta, quantitativa o qualitativa, e si indica con Mo, il numero o la modalità che presenta la massima frequenza. 4 - Le medie a.a

43 ESERCITAZIONE 2 Riprendiamo l’esempio analizzato nella ESERCITAZIONE 1 relativo ai tre modi per produrre. 4 - Le medie a.a

44 ESERCITAZIONE 2 Le distribuzioni dei pezzi prodotti differiscono, come visto, sopratutto per la diversa “posizione”. Una domanda che sembra naturale è di quanto?.. Ad esempio, “Nuova 2” sembra con i dati a disposizione migliore di “Vecchia”. Ma quanto migliore? Una possibile maniera per rispondere a questo tipo di domande si concretizza nel: 1. Sintetizzare le singole distribuzioni in un unico numero che, in una qualche senso, indichi dove la distribuzione stessa è “posizionata”. Ovvero, calcolare per ogni distribuzione una misura (o parametro o indice) di posizione; 2. Rispondere confrontando gli indici calcolati al punto precedente. I parametri di posizione che vengono di solito utilizzati sono: la media aritmetica, la mediana e i quantili. 4 - Le medie a.a

45 Media e mediana: il caso delle tre riorganizzazioni del lavoro
Vecchia Nuova 1 Nuova 2 media , , ,2 mediana ,5 Come si vede risulta confermato i risultati precedenti. Indicano che nuova 2 potrebbe far aumentare la produzione di circa un 2%. 4 - Le medie a.a

46 50% Me= 718,5 M =719,2 4 - Le medie a.a

47 ESEMPIO Consideriamo l’incom group di 10 paesi fortemente indebitati ed ordiniamo i valori dal più piccolo al più grande: Low, Low, Lower – middle, Low, Low, Low, Lower – middle, Low, Low, Lower - middle La moda è uguale a Low (frequenza pari a 7 contro le altre frequenze pari ad 3). 4 - Le medie a.a

48 PROPRIETA’ DELLA MODA La moda è l’unica media calcolabile per una carattere qualitativo nominale Essa rende minimo il numero di valori (o delle modalità) diversi da essa. 4 - Le medie a.a

49 SCELTA DELLA MEDIA Dipende dagli scopi di sintesi. In molti casi l’impiego congiunto di tutte le medie è utile per fornire un’informazione più completa sul fenomeno Se il fenomeno è qualitativo ordinale, si possono calcolare la mediana e la moda. Se il fenomeno è qualitativo nominale l’unico criterio di sintesi possibile è la moda. Se vi sono outliers è preferibile la mediana alla moda. 4 - Le medie a.a

50 INDICI PONDERATI IN GENERALE
Se le unità statistiche hanno una diversa dimensione o un’importanza differente, si attribuisce a ciascuna di esse un opportuno “peso”. Per il calcolo della media e di indici di variabilità si utilizzano delle formule ponderate. 4 - Le medie a.a

51 FORMULE PONDERATE dove W è la variabile peso e wi è il valore del peso per la unità i-esima. 4 - Le medie a.a

52 FORMULE PONDERATE Caso particolare:
wi = 1/n → media aritmetica semplice Confronto con media ponderata in distribuzione di frequenze 4 - Le medie a.a

53 FORMULE PONDERATE MEDIA ARITMETICA PONDERATA (distribuzione di frequenze) SIMBOLOGIA dove: il numeratore individua l’ammontare complessivo del fenomeno. Il denominatore la somma delle frequenze 4 - Le medie a.a

54 OSSERVAZIONE Solitamente la ponderazione si applica nel calcolo di indici statistici in presenza di matrici dei dati derivati, in cui le variabili sono dei rapporti statistici. 4 - Le medie a.a

55 ESEMPIO: INDICATORI STRUTTURALI
Per il rapporto: Il peso è la popolazione in ciascun paese Con questo criterio di ponderazione il GDP/popolazione medio risulta uguale a quello che si ottiene dividendo il totale dei GDP nazionali per il totale delle popolazioni nazionali. 4 - Le medie a.a

56 ESEMPIO 4 - Le medie a.a

57 Scelta della media 4 - Le medie a.a

58 I bilanci delle famiglie italiane nell’anno 2000
4 - Le medie a.a

59 I bilanci delle famiglie italiane nell’anno 2000
4 - Le medie a.a

60 ESAME DI STATISTICA ECONOMICA PROVA SCRITTA DEL 29 giugno 2007
3) Che informazione forniscono i quintili della distribuzione di redditi famigliari? la quantità di reddito ricevuta dai gruppi di 500 famiglie il numero di famiglie che ricevono un quinto di reddito totale la quantità di reddito ricevuta da un quinto delle famiglie 4 - Le medie a.a


Scaricare ppt "Elementi di Statistica"

Presentazioni simili


Annunci Google