La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

L’insieme delle informazioni sul fenomeno oggetto di analisi, ognuna riferita ad una unità statistica, contiene tutte le informazioni disponibili sul collettivo.

Presentazioni simili


Presentazione sul tema: "L’insieme delle informazioni sul fenomeno oggetto di analisi, ognuna riferita ad una unità statistica, contiene tutte le informazioni disponibili sul collettivo."— Transcript della presentazione:

1 L’insieme delle informazioni sul fenomeno oggetto di analisi, ognuna riferita ad una unità statistica, contiene tutte le informazioni disponibili sul collettivo statistico. Tuttavia, poiché il numero n dei soggetti coinvolti nell’analisi è, generalmente, elevato, l’esame diretto delle n misure non consente di cogliere appieno gli aspetti salienti del fenomeno. A tale scopo possono essere costruiti opportuni indici statistici di sintesi atti, appunto, a sintetizzare la variabilità delle osservazioni individuali (la distribuzione statistica) in un singolo valore numerico o in una sola modalità, che delineano alcuni aspetti essenziali della distribuzione in esame. Questi indici consentono un confronto tra le caratteristiche di distribuzioni diverse. Possiamo individuare tre famiglie principali di “indici”:  indici di tendenza centrale indici di variabilità o dispersione indici di forma La sintesi effettuata mediante un solo valore, comporta una perdita di informazioni. 79 I NDICI DI SINTESI DI UNA DISTRIBUZIONE STATISTICA

2 I valori medi sono strumenti di sintesi che descrivono l’ordine di grandezza del nell’insieme delle unità osservate (si parla anche di “tendenza centrale”…) carattere Nella famiglia delle medie si distinguono:  medieanalitichecalcolateconoperazionialgebrichesuisuivaloridelcarattere (caratteri quantitativi)  medie lasche o di posizione (moda, mediana, quantili), determinate inbasealla loro frequenza o alla posizione occupata nella graduatoria delle osservazioni individuali. (mediana e quantili: caratteri espressi almeno in scala ordinale) (moda: tutti i caratteri) 80 I VALORI MEDI

3 ossia risulta dalla ripartizione equa dell’ammontare complessivo delcaratterefraleunità osservate. Pertanto, la media aritmetica di n osservazioni è: Esempio 1 Valore delle entrate proprie di 5entilocali collocatinelcentronord 5 82 Media aritmetica =   ELmigl. di € Totale La media aritmetica di un insieme di n valori x 1,..., x n di un carattere quantitativo X è pari alla somma dei valori divisa per la loro numerosità Media aritmetica (o,semplicemente, media)

4 x1 x2 ... xnx1 x2 ... xn 1 n   x. x Formalizziamo… : ai n n i1n i1 n xii 1n xii 1 Si noti cheè l’ammontare complessivo del carattere 83 Risponde alla domanda:  Qual è la dimensione media dell’ammontare delle entrate negli enti del centro nord? (generale)  Qual è quell’ammontare delle entrate che a) se fosse assegnato a tutti gli enti non altererebbe la dimensione totale del bilancio, OPPURE b) sarebbe assegnato ad ogni ente, nel caso in cui l’ammontare totale delle entrate fosse equidistribuito? (dettaglio)

5  La media aritmetica soddisfa entrambi i criteri cheabbiamointrodotto:  x  x  xminxmin x max infatti 1) ni 1ni 1 nn i i  i 1i 1 2) f  x x  x  nxx  nx x,x, ii 1 Attenzione!!!  Il valore assunto dalla media aritmetica non è un numero puro ma è espresso nell’unità di misura del fenomeno oggetto di studio  La media aritmetica può essere calcolata solo per fenomeni di tipo quantitativo 84

6 La media aritmetica è uno strumento di sintesi adattoin duein duesituazioni fondamentali: Esempio 1 Bilanciodell’UE(anno 1996):capitoli di spesa (40564  3380   2536  5070  4225  2536) x x  7 x  Capitoli di spesamilioni di € Agricoltura Ricerca Azioni strutturali Altre politiche interne Azione esterne Amministrazione Fondo di sviluppo Totale84508 Volendo calcolare una misura della dimensione “media” dei capitoli di spesa è naturale pensare a quel valore che se fosse assegnato a tutti i capitoli di spesa non altererebbe la dimensione totale del bilancio. 1. quando le modalità del carattere possono essere pensate come la redistribuzione di un unico ammontare all’interno del collettivo

7 Esempio 2 Misurazioni di Paul Newcombe (1879) sulla velocità della luce Lamedia aritmetica èquell’indicedi posizione coerenteconl’ipotesi di errori non sistematici (ossia che sommano a 0) n x   x i / n  1774 / 65  27,29 j  1 86 Le misurazioni rappresentano 65 tentativi (con errore) di misurare una stesso fenomeno, il tempo impiegato dalla luce (in millesimi di sec.) a percorrere la distanza di 7400 metri. 2. quando i valori osservati del fenomeno possono essere pensati come approssimazioni di un unico “valore vero”

8 Proprietà della media aritmetica 1. La somma dei valori assunti da un insieme di n unità statistiche aritmetica moltiplicata per n è uguale alla media ni1ni1 x i  nx 2. La media aritmetica è il baricentro della distribuzione, dalla media aritmetica è 0 ossia lasommadegliscarti n   xi  xi  x   0 x   0 i1i1 3. La somma dei quadrati degli scarti dei valori assunti da un statistiche dalla loro media aritmetica è minima insiemeinsiemedi nunità n  c  2  min   x  x se c=xse c=x i i1i1 87

9 4. Se un collettivo di n unità statisticheè suddivisoin e L sottoinsiemi disgiunti di Lh1Lh1 n h  n numerosità n 1, n 2,..., n h,..., n L percuiaventimediaaritmetica x 1, x 2,..., x h,..., x L allora 1 L x   x h n h n h1h1 5. La media aritmetica è un operatore lineare 1 M  aX  b   ax con b numero reale qualsiasi e a diverso da 0  b b 1 M a  bX  cY   a  bx cy1 M a  bX  cY   a  bx cy Si noti che se la media è espressa in una certa unità di misura, la proprietà 5 ottenere la media in un’unità di misura diversa consente di 88

10 Esempio(impiego della propr. 5) Supponiamo di aver rilevato, qualche anno addietro, il prezzo in lire (X) di un certo in corrispondenza di 4 punti vendita: benebene x  1075 Vorremmo ora conoscerela media degli stessi prezzi in euro (Y)anzichéininlire. Sfruttando la proprietà 5: si noti che Y= X / 1936,27 (a= 1/1936,27 eb=b=0)0)   valor medio in Euro = 1075/ 1936,27 = 0,56 89

11 Media aritmetica– Popolazione divisa in gruppi(impiego della propr. 4) italianenel Produzione di Frumento (in Quintalix1000) nelle Regioni (Fonte: ISTAT) RegioneProd. Frumento Piemonte Valle d'Aosta Lombardia Trentino A.A. Veneto Friuli V.G. Liguria Emilia Romagna Toscana Umbria Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Sardegna totale89404

12 20  x i i  x x  Calcolo della media aritmetica n20 Calcoliamo laproduzionemediaper regione difrumento distintamente per Nord,Centro, SudeIsole.   x i 8  x nord i  1 Regioni Nord Prod. Frumento Piemonte Valle d'Aosta Lombardia Trentino A.A. Veneto Friuli V.G. Liguria Emilia Romagna Totale31716

13   x i  6  x centro   x i   x sudIsole Analogamente per il Sud e le Isole 66 i1i1 E’ facile verificare che la media delle medie pesate con le diverse numerosità ponderata) coincide con la media calcolata sul collettivo di tutte le regioni: (media  8   6   6  i  1 Regioni Centro Prod. Frumento Toscana Umbria Marche Lazio Abruzzo Molise Somma 30923

14 La media geometrica di n valori distinti è data dalla radice n-esima del loro prodotto n xii 1n xii 1 x g  x 0,x i  0; n Per osservazioni raggruppate in una distribuzione geometrica è così definita: di frequenzeassolute,lamedia k x jj 1k x jj 1 n jn j x g  x0, x0,x j  0. n Media utilizzata soprattutto per “mediare” valori positivi generati da rapporti 103 Media geometrica

15 Alcune proprietà della media geometrica 1.Il prodotto dei valori assunti da un insieme di n geometrica elevata alla potenza n-esima n unità statistiche è uguale alla media n  xi xi  x 1  x 2 ...  x n   xg  xg  i1i1  è opportuno utilizzare la Mg nel caso in cui si debba effettuare la media di rapporti 2.Il logaritmo della media geometrica è uguale alla media aritmetica dei logaritmi delle osservazioni 1n1n ni1ni1 log  xlog  x  log  x  log  x     gi Questa proprietà è molto importante a fini calcolatori. Dopo averla impiegata, per ottenere il valore della media geometrica è sufficiente effettuare l’antilogaritmo del log x g 104

16 ES. 1 - Applicazione della media geometrica: calcolo del rendimento medio di un investimento. Supponiamo di aver investito 2 (milioni di €) nel ’99 e che l’investimento abbia avuto i99, i00, i01, i02i99, i00, i01, i02 tassi di rendimento variabilinel corso di questi anni. Il suo valore al 31/12/02 (il “montante”) sarà dato da M  (1  i 99 )(1  i 00 )(1  i 01 )(1  i 02 ) Calcolando il tasso di rendimento “medio” è chiaro che penso a quel tasso che, se fosse rimasto costante nei 4 anni mi darebbe lo stesso importo (investimento iniziale+interessi) che ho oggi. Questotassotassomedio siottienecalcolandolamediageometricadeifattoridi capitalizzazione  1  i   0.12, i 00  0.09, i 01  0.05, i 02  0.02 i99i99 Supponiamo che i tassi siano stati: 105

17 Il montante relativo all’intero periodo considerato è M  (1.12)(1.09)(1.05)(1.02)  Calcoliamo il fattore di capitalizzazione medio geometrico: x g   1  0.12  1  0.09  1  0.05  1  0.02   M *M *  (1.069) 4  sostituendolo nella formula del calcolo del montante: Se invece avessi calcolato un tasso medio aritmetico  1.12  1.09  1.05  1.02 M (1  i)M (1  i)  1.07 una volta inserito nella formula del montante non avrei ritrovato il montante del periodo: M *M *  (1.07) 4 

18 Esempio 2 Un certoprodottoacquistato inanni consecutivi è stato vendutoai seguentiprezzi (£): anno(t)prezzo t-1 i t =2600/1300=2 =3200/2600=1,231 =4500/3200=1, (2)(1,231) (1,406)= 4500 Si vuole determinare di quanto è aumentatoinmediail prezzo neitre anni: x M a = ( 2 + 1, ,406 ) / 3 = 1,546??? 1300 (1,546) (1,546) (1,546) = 4803,655no  2  1, 231  1, 406  3 xg xg   1, (1,513) (1,513) (1,513) = 4502,567OK! ….a meno dell’approssimazione… 107

19 Esempio 3 I tassi annui di sviluppo della popolazione italiana dal 1981 al 1984 sono risultati pari a: 3,64% 3,29% 2,66% si vuole determinare il tasso medio annuo periodo di incremento dellapopolazione italiana nel p 1981 : popolazione italiana al 1981 (1+i)3 =(1+i)3 = p 1981 p 1981 (1+0,0364)(1+0,0329)(1+0,0266) (1+i)3 =(1+i)3 = 3 p 1981 ( 1,0990)  x mgx mg =1,0990 =1,0320 =(i+1) ( 1+i ) è la media geometrica dei tre fattori 1,0364, 1,0329 e 1,0266: valorecheriproducela variazionetotaledella la popolazione nell’arcoditempo considerato. mediamente Quindi del 3,2%. neltriennio italianaèaumentata 108

20 Utilizzano alcuni valori specifici della distribuzione, non coinvolgono tutte le modalità di X La moda è la modalità che nell’insieme delle osservazioni si presenta con la frequenza più alta (freq. Assoluta, relativa, percentuale). Esempio Distribuzione delle famiglie secondolaspesasettimanale per pasti fuori casa spesa n j f j Modaovalore modale 0-|10 10-|20 20-|30 30-| Risponde alla domanda: Qual è la classe di spesa che caratterizza il maggior numero di famiglie nel collettivo delle 150? 40-| Tot Moda L E MEDIE LASCHE O DI POSIZIONE

21  Può essere calcolata per qualsiasi tipo di carattere (qualitativo o quantitativo), ma… per caratteri qualitativi sconnessi possiamo calcolare solo la moda.  Può accadere che non identifichi un valore unico (distribuzioni pluri-modali) o che non esista affatto.  Se i dati non sono raggruppati in classi, oppure se le classi hanno la stessa ampiezza, il calcolo della moda è immediato: è semplicemente la modalità più frequente. Se i dati sono raggruppati in classi di ampiezza disuguale è necessario fare laseguente riflessione: se una classe è molto ampia, la sua frequenza potrebbe risultare alta non tanto perché le modalità che la compongono sono “tipiche” del fenomeno in esame ma semplicemente perché contiene molte unità. 110 Si noti, dunque, che, nella individuazione della moda, si considera solo una modalità, quella più frequente

22 La moda dovrà allora essere definita come la classe di modalità con massima densità di frequenza f j f j f j h  j x  x a j j 1j 1 j Esempio Torniamo famiglie: alla distribuzionedella spesasettimanaleperpastifuorifuoricasa,relativaa a ja j hjhj njnj spesa 0 --| | ,040 0, | ,013 tot150 La classe con frequenza più elevata è 10-|40. Tuttavia, sarebbe errato affermare chetale hihi classe è quella modale. Passando dalle frequenze (ass. o rel.) alle densità di freq. troviamo che la classe modale è 0-|10 111

23 La mediana è la modalità che occupa il posto centrale nella successione ordinata delle n osservazioni individuali. Si considerino, ad esempio, cinque enti locali (EL) con riferimento ai quali osserviamoilil valore dell’indice che misura l’incidenza degli Interessi passivisulle entratecorrenti Ordiniamo glienti inbaseal valore dell’indice: Valore mediano 112 Ente locale EL4EL5EL2EL1EL3 Interessi passivi su Entr. correnti 8,29,910,211,212 Ente locale EL1EL2EL3EL4EL5 Interessi pass. su Entr. correnti 11,110,2128,29,9 Mediana

24  La mediana suddivide a metà la distribuzione ordinata delle modalità  la quota di osservazioni in cui il carattere assume valore maggiore (successivo) o uguale alla mediana è almeno pari al 50% del totale delle osservazioni  la quota di osservazioni in cui il carattere assume valore mediana è almeno pari al 50% del totale delle osservazioni minore (precedente) o ugualeallaalla  Presuppone che il carattere sia ordinabile (non è necessario che sia quantitativo)  Con riferimento a caratteri qualitativi ordinabili è possibile calcolare moda mediana (non, ad es., la media aritmetica) e 113 Con riferimento all’esempio precedente, risponde alla domanda: Qual è quel valore x dell’indice rispetto al quale il 50% degli enti presenta un valore più piccolo di x? -- Qual è quel valore che bipartisce in due il collettivo?

25 1. Siordinano le unità rispetto alle modalità del carattere 2. Siverifica se il collettivo è formato da un numero n di unità dispari opari 3. Si Se individua la posizione in graduatoria dell’unità n è dispari la posizione è centrale. n  1 2n2M e2n2M e n2n2  1 1 Sen è pari la posizioni centrali sonodue:e  xn12xn12 4. Sen è dispari la mediana è xn2xn2 xn2xn2 Sen è pari si hanno due mediane:e 11 1 2 1 2  n 1 n 1   x  x M Per caratteri quantitativi si considerala mediana: en2n2  Calcolo della mediana su un protocollo elementare

26 Esempio Al fine di proporre ai consumatori una campagna pubblicitaria altamente informativa sul contenuto nutrizionale di alcuni tipi di frutta, un’azienda ha commissionato una ricerca per individuare consumo: ilcontenutodivitaminaCing.perettodialcunideifruttidipiùlargo Calcoliamoil contenuto mediano di vitamina C rispetto al collettivo difrutti. 115 FruttoVitCFruttoVitC Albicocca Ananas Anguria Arancia Banana Ciliegia Fico Fragola Kiwi Lampone Melone Mirtillo Mora Pesca Prugna

27 Abbiamo ordinato le osservazioni (che sono in numero dispari): la mediana è uguale a 16 e corrisponde alla posizione 8 nell’insieme ordinato dei valori. 116 Il 50% dei tipi di frutta considerati ha un contenuto di vitamina C inferiore a quello della banana (16) ed il 50% ha un contenuto superiore rankfruttoVitC Pesca Prugna Fico Anguria Ciliegia Albicocca Mirtillo Banana Ananas Mora Melone Arancia Fragola Kiwi Lampone

28 Consideriamodatianaloghianche al kiwi: perlalavitaminaA;inquestocasoperònonnon disponiamodel valore relativoin questo caso le osservazioni sono 14 (pari) Abbiamo 2 posizioni centrali (7 e 8) e due valori “mediani” (16 e 19). In questo caso ha senso proporre la loro semisommacomecomevalore“puntuale” della mediana:  16  19 16  19  17.5 Me( X )Me( X ) RankFruttoVitA Mora Fragola Ananas Lampone Mirtillo Fico Prugna Ciliegia Pesca Anguria Banana Arancia Melone Albicocca

29 Calcoliamo le medie aritmetiche per i contenuti di Vitamina A e C e confrontiamoli con le mediane In entrambi i casi i valori sono molto diversi. La mediana è poco sensibile (in statistica si dice “robusta”) alla presenza di pochi valori lontani dal “grosso” della distribuzione (albicocca e lampone) mentre la media aritmetica ne è influenzata. Nei casi in cui poche unità hanno valori molto più grandi della la mediana è un indicatore di posizione più sensato e “equo”. maggioranzadellealtre, 118 x M eM e Vitamina A Vitamina C Una proprietà importante della mediana: la robustezza


Scaricare ppt "L’insieme delle informazioni sul fenomeno oggetto di analisi, ognuna riferita ad una unità statistica, contiene tutte le informazioni disponibili sul collettivo."

Presentazioni simili


Annunci Google