Elementi di Statistica

Slides:



Advertisements
Presentazioni simili
Training On Line - CONP. 2 Richiesta Da Menu: Conferimenti ad inizio anno termico > Agosto > Pluriennali > Nuova Richiesta Si accede alla pagina di Richiesta.
Advertisements

LA MEDIA STATISTICA di Zappa Giacomo.
- le Medie la Moda la Mediana
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Caduta non guidata di un corpo rettangolare in un serbatoio Velocità e rotazione.
SCALA INTERVALLO / A RAPPORTO
1 MeDeC - Centro Demoscopico Metropolitano Provincia di Bologna - per Valutazione su alcuni servizi erogati nel.
Mat_Insieme Lavoro di Gruppo Prodotti Notevoli
TAV.1 Foto n.1 Foto n.2 SCALINATA DI ACCESSO ALL’EREMO DI SANTA CATERINA DEL SASSO DALLA CORTE DELLE CASCINE DEL QUIQUIO Foto n.3 Foto n.4.
____________________
1 Pregnana Milanese Assessorato alle Risorse Economiche Bilancio Preventivo P R O P O S T A.
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
COORDINATE POLARI Sia P ha coordinate cartesiane
Frontespizio Economia Monetaria Anno Accademico
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
“Teoria e metodi della ricerca sociale e organizzativa”
Le misure di tendenza centrale informano sul centro della distribuzione 4 - Le medie a.a Le medie a.a
Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita.
Lez. 3 - Gli Indici di VARIABILITA’
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia l’analisi statistica.
Ordini Parziali - Reticoli
EIE 0607 III / 1 A B P a = 30 P b = 35 t = 2, tc = 1 Questo può essere un equilibrio? No! Politiche di un paese importatore: una tariffa allimportazione.
Obiettivi del corso di Statistica Medica.
Il comportamento del consumatore
COSA VUOL DIRE FARE STATISTICA
Misure di posizione Gli indici di posizione servono per individuare la tendenza centrale del fenomeno studiato. I più utilizzati sono: Moda Mediana Quartili,
8. Reti di Code Nella maggior parte dei processi produttivi risulta troppo restrittivo considerare una sola risorsa. Esempio: linea tandem arrivi 1 v.
Canale A. Prof.Ciapetti AA2003/04
Ufficio Studi UNIONCAMERE TOSCANA 1 Presentazione di Riccardo Perugi Ufficio Studi UNIONCAMERE TOSCANA Firenze, 19 dicembre 2000.
Realizzazione e caratterizzazione di una semplice rete neurale per la separazione di due campioni di eventi Vincenzo Izzo.
Master universitario di II livello in Ingegneria delle Infrastrutture e dei Sistemi Ferroviari Anno Accademico 2012/2013 Cultura dimpresa, valutazione.
La partita è molto combattuta perché le due squadre tentano di vincere fino all'ultimo minuto. Era l'ultima giornata del campionato e il risultato era.
Cos’è un problema?.
Misurazione Le osservazioni si esprimono in forma di misurazioni
Lezione 4 Probabilità.
Nicola Paparella, Università degli Studi, Lecce, aprile 2006 Pedagogia sperimentale Note ed appunti Corso di base / 5
Luciano giromini – la misura in psicologia, 2009 database e distribuzioni - misure di sintesi - misure di variabilità descrizione dei dati:
Velocità ed accelerazione
METODI E CONTROLLI STATISTICI DI PROCESSO
Esercitazione 1: Rispetto al test di ansia (Media=25; σ=5), calcolare:
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE.
Statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Di Capuano,Colucci e Panunzi Valori medi I valori medi.
LA SINTESI STATISTICA Una serie di dati numerici è
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
1)Completa la seguente successione: C4, B7, E10, D13, G16,. A. G19 B
LE SAI LE TABELLINE? Mettiti alla prova!.
1 Questionario di soddisfazione del servizio scolastico Anno scolastico 2011/2012 Istogramma- risposte famiglie.
Un trucchetto di Moltiplicazione per il calcolo mentale
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Esempi risolti mediante immagini (e con excel)
INDICE I VALORI MEDI LA MEDIA GEOMETRICA LA MEDIA ARITMETICA
I chicchi di riso e la sfida al Bramino
Lez. 3 - Gli Indici di VARIABILITA’
Il numero più grande Accademia dei Lincei
TRASFORMATA DI FOURIER
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Gli indici di dispersione
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
COSA VUOL DIRE FARE STATISTICA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
A.A STATISTICA E CALCOLO DELLE PROBABILITA’ Docenti: Stefania Mignani Maurizio Brizzi.
STATISTICHE DESCRITTIVE
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
Statistica sociale Modulo A A.A Prof.ssa Barbara Baldazzi Dottore Mario Mastrangelo Facoltà di Lettere e Filosofia Università di Tor Vergata.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Transcript della presentazione:

Elementi di Statistica LE MEDIE Elementi di Statistica 4 - Le medie a.a. 200910

Introduzione Si è visto che per effettuare lo studio di un fenomeno statistico è spesso opportuno raggruppare in classi le diverse unità statistiche in modo da ottenere delle distribuzioni da analizzare, da rappresentare graficamente, confrontare. Tale operazione è spesso laboriosa e il risultato non è sempre molto sintetico. 4 - Le medie a.a. 200910

Introduzione Una domanda del tutto legittima è allora la seguente: come evidenziare, partendo dai dati o dalla loro riorganizzazione in distribuzione di frequenza, rapidamente e sinteticamente, le caratteristiche fondamentali di una variabile statistica? 4 - Le medie a.a. 200910

Introduzione Per rispondere a questa domanda bisogna prima chiedersi quali sono le caratteristiche fondamentali che descrivono sinteticamente un qualsivoglia fenomeno statistico. In questa sede ne individueremo sopratutto due: la centralità e la dispersione. Le misure di centralità (o di tendenza centrale) esprimono sinteticamente il centro della distribuzione, vale a dire il valore intorno al quale sono disposti i dati. Le misure di dispersione (o di variabilità) forniscono informazioni per capire se i dati sono più o meno dispersi attorno al centro 4 - Le medie a.a. 200910

Le misure di tendenza centrale informano sul centro della distribuzione 4 - Le medie a.a. 200910

Le misure di variabilità sulla dispersione 4 - Le medie a.a. 200910

INDICI STATISTICI UNIDIMENSIONALI Per gli indici statistici unidimensionali, si ha la seguente classificazione: 1) Medie. 2) Misure di variabilità (chiamate anche indici di variabilità). 3) Indici della forma di distribuzione. 4 - Le medie a.a. 200910

4 - Le medie a.a. 200910

LE MEDIE Poiché i fenomeni sono molto disparati e le distribuzioni possono presentare forme molto diverse, non è possibile definire un’unica misura di tendenza centrale. Infatti, sovente la definizione di centro ideale della distribuzione è strettamente connessa al tipo di fenomeno studiato. 4 - Le medie a.a. 200910

CATEGORIE DI MEDIE: Convenzionalmente si suddividono in due grandi categorie: medie analitiche o algebriche; medie di posizione. Le medie analitiche vengono calcolate attraverso operazioni algebriche sui valori della variabile, che dovrà essere perciò necessariamente di tipo quantitativo. Le medie di posizione si possono calcolare, a determinate condizioni, anche per fenomeni qualitativi, poiché il loro calcolo coinvolge direttamente le sole frequenze, e indirettamente, solo particolari elementi della distribuzione. 4 - Le medie a.a. 200910

LE MEDIE ANALITICHE: la media aritmetica Una media d’una variabile quantitativa è un numero che si ritiene idoneo ad esprimere il cosiddetto “ordine di grandezza” o “tendenza centrale” dell’insieme dei dati rilevati. 4 - Le medie a.a. 200910

CARATTERISTICHE DELLA MEDIA E’ sempre compresa tra il più piccolo ed il più grande dei valori osservati ed il suo scopo è quello di sintetizzare le informazioni, sostituendo alla pluralità dei valori originari (pari ad n) un unico numero. 4 - Le medie a.a. 200910

DEFINIZIONE: MEDIA ARITMETICA Si dice media aritmetica di n valori xi (i = 1, …, n) d’una variabile quantitativa X, e si indica con M, la somma di tali valori divisa per n: 4 - Le medie a.a. 200910

1a PROPRIETA’ DELLA MEDIA ARITMETICA La media aritmetica è il numero che sostituito ai singoli valori xi osservati (diversi tra loro) ne lascia invariata la somma: 4 - Le medie a.a. 200910

2a PROPRIETA’ DELLA MEDIA ARITMETICA La media aritmetica rende nulla la somma algebrica delle differenze (anche chiamate “scostamenti” o “scarti”) tra i singoli xi e la media stessa: 4 - Le medie a.a. 200910

OSSERVAZIONE La media aritmetica attua quindi una perfetta compensazione tra i valori minori e quelli maggiori di essa. 4 - Le medie a.a. 200910

Proprietà della media aritmetica: Trasformazione lineare: Y = a + bX 4 - Le medie a.a. 200910

La media aritmetica: difetti La media aritmetica è un valore caratteristico intorno al quale si posizionano i valori della distribuzione. Tuttavia il maggior difetto della media aritmetica è che risente fortemente dei valori estremi, cosicché può accadere che il suo valore non sia ben rappresentativo dell’insieme dei valori osservati. 4 - Le medie a.a. 200910

La trimmed mean Un modo che consente di diminuire l’effetto dei valori estremi nel calcolo della media è quello è quello di effettuare il calcolo solo sui valori centrali. La media così ottenuta viene detta trimmed mean 4 - Le medie a.a. 200910

Le medie di posizione: LA MEDIANA Si dice mediana di n numeri, e si indica con Me, il valore che occupa la posizione centrale nella successione dei numeri ordinati in senso non decrescente e precisamente: se n è dispari, il termine che occupa la posizione (n +1)/2; se n è pari, per convenzione, la semisomma dei termini che occupano le posizioni n/2 e (n/2 + 1) 4 - Le medie a.a. 200910

Esempio:calcolo della media aritmetica 4 - Le medie a.a. 200910

Esempio:calcolo della media trimmed Consideriamo il GDP dei 19 paesi fortemente indebitati da noi considerati in precedenza. Se calcoliamo la media solo sul’80% dei valori centrali (escludiamo il 20%) si ottiene un GDP medio pari a 21,597.80 milioni di US$ contro il 46,164,4 milioni di US$ ottenuto considerando tutti i valori. 4 - Le medie a.a. 200910

ESEMPIO 1 (n dispari) Consideriamo il GDP dei 19 paesi fortemente indebitati da noi considerati in precedenza ordiniamo i valori : 967,5 1.055,5 1.479,4 1.525,1 2.371,8 2.486,1 4.604,0 6.239,5 8.829,1 9.471,4 10.735,4 16.709,1 18.560,7 19.495,0 21.024,0 42.674,0 58.648,1 141.254,5 508.994,1 Essendo n=19 dispari, il termine centrale è il decimo, al quale corrisponde il valore 9.741,4 milioni di US$ (che è il GDP dell’Angola) e risulta molto minore del valore della media aritmetica (46.164,4 di milioni di US$). 4 - Le medie a.a. 200910

Dati Esempio 1 4 - Le medie a.a. 200910

Me = (8.829,1 + 9.471,4)/2 = 9150,3 milioni di US$. ESEMPIO 2 Consideriamo il GDP dei primi 10 paesi fortemente indebitati da noi considerati in precedenza ordiniamo i valori : 967,5 2.371,8 2.486,1 6.239,5 8.829,1 9.471,4 10.735, 4 21.024,0 141.254,5 508.994,1 Essendo n=10 pari, i due termini centrali sono il quinto ed il sesto, ai quali corrispondono rispettivamente i valori 8.829,1 e 9471,4, per cui la mediana risulta: Me = (8.829,1 + 9.471,4)/2 = 9150,3 milioni di US$. 4 - Le medie a.a. 200910

OSSERVAZIONE Si parla d’ordinamento non decrescente dei termini – anziché di ordinamento crescente – poiché vi possono essere valori uguali della variabile. 4 - Le medie a.a. 200910

1a PROPRIETA’ DELLA MEDIANA E’ applicabile anche a variabili espresse su scala ordinale, poiché la sua definizione richiede semplicemente che i termini siano ordinabili. 4 - Le medie a.a. 200910

Esempio 4 - Le medie a.a. 200910 Paese gruppo di appartenenza Burkina Fasu Low Income Sierra Leone Bolivia Lower Middle Income Jordan Chile Upper Middle Income CostaRIca Germany High Income Slovenia Spain 4 - Le medie a.a. 200910

ESEMPIO Consideriamo l’ Income Group di appartenenza di 9 Paesi (secondo il 2003 GNI per capita, determinato utilizzando il World Bank Atlas method. La mediana, che corrisponde al quinto termine della successione ordinata, è “Upper Middle Income”. 4 - Le medie a.a. 200910

2a PROPRIETA’ DELLA MEDIANA La mediana rimane invariata se si sostituiscono i termini minori (maggiori) di essa con altri diversi, ma comunque minori (maggiori) di Me. A differenza della media aritmetica, la mediana non risulta quindi influenzata dall’eventuale presenza di valori anomali (valori eccessivamente grandi o particolarmente piccoli rispetto all’insieme degli altri termini). 4 - Le medie a.a. 200910

I PERCENTILI Come generalizzazione della mediana si possono considerare i valori che suddividono l’insieme dei termini (o delle modalità ordinali) in due parti, con quote percentuali prefissate. 4 - Le medie a.a. 200910

DEFINIZIONE: PERCENTILE Si dice percentile di ordine z e si indica con xz (0 < z < 100%) il numero che suddivide la successione dei valori ordinati in senso non decrescente in due parti, tali che i valori minori o uguali a xz siano una percentuale uguale a z. 4 - Le medie a.a. 200910

PERCENTILI DI PARTICOLARE INTERESSE La mediana è il percentile di ordine z = 50%. I quartili dividono la distribuzione in quattro parti uguali: x25%, x50%, x75%. I decili, definiti come x10%, x20%, x30%, x40%, x50%, x60%, x70%, x80%, x90%. 4 - Le medie a.a. 200910

Percentili (Quantili) Quartili I quartili dividono la distribuzione in quattro parti uguali 25% (minimo) (massimo) (mediana) 4 - Le medie a.a. 200910

Percentili (Quantili) Decili 10% I decili dividono la distribuzione in dieci parti uguali 4 - Le medie a.a. 200910

Esempio: calcolo dei quartili 4 - Le medie a.a. 200910

INTERPRETAZIONE Il nono decile, x90%, ad esempio, è il valore che suddivide la distribuzione in due parti tali che le unità statistiche con valori della variabile minori o uguali ad x90% siano il 90% del totale e le unità con valori maggiori siano il restante 10%. 4 - Le medie a.a. 200910

ESEMPIO: Decili dei redditi delle famiglie italiane 4 - Le medie a.a. 200910

INTERPRETAZIONE Il 10% delle famiglie più povere ha un reddito annuo sino a 7.681 euro. Il valore che discrimina il 20% delle famiglie più povere dalle restanti è uguale a 11.069 euro; …; l’ultimo 10% delle famiglie più ricche (nono decile, x90%) ha un reddito annuo maggiore di 44.828 euro. 4 - Le medie a.a. 200910

INTERPRETAZIONE DELLA MEDIANA La mediana, che coincide con il quinto decile, x50%, è uguale a 20.272 euro ed è il valore del reddito annuo che divide il primo 50% delle famiglie più povere dal restante 50% delle famiglie più ricche. 4 - Le medie a.a. 200910

CONFRONTO CON LA MEDIA ARITMETICA Il valore medio del reddito annuo delle famiglie italiane, è uguale 24.945 euro. La media aritmetica dei redditi è alquanto superiore alla mediana poiché alla determinazione del valore della media aritmetica concorrono anche i redditi più elevati, che invece non influenzano il calcolo della mediana. 4 - Le medie a.a. 200910

LA MODA: DEFINIZIONE Si dice moda d’una variabile discreta, quantitativa o qualitativa, e si indica con Mo, il numero o la modalità che presenta la massima frequenza. 4 - Le medie a.a. 200910

ESERCITAZIONE 2 Riprendiamo l’esempio analizzato nella ESERCITAZIONE 1 relativo ai tre modi per produrre. 4 - Le medie a.a. 200910

ESERCITAZIONE 2 Le distribuzioni dei pezzi prodotti differiscono, come visto, sopratutto per la diversa “posizione”. Una domanda che sembra naturale è di quanto?.. Ad esempio, “Nuova 2” sembra con i dati a disposizione migliore di “Vecchia”. Ma quanto migliore? Una possibile maniera per rispondere a questo tipo di domande si concretizza nel: 1. Sintetizzare le singole distribuzioni in un unico numero che, in una qualche senso, indichi dove la distribuzione stessa è “posizionata”. Ovvero, calcolare per ogni distribuzione una misura (o parametro o indice) di posizione; 2. Rispondere confrontando gli indici calcolati al punto precedente. I parametri di posizione che vengono di solito utilizzati sono: la media aritmetica, la mediana e i quantili. 4 - Le medie a.a. 200910

Media e mediana: il caso delle tre riorganizzazioni del lavoro Vecchia Nuova 1 Nuova 2 media 705,5 700,8 719,2 mediana 706 699 718,5 Come si vede risulta confermato i risultati precedenti. Indicano che nuova 2 potrebbe far aumentare la produzione di circa un 2%. 4 - Le medie a.a. 200910

50% Me= 718,5 M =719,2 4 - Le medie a.a. 200910

ESEMPIO Consideriamo l’incom group di 10 paesi fortemente indebitati ed ordiniamo i valori dal più piccolo al più grande: Low, Low, Lower – middle, Low, Low, Low, Lower – middle, Low, Low, Lower - middle La moda è uguale a Low (frequenza pari a 7 contro le altre frequenze pari ad 3). 4 - Le medie a.a. 200910

PROPRIETA’ DELLA MODA La moda è l’unica media calcolabile per una carattere qualitativo nominale Essa rende minimo il numero di valori (o delle modalità) diversi da essa. 4 - Le medie a.a. 200910

SCELTA DELLA MEDIA Dipende dagli scopi di sintesi. In molti casi l’impiego congiunto di tutte le medie è utile per fornire un’informazione più completa sul fenomeno Se il fenomeno è qualitativo ordinale, si possono calcolare la mediana e la moda. Se il fenomeno è qualitativo nominale l’unico criterio di sintesi possibile è la moda. Se vi sono outliers è preferibile la mediana alla moda. 4 - Le medie a.a. 200910

INDICI PONDERATI IN GENERALE Se le unità statistiche hanno una diversa dimensione o un’importanza differente, si attribuisce a ciascuna di esse un opportuno “peso”. Per il calcolo della media e di indici di variabilità si utilizzano delle formule ponderate. 4 - Le medie a.a. 200910

FORMULE PONDERATE dove W è la variabile peso e wi è il valore del peso per la unità i-esima. 4 - Le medie a.a. 200910

FORMULE PONDERATE Caso particolare: wi = 1/n → media aritmetica semplice Confronto con media ponderata in distribuzione di frequenze 4 - Le medie a.a. 200910

FORMULE PONDERATE MEDIA ARITMETICA PONDERATA (distribuzione di frequenze) SIMBOLOGIA dove: il numeratore individua l’ammontare complessivo del fenomeno. Il denominatore la somma delle frequenze 4 - Le medie a.a. 200910

OSSERVAZIONE Solitamente la ponderazione si applica nel calcolo di indici statistici in presenza di matrici dei dati derivati, in cui le variabili sono dei rapporti statistici. 4 - Le medie a.a. 200910

ESEMPIO: INDICATORI STRUTTURALI Per il rapporto: Il peso è la popolazione in ciascun paese Con questo criterio di ponderazione il GDP/popolazione medio risulta uguale a quello che si ottiene dividendo il totale dei GDP nazionali per il totale delle popolazioni nazionali. 4 - Le medie a.a. 200910

ESEMPIO 4 - Le medie a.a. 200910

Scelta della media 4 - Le medie a.a. 200910

I bilanci delle famiglie italiane nell’anno 2000 4 - Le medie a.a. 200910

I bilanci delle famiglie italiane nell’anno 2000 4 - Le medie a.a. 200910

ESAME DI STATISTICA ECONOMICA PROVA SCRITTA DEL 29 giugno 2007 3) Che informazione forniscono i quintili della distribuzione di redditi famigliari? la quantità di reddito ricevuta dai gruppi di 500 famiglie il numero di famiglie che ricevono un quinto di reddito totale la quantità di reddito ricevuta da un quinto delle famiglie 4 - Le medie a.a. 200910