Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015 1.

Slides:



Advertisements
Presentazioni simili
LA MEDIA STATISTICA di Zappa Giacomo.
Advertisements

- le Medie la Moda la Mediana
SCALA INTERVALLO / A RAPPORTO
TAV.1 Foto n.1 Foto n.2 SCALINATA DI ACCESSO ALL’EREMO DI SANTA CATERINA DEL SASSO DALLA CORTE DELLE CASCINE DEL QUIQUIO Foto n.3 Foto n.4.
____________________
1 Pregnana Milanese Assessorato alle Risorse Economiche Bilancio Preventivo P R O P O S T A.
Le rappresentazioni grafiche
QUANTILI.
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
Statistica I valori medi.
Frontespizio Economia Monetaria Anno Accademico
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
“Teoria e metodi della ricerca sociale e organizzativa”
LEZIONE A.7 Ancora sulle modalità centrali
Le misure di tendenza centrale informano sul centro della distribuzione 4 - Le medie a.a Le medie a.a
Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita.
Lez. 3 - Gli Indici di VARIABILITA’
L’elasticità e le sue applicazioni
Esempi pratici sul mercato del lavoro concorrenziale
Progetto Pilota 2 Lettura e interpretazione dei risultati
Elementi di STATISTICA DESCRITTIVA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia l’analisi statistica.
Calcolo della mediana per un carattere quantitativo suddiviso in classi Il valore della funzione di ripartizione calcolato in x=Me è pari a 0,5 esempio:
Esercizio 1 In una indagine statistica si vuole rilevare il numero di cellulari posseduti dagli studenti iscritti alla facoltà di economia. Si dica: -
COSA VUOL DIRE FARE STATISTICA
Misure di posizione Gli indici di posizione servono per individuare la tendenza centrale del fenomeno studiato. I più utilizzati sono: Moda Mediana Quartili,
Ufficio Studi UNIONCAMERE TOSCANA 1 Presentazione di Riccardo Perugi Ufficio Studi UNIONCAMERE TOSCANA Firenze, 19 dicembre 2000.
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Simulazione di un esperimento di laboratorio: Caduta di un corpo quadrato in.
COMPLETAMENTI Mil.Tslc All
Rappresentazione dei dati statistici
Cos’è un problema?.
Misurazione Le osservazioni si esprimono in forma di misurazioni
Lezione 4 Probabilità.
SNV a.s Servizio di valutazione del sistema dellistruzione Incontro provinciale di coordinamento organizzativo a cura del CSA di Treviso Novembre.
Mediana Punto che lascia il 50 % dei casi alla sua destra e il 50% dei casi alla sua sinistra Esempio: 8, 9, 10, 11, 15, 6, 7 Mettere le misure in ordine.
Luciano giromini – la misura in psicologia, 2009 database e distribuzioni - misure di sintesi - misure di variabilità descrizione dei dati:
Operazioni con Numeri Naturali e Numeri Decimali
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
Statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
LA SINTESI STATISTICA Una serie di dati numerici è
Esercizio 1: La seguente distribuzione riporta i punteggi di un test sullo spettro autistico misurato su un gruppo di bambini: a)Costruire una tabella.
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
Orientamento universitario
ISTITUTO COMPRENSIVO “G. BATTAGLINI” MARTINA FRANCA (TA)
Bando Arti Sceniche. Per poter procedere è indispensabile aprire il testo del Bando 2ROL - Richieste On Line.
1 Questionario di soddisfazione ATA - a. sc. 2008/09 Il questionario è stato somministrato nel mese di aprile Sono stati restituiti 29 questionari.
Esercitazione 1) La seguente distribuzione riporta i punteggi di ansia misurata su studenti di psicometria:
1 Questionario di soddisfazione Studenti - a. sc. 2008/09 Il questionario è stato somministrato dal mese di aprile al mese di maggio Sono stati restituiti.
Settore di inserimento I-VI edizione Altro 5% Cinema 13% Web 3% Settore Comunicazione (Aziende, Banche, Istit. Pubb, Priv. o non Profit) 47% TV 22% Free.
INDICE I VALORI MEDI LA MEDIA GEOMETRICA LA MEDIA ARITMETICA
Teoria della probabilità
Atti persecutori – delitti commessi (dal 23 febbraio) Fonte:Direzione.
Esercizio 1: La seguente distribuzione riporta i punteggi di un test sullo spettro autistico misurato su un gruppo di bambini: a)Costruire una tabella.
Corso di Analisi Statistica per le Imprese Cross tabulation e relazioni tra variabili Prof. L. Neri a.a
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva.
Gli indici di dispersione
Esercitazione: Data la seguente distribuzione relativa al punteggio nella scala di ansia di un campione di pazienti bipolari: a)Costruire la tabella di.
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
Accenni di analisi monovariata e bivariata
Accenni di analisi monovariata e bivariata
Accenni di analisi monovariata e bivariata. ANALISI MONOVARIATA Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle.
Statistica sociale Modulo A A.A Prof.ssa Barbara Baldazzi Dottore Mario Mastrangelo Facoltà di Lettere e Filosofia Università di Tor Vergata.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Transcript della presentazione:

Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015 1

Indice di tendenza centrale: la media aritmetica Si può calcolare solo per variabili quantitative È una media analitica cioè è funzione di tutti i valori della distribuzione E’ il punto di equilibrio o baricentro della distribuzione E’ l’indice più intuitivo per sintetizzare un insieme di valori 2

Calcolo della media dei ricavi Conoscendo i ricavi dei 9 punti vendita dell’azienda, posso calcolare il ricavo medio, un unico valore rappresentativo dell’intero insieme Si sommano i ricavi di tutti i punti vendita e il risultato si divide per il numero delle osservazioni (n=9) 3 3

Calcolo della media Somma dei ricavi (Intensità totale del carattere) = 350 + 200 + 600 + 500 + 270 + 180 + 205 + 340 + 280 = 2925 Punti vendita Ricavi 1 350 2 200 3 600 4 500 5 270 6 180 7 205 8 340 9 280 Media dei ricavi = 2925:9=325 L’intera torta rappresenta la somma dei ricavi di tutti i punti vendita La singola fetta rappresenta la media dei ricavi Σ=2925 4

Formula della media 100 200 300 400 500 600 700 Media = 325 Dati n valori osservati x1, x2,…, xn di un carattere quantitativo X 5

Effetto dei valori estremi Se il valore estremo fosse 800 invece di 600 la media aumenterebbe (il punto di equilibrio si sposta verso destra) 100 200 300 400 500 600 700 800 Media = 347,22 La media aritmetica risente fortemente dei valori estremi 6

Media di una distribuzione di frequenza Addetti (valori xj) Numero punti vendita (frequenze nj) 3 2 4 1 6 7 10 xj*nj 3*2=6 4*1=4 6*3=18 7*1=7 10*2=20 7

Media di una distribuzione di frequenza con classi di valori Classi di superficie (in ettari) Numero aziende (nj) 0-1 120 1-2 160 2-3 220 3-5 212 5-10 205 10-20 110 20-40 65 40-80 21 Valore centrale classi (cj) 0,5 1,5 2,5 4 7,5 15 30 60 cj*nj 60 240 550 848 1537,5 1650 1950 1260 La superficie media di una azienda agricola è di 7,27 ettari Fonte: Borra-Di Ciaccio, pag. 71 8

Media ponderata Uno studente ha sostenuto i seguenti esami del I anno del corso di laurea di EA. Come calcola la media dei voti? N. Esame voto cfu 1 Economia Aziendale 27 9 2 Ist. diritto pubblico 22 6 3 Metodi di matematica applicata 25 4 Macroeconomia 20 5 Ragioneria 28 9

Media ponderata: calcolo N. Esame voto (xi) cfu (pi) voto*cfu (xi*pi) 1 27 9 243 2 22 6 132 3 25 225 4 20 120 5 28 252 Il voto medio (su 39 cfu) è pari a 24,92 10

Media ponderata i due voti più bassi pesano di meno nel calcolo della media perché sono due esami da 6 cfu 18 19 20 21 22 23 24 25 26 27 28 29 30 Media ponderata = 24,92 11

Mediana E’ un indice di posizione Può essere calcolata per caratteri che siano almeno ordinabili (qualitativi su scala ordinale o quantitativi) E’ un indice indicato per distribuzioni che presentano valori estremi (molto grandi o molto piccoli). E’ un particolare quantile (2° quartile, 50° percentile) 12

Mediana È il valore che occupa la posizione centrale nell’insieme ordinato di tutti i valori Tra x(1) e Me è contenuto il 50% dei valori Tra Me e x(n) è contenuto il restante 50% dei valori X(1) Me X(n) 13

Mediana da una distribuzione di frequenza (con le freq. rel. cum.) Addetti (xj) Numero punti vendita (nj) Frequenze cumulate Nj 3 2 4 1 6 7 10 9 Frequenze rel cum. Fj 0,22 0,33 0,67 0,78 1,00 Sulla colonna delle frequenze relative cumulate si individua la prima Fj che è uguale o maggiore di 0,5 Il corrispondente valore xj è la mediana della distribuzione Mediana=6 14

Mediana di una distribuzione di frequenza con classi di valori Classi di superficie (in ettari) Numero aziende (nj) 0-1 120 1-2 160 2-3 220 3-5 212 5-10 205 10-20 110 20-40 65 Oltre 40 21 Freq. cum. (Nj) Freq. rel. cum. (Fj) 120 0,108 280 0,252 500 0,449 712 0,640 917 0,824 1027 0,923 1092 0,981 1113 1,000 15

La scelta tra media e mediana Fonte: Walter Kramer (2009), Le bugie della statistica, Nimesis

Quartili Sono 3 indici di posizione, Q1 Q2 e Q3 Tra x(1) e Q1 è contenuto il 25% dei valori (più bassi) Tra Q3 e x(n) è contenuto il 25% dei valori (i più alti) X(1) Q1 Q2=Me Q3 X(n) Tra Q1 e Q2 è contenuto il 25% dei valori Tra Q2 e Q3 è contenuto il 25% dei valori 17

Primo quartile Q1 Q1 Primo quartile: è preceduto dal 25% dei termini (e seguito dal 75%) Q1 è il primo valore xi in corrispondenza del quale la frequenza cumulata relativa 18

Terzo quartile Q3 Q3 Terzo quartile: è preceduto dal 75% dei termini (e seguito dal 25%) Q3 è il primo valore xi in corrispondenza del quale la frequenza cumulata relativa 19

Ricavi (valori ordinati) Calcolo dei quartili La prima Fi ad essere maggiore o uguale a 0,25 è la terza Ricavi 350 200 600 500 270 180 205 340 280 Ricavi (valori ordinati) Freq. cum. rel. X(1)=180 1/9=0,11 X(2)=200 2/9=0,22 X(3)=205 3/9=0,33 X(4)=270 4/9=0,44 X(5)=280 5/9=0,56 X(6)=340 6/9=0,67 X(7)=350 7/9=0,78 X(8)=500 8/9=0,89 X(9)=600 9/9=1 Il 25% dei punti vendita con i ricavi più bassi registrano ricavi che non superano 205 mila euro La prima Fi ad essere maggiore o uguale a 0,75 è la settima Per essere nel 25% dei punti vendita con i ricavi più alti si devono superare 350 mila euro di ricavi 20

Percentili Sono quei valori che dividono la distribuzione in cento parti di uguale numerosità Mediana=50-esimo percentile Q3= 75-esimo percentile P10 = decimo percentile: lascia alla sua sinistra il 10% dei valori P90 = novantesimo percentile: lascia alla sua destra il 10% dei valori 21

Moda È un indice di posizione Può essere calcolata per qualsiasi tipo di carattere E’ la modalità più frequente In una distribuzione di frequenza con classi di valori: è la modalità con più alta densità di frequenza 22

Moda di un insieme di valori Punti vendita Genere respons. 1 maschio 2 3 femmina 4 5 6 7 8 9 La modalità del carattere “Genere del responsabile” che si ripete più volte (5 volte ) è “maschio” La maggioranza dei punti vendita ha come responsabile un uomo Moda=“maschio” 23

Moda di una distribuzione di frequenza Addetti (valori distinti) Numero punti vendita (frequenze) 3 2 4 1 6 7 10 La frequenza maggiore è 3 La modalità del carattere “Numero di addetti” cui è associata la frequenza maggiore è 6 La maggioranza dei punti vendita ha un numero di addetti pari a 6 Moda=6 24

Moda di una distribuzione di frequenza con classi di valori Classi di superficie (in ettari) Numero aziende (nj) 0-1 120 1-2 160 2-3 220 3-5 212 5-10 205 10-20 110 20-40 65 40-80 21 Ampiezza classe (aj) Densità di freq (dj) 1 120 160 220 2 106 5 41 10 11 20 3,25 40 0,525 In presenza di classi di ampiezza diversa, la classe modale è quella che ha la densità di frequenza maggiore La classe modale è 2-3 25

Moda Può non esistere Può non essere unica Può essere una modalità “poco rappresentativa” del fenomeno 26

La scelta tra media, moda e mediana Fonte: Magnello e Van Loon (2011), La statistica a fumetti, Raffaello Cortina Editore

Calcolo dei valori medi in base al tipo di carattere Caratteri Quantitativi Qualitativi ordinati Qualitativi sconnessi Media  Mediana Moda 28