Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a. 2017-2018 1.

Slides:



Advertisements
Presentazioni simili
Variabilità Variabilità: inevitabile fluttuazione dei fenomeni naturali, fisici, sociali ecc le indicazioni fornite dalle misure di tendenza centrale (media.
Advertisements

Lez. 3 - Gli Indici di VARIABILITA’
Lez. 3 - Gli Indici di VARIABILITA’
Gli indici di dispersione
Corso di Analisi Statistica per le Imprese Indici di variabilita’ ed eterogeneita’ Prof. L. Neri a.a
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.
Rappresentazioni grafiche di una distribuzione di frequenze 1)Istogramma e poligono delle frequenze ● Dati raggruppati in classi ● Costituito da un insieme.
Consentono di descrivere la variabilità all’interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche.
Germana Scepi Corso di Statistica Anno accademico 2016-’17 Lezione:Argomento: Gli indici di variabilità4.
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
STATISTICA.
Precorso di Statistica per le Lauree Magistrali
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
ESERCITAZIONE RIEPILOGO di Statistica Descrittiva
Elaborazione dei dati Indici di posizione centrale
Introduzione a Statistica e Probabilità
Corso di Analisi Statistica per le Imprese Cross tabulation e relazioni tra variabili Prof. L. Neri a.a
Esercizio 1 Prezzo in euro libri
Analisi delle risposte
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
PEDAGOGIA SPERIMENTALE
STATISTICA Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo.
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
L’analisi monovariata
Confronto fra 2 popolazioni
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Quantitative Market Research Set-up Protocol
L’analisi del comportamento delle imprese (seconda parte)
Indici di variabilità Gli indici di variabilità misurano
La statistica A cura di: Manuela Mangione.
APPUNTI DI STATISTICA INFERENZIALE
Confronto tra diversi soggetti:
Introduzione a Statistica e Probabilità
Precorso di Statistica per le Lauree Magistrali
Corso di Finanza Aziendale
misure di eterogeneità
La Statistica Istituto Comprensivo “ M. G. Cutuli”
Statistica descrittiva bivariata
L’analisi monovariata
ANALISI DEI GRUPPI I.
ANALISI DELLE DISTRIBUZIONI STATISTICHE
Indici di variabilità La variabilità è la ragione dell’esistenza della psicologia. Le persone hanno dei comportamenti diversi che non possono essere predetti.
Corso di Analisi Statistica per le Imprese Rappresentazione dei dati
Corso di Analisi Statistica per le Imprese 2
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
L’indagine statistica
Statistica Scienza che studia i fenomeni collettivi.
La standardizzazione dei punteggi
Esercizio 1 La seguente distribuzione riporta i punteggi di autostima misurata su pazienti con disturbo depressivo maggiore: a) Costruire una tabella di.
Confronto tra diversi soggetti:
Quantitative Market Research Set-up Protocol
Statistica descrittiva bivariata
Statistica descrittiva bivariata
PEDAGOGIA SPERIMENTALE
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
Riduzione dei Dati.
Precorso di Statistica per le Lauree Magistrali
Compito 1: La seguente distribuzione riporta i punteggi di ansia su un campione non clinico: Costruire una tabella di frequenza, indicando: f, fc, %, %c.
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Associazione tra due variabili
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Esercizio 1 Prezzo in euro libri
Corso di Analisi Statistica per le Imprese
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
Associazione tra variabili qualitative
Corso di Analisi Statistica per le Imprese
Statistica descrittiva bivariata
Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3.
Transcript della presentazione:

Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a. 2017-2018 1

Variabilità La variabilità di una distribuzione esprime la tendenza delle unità di un collettivo ad assumere diverse modalità del carattere. Per misurare la variabilità di una distribuzione si ricorre agli indici di variabilità che devono rispettare le seguenti caratteristiche: -assumere valore minimo se tutte le unità della distribuzione presentano la stessa modalità del carattere -aumentare al crescere della “diversità” tra le modalità assunte dalle varie unità 2

Variabilità Il calcolo di una media non esaurisce la descrizione sintetica di un fenomeno osservato in un collettivo Due insiemi di valori o due distribuzioni di frequenza, pur avendo lo stesso valore medio, possono essere molto differenti tra di loro Gli indici di variabilità forniscono informazioni complementari a quelle degli indici medi 3

Punti vendita Ricavi Costi addetti ubicazione Genere respons. Vendita On-line R.O 1 350 205 5 centro maschio si 145 2 200 100 3 periferia 600 10 semicentro femmina no 250 4 500 270 230 6 70 180 120 60 7 105 8 340 210 9 280 140 4

Variabilità Distribuzioni teoriche Ricavi 350 200 600 500 270 180 205 340 280 Ricavi (A) (B) Ricavi (C) 325 300 140 350 270 400 830 200 605 120 190 370 Le 3 distribuzioni teoriche hanno la stessa media della distribuzione osservata La sintesi con la media aritmetica porta allo stesso risultato Eppure le distribuzioni sono molto diverse tra di loro Distribuzione osservata 5

Alcuni indici di variabilità Il range (o campo di variazione) è l’ampiezza dell’intervallo che contiene tutti i valori della distribuzione La differenza interquartile è l’ampiezza dell’intervallo che contiene il 50% dei valori (quelli centrali) 6

Esempio Distr. A Variabilità nulla Tutti i valori uguali Ricavi 350 200 600 500 270 180 205 340 280 Ricavi (A) (B) Ricavi (C) 325 300 140 350 270 400 830 200 605 120 190 370 Distr. A Variabilità nulla Tutti i valori uguali Passando da A a B e da B a C, aumenta la variabilità perché i valori cadono in un range sempre più ampio xmin 180 325 200 120 xmax 600 400 830 Range=xmax-xmin 420 710 7

Indici basati sullo scostamento dalla media La varianza σ2 è funzione delle differenze (scarti) tra ogni valore xi e la media La devianza è il numeratore della varianza 8

Indici basati sullo scostamento dalla media La deviazione standard (o scarto quadratico medio) è la radice quadrata della varianza Il coefficiente di variazione CV è il rapporto tra la dev. standard e la media moltiplicato per 100 9

Confronto tra due distribuzioni in termini di variabilità CV si calcola per confrontare la variabilità della distribuzione del carattere X con quella del carattere Y quando sono espressi o con diversa unità di misura o con diverso ordine di grandezza Se CVX>CVy allora la variabilità del carattere X è maggiore di quella del carattere Y 10

Esempio di calcolo Ricavi xj Scarti dalla media (xj-μ) Quadrato degli scarti (xj-μ)2 350 25 625 200 -125 15625 600 275 75625 500 175 30625 270 -55 3025 180 -145 21025 205 -120 14400 340 15 225 280 -45 2025 Per la proprietà della media Devianza=163200 Varianza=18133,3 Dev.std.=134,7 11

Variabilità dei ricavi dei punti vendita Un basso grado di variabilità indica che i punti vendita realizzano performance simili (i ricavi si discostano poco tra di loro) Viceversa un alto grado di variabilità fa capire che c’è una certa eterogeneità nei risultati delle vendite ottenuti nei diversi negozi 12

Varianza di una distribuzione di frequenza Addetti (xj) Numero punti vendita (nj) 3 2 4 1 6 7 10 (xj-μ)2*nj 19,34 4,45 0,04 0,79 30,26 13

Box plot L’altezza del box indica la dispersione del 50% delle osservazioni centrali intorno alla mediana. Si evidenzia una certa simmetria nella parte centrale, dato che la differenza Q2-Q1 non è molto diversa da Q3-Q2 max Q3 I segmenti esterni al box indicano la dispersione dei valori estremi. Si nota una maggiore dispersione del 25% dei valori più grandi, dato che la differenza max-Q3 è molto maggiore di Q1-min Q2 Q1 min Ricavi 14

Data Visualization (ESEMPIO) histogram a bar graph designed to show frequencies: There are nearly 30 States with population under 5 millions and few States with more than 10 millions of inhabitants. With nearly 40 Statest clustered into the first couple of bars, we may lose some details, so… May 15, 2019

Data Visualization (ESEMPIO) We decide the number of bars with the break option: hist(US_POP2017_R$respop, break=20) Now we have 2 million for each bar, so: there 15 States with population under 2 millions, 10 with population within 2 and 4 millions…. May 15, 2019

Data Visualization (ESEMPIO) The box plot is a standardized way of displaying the distribution of data based on the five number summary: min, first quartile, median, third quartile, and max.  boxplot(US_POP2017_R$respop,data=US_POP2017_R, main="USA Population") The box spans the interquartile range; the median is marked by the bold line inside the box; the whiskers are the two lines outside the box. Here high variability due to some huge values Data Mining: Concepts and Techniques May 15, 2019

Calcolo dei valori standardizzati Se il carattere quantitativo X ha media e deviazione standard σ allora è possibile sempre ottenere i suoi valori standardizzati La distribuzione del carattere Y avrà allora media zero e deviazione standard uguale ad 1

Confronto del rendimento di due investimenti (uguale media) 2003 7,7 6,4 2004 6,1 5,9 2005 0,4 3,2 2006 9,8 7,1 2007 3,5 4,9 media 5,5 var 10,7 1,8 Negli ultimi cinque anni, due fondi di investimento F1 e F2 hanno avuto lo stesso rendimento medio annuo, ma le varianze sono molto diverse Var(F1)>Var(F2) Una varianza maggiore indica che rendimenti molto diversi dalla media sono più frequenti Maggiore volatilità Maggior rischio A parità di rendimento medio, il cliente che è disposto ad accettare un rischio più alto sceglierà di investire in F1 19

Confronto del rendimento di due investimenti (media diversa) 2003 9,7 1,4 2004 7,1 1,9 2005 0,9 2,2 2006 9,9 2,1 2007 7,5 4,9 media 7,0 2,5 var 10,6 1,5 Il rendimento di F1 ha registrato una media e una varianza superiore a quello di F2 Si può concludere che F1 rappresenta un investimento più rischioso rispetto a F2? Le due medie hanno un ordine di grandezza diverso CV 46,5 49,3 la variabilità si confronta con CV A F1 è associata una variabilità (volatilità) più bassa 20

Omogeneità ed eterogeneità Sono aspetti della variabilità di un carattere qualitativo Eterogeneità nulla (o massima omogeneità) → Il carattere assume un’unica modalità (tutte le unità del collettivo presentano quella modalità) Eterogeneità massima (o minima omogeneità) → Il carattere presenta tutte le modalità e a ciascuna di esse è associata la stessa frequenza 21

Eterogeneità Eterogeneità nulla (tutte le unità hanno la stessa modalità) Eterogeneità massima (a ciascuna modalità è associata la stessa frequenza) Mod. Freq. rel. a 1 Mod. Freq. rel. a1 1/k a2 … ak 22

Indice di eterogeneità Mod. Freq. Freq. rel. a1 n1 f1 a2 … n2 f2 .. aj nj fj aK nK fK Indice di eterogeneità di Gini Indice relativo di eterogeneità di Gini 23

Eterogeneità dell’ubicazione dei punti vendita Ubicazione del p.v. F. ass. (nj) F. rel. (fj) Centro 4 0,45 Semicentro 2 0,22 Periferia 3 0,33 Totale 9 1,00 0,20 0,05 0,11 0,36 24

Eterogeneità dell’ubicazione dei punti vendita C’è un elevato grado di eterogeneità La distribuzione osservata si avvicina a quella che si avrebbe nella situazione di massima eterogeneità Distr. osservata Ubicazione del p.v. F. ass. (nj) F. rel. (fj) Centro 4 0,45 Semicentro 2 0,22 Periferia 3 0,33 Totale 9 1,00 Distr. con la max eterog. F. ass. (nj) F. rel. (fj) 3 0,33 9 1,00 25