La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.

Presentazioni simili


Presentazione sul tema: "Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate."— Transcript della presentazione:

1 Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate

2 Metodi Quantitativi per Economia, Finanza e Management SUDDIVISIONE PER ESERCITAZIONI Venerdì ore Economia e direzione d'impresa, Marketing. Venerdì ore Amministrazione aziendale e libera professione, Banche mercati e finanza d'impresa, Management delle risorse umane.

3 Percorso di Analisi

4 Matrice dei dati

5 Esempio di matrice dei dati Popolazione di 20 individui N=20 Variabili rilevate su ogni unità statistica Tipologia di variabili: NUMERO DI FIGLI variabile quantitativa discreta ALTEZZA variabile quantitativa continua SESSO variabile qualitativa nominale TITOLO DI STUDIO variabile qualitativa ordinale

6 Statistica descrittiva univariata La statistica descrittiva univariata ha come obiettivo lo studio della distribuzione di ogni variabile, singolarmente considerata, allinterno della popolazione. Fornisce strumenti per la lettura dei fenomeni osservati di rapida ed immediata interpretazione. Distribuzioni di frequenza Misure di sintesi –Misure di posizione –Misure di dispersione –Misure della forma della distribuzione Data Audit –Errori di imputazione –Dati mancanti (missing) –Valori anomali (outliers) Analisi preliminari

7 Le distribuzioni di frequenza Per variabili qualitative e quantitative discrete La distribuzione di frequenza è in grado di «compattare» la lista di dati dando unimmagine immediata e di facile lettura della distribuzione della variabile. Lista dei dati

8 Le distribuzioni di frequenza Frequenza assoluta: è un primo livello di sintesi dei dati, consiste nellassociare a ciascuna categoria, o modalità, il numero di volte in cui compare nei dati Distribuzione di frequenza: insieme delle modalità e delle loro frequenze Frequenza relativa: rapporto tra la frequenza assoluta ed il numero complessivo delle osservazioni effettuate. I due tipi di frequenze vengono usati con dati qualitativi (nominali e ordinali) e quantitativi discreti. p i = n i / N

9 Rappresentazione grafica variabili qualitative: Diagr. a barre: nellasse delle ascisse ci sono le categorie, senza un ordine preciso; in quello delle ordinate le frequenze assolute/relative corrispondenti alle diverse modalità Diagr. a torta: la circonferenza è divisa proporzionalmente alle frequenze Diagramma a torta - sesso Le distribuzioni di frequenza Diagramma a barre – titolo di studio

10 Rappresentazione grafica var.quantitative discrete: Diagr. delle frequenze: nellasse delle ascisse ci sono i valori assunti dalla var. discreta (quindi ha un significato quantitativo); laltezza delle barre è proporzionale alle frequenze relative o assolute del valore stesso Istogramma: nellasse delle ascisse ci sono le classi degli intervalli considerati; lasse delle ordinate rappresenta la densità di frequenza; larea del rettangolo corrisponde alla frequenza della classe stessa. Le distribuzioni di frequenza Diagramma delle frequenze – numero di figli

11 Le distribuzioni di frequenza esempi

12 Misure di sintesi Misure di posizione: Misure di tendenza centrale: –Media aritmetica –Mediana –Moda Misure di tendenza non centrale: –Quantili di ordine p (percentili, quartili) Misure di dispersione: Campo di variazione Differenza interquantile Varianza Scarto quadratico medio Coefficiente di variazione Misure di forma della distribuzione: Skewness Kurtosis

13 Misure di sintesi Misure di posizione: Misure di tendenza centrale: –Media aritmetica –Mediana –Moda Misure di tendenza non centrale: –Quantili di ordine p (percentili, quartili) Misure di dispersione: Campo di variazione Differenza interquantile Varianza Scarto quadratico medio Coefficiente di variazione Misure di forma della distribuzione: Skewness Kurtosis

14 Misure di Tendenza Centrale Tendenza Centrale MediaMediana Moda Valore centrale delle osservazioni ordinate Valore più frequente Media Aritmetica

15 E è quel valore (non necessariamente una modalità osservata) che rileva la tendenza centrale della distribuzione E la misura di tendenza centrale più comune Media = somma dei valori diviso il numero di valori Influenzata da valori estremi (outlier) Media = Media = 4

16 Media Aritmetica

17 Mediana In una lista ordinata, la mediana è il valore centrale (50% sopra, 50% sotto) Non influenzata da valori estremi Mediana = Mediana = 3

18 Moda Valore che occorre più frequentemente, cioè quella modalità della distribuzione di frequenza alla quale è associata la frequenza assoluta (o relativa) maggiore Non influenzata da valori estremi Usata sia per dati numerici che categorici Può non esserci una moda Ci può essere più di una moda Moda = No Moda

19 Moda Quale è la moda della variabile Sesso? Quale è la moda della variabile Titolo di Studio?

20 Media, Moda & Mediana La moda è pari a 1, è il valore che occorre più frequentemente In una lista ordinata, la mediana è il valore centrale, è pari a ( )/7 = (1*3 + 2*2 + 3*1 + 4*1)/7 = 14/7 = 2 Media = somma dei valori diviso il numero di valori = 2

21 Misure di Tendenza Non Centrale I quantili di ordine p

22 I Quartili dividono la sequenza ordinata dei dati in 4 segmenti contenenti lo stesso numero di valori 25% Il primo quartile, Q 1, è il valore per il quale 25% delle osservazioni sono minori e 75% sono maggiori di esso Q 2 coincide con la mediana (50% sono minori, 50% sono maggiori) Solo 25% delle osservazioni sono maggiori del terzo quartile Q1Q2Q3 Misure di Tendenza Non Centrale I Quartili

23 Misure di Tendenza Non Centrale ESEMPIO MATRICE DEI DATI: PRINCIPALI QUANTILI: Il primo quartile, Q 1, è 167, cosa significa? Il 25% delle unità statistiche che compongono il campione hanno unaltezza minore di 167 cm e il 75% unaltezza maggiore

24 Box Plot Mediana (Q2) X massimo X minimo Q1Q3 25% 25% Differenza Interquartile 57 – 30 = 27 OUTLIERS: Q1 - 1,5 * Differenza interquartile Q3 + 1,5 * Differenza interquartile INDICE DI DISPERSIONE

25 Misure di sintesi Misure di posizione: Misure di tendenza centrale: –Media aritmetica –Mediana –Moda Misure di tendenza non centrale: –Quantili di ordine p (percentili, quartili) Misure di dispersione: Campo di variazione Differenza interquantile Varianza Scarto quadratico medio Coefficiente di variazione Misure di forma della distribuzione: Skewness Kurtosis

26 Stesso centro, diversa variabilità Misure di Variabilità Variabilità Varianza Scarto Quadratico Medio Coefficiente di Variazione Campo di Variazione Differenza Interquartile Le misure di variabilità forniscono informazioni sulla dispersione o variabilità dei valori.

27 Campo di Variazione La più semplice misura di variabilità Differenza tra il massimo e il minimo dei valori osservati: Campo di variazione = X massimo – X minimo Campo di Variazione = = 13 Esempio:

28 Ignora il modo in cui i dati sono distribuiti Sensibile agli outlier Campo di Var. = = Campo di Var. = = 5 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120 Campo di Var. = = 4 Campo di Var = = 119 Campo di Variazione

29 Differenza Interquartile Possiamo eliminare il problema degli outlier usando la differenza interquartile Elimina i valori osservati più alti e più bassi e calcola il campo di variazione del 50% centrale dei dati Differenza Interquartile = 3 o quartile – 1 o quartile IQR = Q 3 – Q 1

30 Media dei quadrati delle differenze fra ciascuna osservazione e la media –Varianza della Popolazione: Varianza dove = media della popolazione N = dimensione della popolazione x i = i imo valore della variabile X

31 Scarto Quadratico Medio Misura di variabilità comunemente usata Mostra la variabilità rispetto alla media Ha la stessa unità di misura dei dati originali Assume valori maggiori o uguali a 0; il caso particolare SQM=0 si verifica solamente in caso di assenza di variabilità –Scarto Quadratico Medio della Popolazione:

32 Scarto quadratico medio piccolo Scarto quadratico medio grande Scarto Quadratico Medio

33 Media = 15.5 s = Dati B Dati A Media = 15.5 s = Media = 15.5 s = Dati C Scarto Quadratico Medio

34 Viene calcolato usando tutti i valori nel set di dati Valori lontani dalla media hanno più peso (poichè si usa il quadrato delle deviazioni dalla media) Le stesse considerazioni valgono anche per il calcolo della Varianza Scarto Quadratico Medio

35 Coefficiente di Variazione Misura la variabilità relativa Sempre in percentuale (%) Mostra la variabilità relativa rispetto alla media Può essere usato per confrontare due o più set di dati misurati con unità di misura diversa Assume valori maggiori di 0 e crescenti al crescere della variabilità; ancora una volta, si avrà che CV=0 in assenza di variabilità.

36 Azione A: –Prezzo medio scorso anno = $50 –Scarto Quadratico Medio = $5 Azione B: –Prezzo medio scorso anno = $100 –Scarto Quadratico Medio = $5 Entrambe le azioni hanno lo stesso scarto quadratico medio, ma lazione B è meno variabile rispetto al suo prezzo Coefficiente di Variazione

37 Misure di sintesi Misure di posizione: Misure di tendenza centrale: –Media aritmetica –Mediana –Moda Misure di tendenza non centrale: –Quantili di ordine p (percentili, quartili) Misure di dispersione: Campo di variazione Differenza interquantile Varianza Scarto quadratico medio Coefficiente di variazione Misure di forma della distribuzione: Skewness Kurtosis

38 Forma della Distribuzione La forma della distribuzione si dice simmetrica se le osservazioni sono bilanciate, o distribuite in modo approssimativamente regolare attorno al centro.

39 La forma della distribuzione è detta asimmetrica se le osservazioni non sono distribuite in modo simmetrico rispetto al centro. Una distribuzione con asimmetria positiva (obliqua a destra) ha una coda che si estende a destra, nella direzione dei valori positivi. Una distribuzione con asimmetria negativa (obliqua a sinistra) ha una coda che si estende a sinistra, nella direzione dei valori negativi. Forma della Distribuzione

40 Descrive come i dati sono distribuiti Misure della forma –Simmetrica o asimmetrica Media = Mediana Media < Mediana Mediana < Media Obliqua a destra Obliqua a sinistra Simmetrica Misure di Forma della Distribuzione

41 Skewness: indice che informa circa il grado di simmetria o asimmetria di una distribuzione. –γ=0 ditribuzione simmetrica; –γ media); –γ>0 asimmetria positiva (mediana3 se la distribuzione è ipernormale (rispetto alla distribuzione di una Normale ha densità di frequenza maggiore per i valori molto distanti dalla media). Misure di Forma della Distribuzione

42 altezza The mode displayed is the smallest of 3 modes with a count of 3.

43 Univariate Analysis Frequency distribution Synthesis measures –Measures of location –Measures of spread –Measures of shape ………… Data Audit –Input errors –Outliers –Missing values Basic insights

44 Analisi di Concentrazione Caratteri quantitativi trasferibili Un carattere è trasferibile se possiamo immaginare che ununità possa cedere parte del carattere che possiede ad unaltra unità. Sono esempi di carattere trasferibile: reddito, fatturato, numero addetti, audience televisiva, clienti. Sono esempi di carattere non trasferibile: altezza e peso.

45 Analisi di Concentrazione Caratteri quantitativi trasferibili Si rilevi il reddito delle famiglie di un campione. Lanalisi di concentrazione ci aiuta a ripondere alla seguente domanda: Il reddito complessivo è equidistribuito tra le famiglie oppure la maggior parte dellammontare complessivo del reddito è posseduto da un numero esiguo di famiglie? Vogliamo misurare il grado di concentrazione del carattere nella nostra popolazione.

46 Analisi di Concentrazione Equidistribuzione: Max concentrazione: Per caratteri quantitativi trasferibili Se tutte le famiglie hanno lo stesso reddito, si parla di equidistribuzione; Nel caso in cui tutto il reddito sia posseduto da una sola famiglia mentre tutte le altre hanno zero reddito, si parla di massima concentrazione.

47 Analisi di Concentrazione 2. Calcolare le quantità: 1. Ordinare le osservazioni Dove F i è la frazione, sul totale delle unità, delle i unità più povere e Q i è la frazione di ammontare del carattere, sullammontare complessivo, posseduto dalle i unità più povere. le unità sono ordinate dalla più povera alla più ricca

48 20% 50% 60% 90% Analisi di Concentrazione


Scaricare ppt "Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate."

Presentazioni simili


Annunci Google