La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3.

Presentazioni simili


Presentazione sul tema: "Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3."— Transcript della presentazione:

1 Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3

2 Forma della Distribuzione La forma della distribuzione si dice simmetrica se le osservazioni sono bilanciate, o distribuite in modo approssimativamente regolare attorno al centro.

3 La forma della distribuzione è detta asimmetrica se le osservazioni non sono distribuite in modo simmetrico rispetto al centro. Una distribuzione con asimmetria positiva (obliqua a destra) ha una coda che si estende a destra, nella direzione dei valori positivi. Una distribuzione con asimmetria negativa (obliqua a sinistra) ha una coda che si estende a sinistra, nella direzione dei valori negativi. Forma della Distribuzione

4 Descrive come i dati sono distribuiti Misure della forma –Simmetrica o asimmetrica Media = Mediana Media < Mediana Mediana < Media Obliqua a destra Obliqua a sinistra Simmetrica Misure di Forma della Distribuzione

5 Skewness: indice che informa circa il grado di simmetria o asimmetria di una distribuzione. –γ=0 ditribuzione simmetrica; –γ media); –γ>0 asimmetria positiva (mediana3 se la distribuzione è ipernormale (rispetto alla distribuzione di una Normale ha densità di frequenza maggiore per i valori molto distanti dalla media). Misure di Forma della Distribuzione

6 Esempio Importo totale accredito stipendio Skewness>0 asimmetria positiva (mediana

7 Output in HTML

8 PROC FREQ - Descrizione La PROC FREQ permette di calcolare le distribuzioni di frequenza univariate per variabili qualitative e quantitative discrete

9 PROC FREQ – Sintassi generale 1/2 proc freq data= dataset options; tables variabile /options; run; Distribuzione di frequenza univariata OPTIONS: noprint non mostra i risultati nella finestra di output /missing considera anche i missing nel calcolo delle frequenze

10 PROC FREQ: Esempio 1 proc freq data=corso.telefonia; table operatore; run; Variabile qualitativa: operatore telefonico

11 operatoreFrequencyPercentCumulative FrequencyPercent Tim Tre Vodafone Wind Frequenza assoluta: consiste nellassociare a ciascuna categoria, o modalità, il numero di volte in cui compare nei dati Frequenza relativa: rapporto tra la frequenza assoluta ed il numero complessivo delle osservazioni effettuate Frequenze cumulate Output PROC FREQ

12 PROC FREQ: Esempio 2 proc freq data=corso.telefonia; table fisso_g; run; Variabile quantitativa discreta: numero medio giorni utilizzo alla settimana telefono fisso

13 Output PROC FREQ fisso_g FrequencyPercentCumulative Frequency Cumulative Percent

14 PROC FREQ: Esempio 3 proc freq data=corso.telefonia; table motivo_utilizzo_2 / missing; run; Variabile qualitativa: secondo motivo di utilizzo mezzi di comunicazione OPZIONE missing: considera anche i missing nel calcolo delle frequenze

15 Output PROC FREQ Studio Piacere/Tempo libero Partner Famigliari Altro Cumulative Percent Cumulative Frequency PercentFrequencymotivo_utilizzo_2 MISSING

16 Output PROC FREQ motivo_utilizzo_2FrequencyPercentCumulative Frequency Cumulative Percent Altro Famigliari Partner Piacere/Tempo libero Studio Frequency Missing = 24

17 PROC FREQ – Sintassi generale 2/2 Distribuzione di frequenza univariata con variabile di classificazione proc freq data= dataset options; by variabile_1; tables variabile_2 /options; run;

18 PROC FREQ: Esempio 4 proc sort data=corso.telefonia; by sesso; run; proc freq data=corso.telefonia; by sesso; tables operatore; run; Distribuzione di frequenza univariata con variabile di classificazione PROC SORT: ordinare le osservazioni in base alla variabile di by

19 Output PROC FREQ sesso=F operatoreFrequencyPercentCumulative Frequency Cumulative Percent Tim Tre Vodafone Wind sesso=M operatoreFrequencyPercentCumulative Frequency Cumulative Percent Tim Tre Vodafone Wind

20 PROC UNIVARIATE - Descrizione La PROC UNIVARIATE permette di calcolare misure di sintesi di posizione, variabilità, forma per variabili quantitative continue

21 proc univariate data= dataset options; var variabile; run; Distribuzione di frequenza univariata PROC UNIVARIATE – Sintassi 1/2 OPTIONS: noprint non mostra i risultati nella finestra di output

22 PROC UNIVARIATE – Esempio 1 Misure di sintesi della variabile quantitativa discreta numero medio sms inviati al giorno proc univariate data=corso.telefonia; var num_sms_e; run;

23 Output PROC UNIVARIATE (1/5) Basic Statistical Measures LocationVariability Mean Std Deviation Median Variance Mode Range Interquartile Range Misure di tendenza centrale Media aritmetica: somma dei valori diviso il numero di valori Mediana: in una lista ordinata, la mediana è il valore centrale (50% sopra, 50% sotto) Moda: valore che occorre più frequentemente

24 Output PROC UNIVARIATE (2/5) Misure di Variabilità Scarto Quadratico Medio [Std Deviation] : mostra la variabilità rispetto alla media Varianza [Variance] : media dei quadrati delle differenze fra ciascuna osservazione e la media Campo di Variazione [Range] : differenza tra il massimo e il minimo dei valori osservati Differenza Interquartile [Interquartile Range] : 3° quartile – 1° quartile Interquartile Range Range Mode Variance Median Std Deviation Mean VariabilityLocation Basic Statistical Measures

25 Output PROC UNIVARIATE (3/5) Quantiles (Definition 5) QuantileEstimate 100% Max100 99%100 95%100 90%70 75% Q330 50% Median10 25% Q15 10%2 5%2 1%1 0% Min0 Il primo quartile, Q 1, è il valore per il quale il 25% delle osservazioni sono minori di esso e il 75% sono maggiori Q 2 coincide con la mediana (50% sono minori, 50% sono maggiori) Il terzo quartile, Q3, è il valore per il quale il 75% delle osservazioni sono minori di esso e il 25% sono maggiori I Quartili dividono la sequenza ordinata dei dati in 4 segmenti contenenti lo stesso numero di valori

26 Output PROC UNIVARIATE (4/5) Coeff di variazione [Coeff Variation] : misura la variabilità relativa rispetto alla media (%) Std Error Mean Coeff Variation Corrected SS329878Uncorrected SS Kurtosis Skewness Variance Std Deviation 5738Sum Observations Mean 236Sum Weights236N Moments

27 Output PROC UNIVARIATE (5/5) Std Error Mean Coeff Variation Corrected SS329878Uncorrected SS Kurtosis Skewness Variance Std Deviation 5738Sum Observations Mean 236Sum Weights236N Moments Skewness: indice che informa circa il grado di simmetria o asimmetria di una distribuzione –γ=0 distribuzione simmetrica –γ media) –γ>0 asimmetria positiva (mediana3 se la distribuzione è ipernormale

28 PROC UNIVARIATE – Esempio 2 Misure di sintesi della variabile quantitativa continua numero medio ore utilizzo al giorno telefono cellulare proc univariate data=corso.telefonia; var cell_h; run;

29 PROC UNIVARIATE – Sintassi 2/2 Distribuzione di frequenza univariata con variabile di classificazione proc univariate data= dataset options; class variabile_1 (options); var variabile_2; run; OPTIONS: noprint non mostra i risultati nella finestra di output (missing) considera anche la categoria missing (contenente tutti i valori mancanti) della variabile di classificazione

30 PROC UNIVARIATE – Esempio 3 Misure di sintesi della variabile numero medio ore utilizzo al giorno telefono cellulare suddivisa per sesso proc univariate data=corso.telefonia; class sesso; var cell_h; run;

31 PROC UNIVARIATE – Esempio 4 Misure di sintesi della variabile numero medio ore utilizzo al giorno telefono cellulare suddivisa per hobby con opzione missing proc univariate data=corso.telefonia; class hobby_3(missing); var cell_h; run;

32 Mediana (Q2) X massimo X minimo Q1Q3 25% 25% Sequenza ordinata di valori assunti da una variabile Differenza Interquartile OUTLIERS: Q1 - 1,5 * Differenza interquartile Q3 + 1,5 * Differenza interquartile BOX PLOT

33 SAS INSIGHT: Box Plot (1/2)

34 SAS INSIGHT: Box Plot (2/2)


Scaricare ppt "Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3."

Presentazioni simili


Annunci Google