La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3.

Presentazioni simili


Presentazione sul tema: "Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3."— Transcript della presentazione:

1 Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3

2 Forma della Distribuzione La forma della distribuzione si dice simmetrica se le osservazioni sono bilanciate, o distribuite in modo approssimativamente regolare attorno al centro.

3 La forma della distribuzione è detta asimmetrica se le osservazioni non sono distribuite in modo simmetrico rispetto al centro. Una distribuzione con asimmetria positiva (obliqua a destra) ha una coda che si estende a destra, nella direzione dei valori positivi. Una distribuzione con asimmetria negativa (obliqua a sinistra) ha una coda che si estende a sinistra, nella direzione dei valori negativi. Forma della Distribuzione

4 Descrive come i dati sono distribuiti Misure della forma –Simmetrica o asimmetrica Media = Mediana Media < Mediana Mediana < Media Obliqua a destra Obliqua a sinistra Simmetrica Misure di Forma della Distribuzione

5 Skewness: indice che informa circa il grado di simmetria o asimmetria di una distribuzione. –γ=0 ditribuzione simmetrica; –γ media); –γ>0 asimmetria positiva (mediana3 se la distribuzione è ipernormale (rispetto alla distribuzione di una Normale ha densità di frequenza maggiore per i valori molto distanti dalla media). Misure di Forma della Distribuzione

6 Esempio Importo totale accredito stipendio Skewness>0 asimmetria positiva (mediana { "@context": "http://schema.org", "@type": "ImageObject", "contentUrl": "http://images.slideplayer.it/1/563512/slides/slide_6.jpg", "name": "Esempio Importo totale accredito stipendio Skewness>0 asimmetria positiva (mediana

7 Output in HTML

8 PROC FREQ - Descrizione La PROC FREQ permette di calcolare le distribuzioni di frequenza univariate per variabili qualitative e quantitative discrete

9 PROC FREQ – Sintassi generale 1/2 proc freq data= dataset options; tables variabile /options; run; Distribuzione di frequenza univariata OPTIONS: noprint non mostra i risultati nella finestra di output /missing considera anche i missing nel calcolo delle frequenze

10 PROC FREQ: Esempio 1 proc freq data=corso.telefonia; table operatore; run; Variabile qualitativa: operatore telefonico

11 operatoreFrequencyPercentCumulative FrequencyPercent Tim5523.315523.31 Tre125.086728.39 Vodafone15465.2522193.64 Wind156.36236100 Frequenza assoluta: consiste nellassociare a ciascuna categoria, o modalità, il numero di volte in cui compare nei dati Frequenza relativa: rapporto tra la frequenza assoluta ed il numero complessivo delle osservazioni effettuate Frequenze cumulate Output PROC FREQ

12 PROC FREQ: Esempio 2 proc freq data=corso.telefonia; table fisso_g; run; Variabile quantitativa discreta: numero medio giorni utilizzo alla settimana telefono fisso

13 Output PROC FREQ fisso_g FrequencyPercentCumulative Frequency Cumulative Percent 02711.442711.44 0.593.813615.25 1104.244619.49 2198.056527.54 3218.908636.44 4145.9310042.37 5198.0511950.42 693.8112854.24 710845.76236100.00

14 PROC FREQ: Esempio 3 proc freq data=corso.telefonia; table motivo_utilizzo_2 / missing; run; Variabile qualitativa: secondo motivo di utilizzo mezzi di comunicazione OPZIONE missing: considera anche i missing nel calcolo delle frequenze

15 Output PROC FREQ 100.002368.4720Studio 91.5321654.24128Piacere/Tempo libero 37.29889.3222Partner 27.976616.9540Famigliari 11.02260.852Altro 10.172410.1724 Cumulative Percent Cumulative Frequency PercentFrequencymotivo_utilizzo_2 MISSING

16 Output PROC FREQ motivo_utilizzo_2FrequencyPercentCumulative Frequency Cumulative Percent Altro20.942 Famigliari4018.874219.81 Partner2210.386430.19 Piacere/Tempo libero12860.3819290.57 Studio209.43212100.00 Frequency Missing = 24

17 PROC FREQ – Sintassi generale 2/2 Distribuzione di frequenza univariata con variabile di classificazione proc freq data= dataset options; by variabile_1; tables variabile_2 /options; run;

18 PROC FREQ: Esempio 4 proc sort data=corso.telefonia; by sesso; run; proc freq data=corso.telefonia; by sesso; tables operatore; run; Distribuzione di frequenza univariata con variabile di classificazione PROC SORT: ordinare le osservazioni in base alla variabile di by

19 Output PROC FREQ sesso=F operatoreFrequencyPercentCumulative Frequency Cumulative Percent Tim2727.002727.00 Tre77.003434.00 Vodafone6363.009797.00 Wind33.00100100.00 sesso=M operatoreFrequencyPercentCumulative Frequency Cumulative Percent Tim2820.592820.59 Tre53.683324.26 Vodafone9166.9112491.18 Wind128.82136100.00

20 PROC UNIVARIATE - Descrizione La PROC UNIVARIATE permette di calcolare misure di sintesi di posizione, variabilità, forma per variabili quantitative continue

21 proc univariate data= dataset options; var variabile; run; Distribuzione di frequenza univariata PROC UNIVARIATE – Sintassi 1/2 OPTIONS: noprint non mostra i risultati nella finestra di output

22 PROC UNIVARIATE – Esempio 1 Misure di sintesi della variabile quantitativa discreta numero medio sms inviati al giorno proc univariate data=corso.telefonia; var num_sms_e; run;

23 Output PROC UNIVARIATE (1/5) Basic Statistical Measures LocationVariability Mean24.31356Std Deviation28.46175 Median10.00000Variance810.07147 Mode10.00000Range100.00000 Interquartile Range25.00000 Misure di tendenza centrale Media aritmetica: somma dei valori diviso il numero di valori Mediana: in una lista ordinata, la mediana è il valore centrale (50% sopra, 50% sotto) Moda: valore che occorre più frequentemente

24 Output PROC UNIVARIATE (2/5) Misure di Variabilità Scarto Quadratico Medio [Std Deviation] : mostra la variabilità rispetto alla media Varianza [Variance] : media dei quadrati delle differenze fra ciascuna osservazione e la media Campo di Variazione [Range] : differenza tra il massimo e il minimo dei valori osservati Differenza Interquartile [Interquartile Range] : 3° quartile – 1° quartile 25.00000Interquartile Range 100.00000Range10.00000Mode 810.07147Variance10.00000Median 28.46175Std Deviation24.31356Mean VariabilityLocation Basic Statistical Measures

25 Output PROC UNIVARIATE (3/5) Quantiles (Definition 5) QuantileEstimate 100% Max100 99%100 95%100 90%70 75% Q330 50% Median10 25% Q15 10%2 5%2 1%1 0% Min0 Il primo quartile, Q 1, è il valore per il quale il 25% delle osservazioni sono minori di esso e il 75% sono maggiori Q 2 coincide con la mediana (50% sono minori, 50% sono maggiori) Il terzo quartile, Q3, è il valore per il quale il 75% delle osservazioni sono minori di esso e il 25% sono maggiori I Quartili dividono la sequenza ordinata dei dati in 4 segmenti contenenti lo stesso numero di valori

26 Output PROC UNIVARIATE (4/5) Coeff di variazione [Coeff Variation] : misura la variabilità relativa rispetto alla media (%) 1.85270242Std Error Mean117.061242Coeff Variation 190366.797Corrected SS329878Uncorrected SS 1.44200254Kurtosis1.59619131Skewness 810.071475Variance28.4617546Std Deviation 5738Sum Observations24.3135593Mean 236Sum Weights236N Moments

27 Output PROC UNIVARIATE (5/5) 1.85270242Std Error Mean117.061242Coeff Variation 190366.797Corrected SS329878Uncorrected SS 1.44200254Kurtosis1.59619131Skewness 810.071475Variance28.4617546Std Deviation 5738Sum Observations24.3135593Mean 236Sum Weights236N Moments Skewness: indice che informa circa il grado di simmetria o asimmetria di una distribuzione –γ=0 distribuzione simmetrica –γ media) –γ>0 asimmetria positiva (mediana3 se la distribuzione è ipernormale

28 PROC UNIVARIATE – Esempio 2 Misure di sintesi della variabile quantitativa continua numero medio ore utilizzo al giorno telefono cellulare proc univariate data=corso.telefonia; var cell_h; run;

29 PROC UNIVARIATE – Sintassi 2/2 Distribuzione di frequenza univariata con variabile di classificazione proc univariate data= dataset options; class variabile_1 (options); var variabile_2; run; OPTIONS: noprint non mostra i risultati nella finestra di output (missing) considera anche la categoria missing (contenente tutti i valori mancanti) della variabile di classificazione

30 PROC UNIVARIATE – Esempio 3 Misure di sintesi della variabile numero medio ore utilizzo al giorno telefono cellulare suddivisa per sesso proc univariate data=corso.telefonia; class sesso; var cell_h; run;

31 PROC UNIVARIATE – Esempio 4 Misure di sintesi della variabile numero medio ore utilizzo al giorno telefono cellulare suddivisa per hobby con opzione missing proc univariate data=corso.telefonia; class hobby_3(missing); var cell_h; run;

32 Mediana (Q2) X massimo X minimo Q1Q3 25% 25% Sequenza ordinata di valori assunti da una variabile Differenza Interquartile OUTLIERS: Q1 - 1,5 * Differenza interquartile Q3 + 1,5 * Differenza interquartile BOX PLOT

33 SAS INSIGHT: Box Plot (1/2)

34 SAS INSIGHT: Box Plot (2/2)


Scaricare ppt "Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3."

Presentazioni simili


Annunci Google