Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
1
Questionario e Analisi Univariata
Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°2
2
Questionario Per redigere un questionario è necessario tener presenti i seguenti punti: ogni questionario somministrato deve avere un codice identificativo univoco solo domande chiuse (cioè con un insieme di modalità definite) sono ammesse le domande a risposta multipla raccogliere informazioni di carattere quantitativo (necessario per costruire modelli statistici consistenti) tipologia dei dati strutturali (che descrivono l’intervistato, ad esempio l’età) di indagine
3
Dal questionario al Data Set
Costruire la variabile n_questionario che associa un codice univoco ad ogni intervistato. Identificare ogni variabile con un nome facilmente riconducibile alla domanda corrispondente (ad esempio la domanda n°1 corrisponde alla variabile D_1). Nel caso di domande a risposte multiple andranno create un numero di variabili dicotomiche (0/1) pari al numero di modalità definite nella risposta. Data Entry: controllo correttezza dei dati inseriti e analisi delle distribuzioni delle variabili (con valenza di controllo e valenza interpretativa).
4
Domande a risposte multiple
17. Per quale motivo utilizza il telefono cellulare? (possibile fornire massimo 3 risposte) 1) Lavoro 2) Studio 3) Comunicare con famigliari 4) Comunicare con il partner 5) Piacere/tempo libero 6) Altro D_17_1 D_17_2 D_17_3 D_17_4 D_17_5 D_17_6 n_questionario … D_17_1 D_17_2 D_17_3 D_17_4 D_17_5 D_17_6 45 …. 1
5
Esempio di questionario
Obiettivo di analisi: studiare il comportamento di consumo del campione rilevato (dai 14 ai 32 anni) in relazione all’utilizzo del servizio “tariffa telefonica”. I dati raccolti sono relativi ad un indagine di mercato realizzata nei mesi Aprile-Maggio 2007 I questionari sono stati somministrati in forma cartacea presso alcune scuole superiori/università o per via telematica ( ) Le interviste raccolte e analizzate sono in totale 243
6
Analisi Univariata
7
PROC FREQ - Descrizione
La PROC FREQ permette di calcolare le distribuzioni di frequenza univariate per variabili qualitative e quantitative discrete
8
PROC FREQ – Sintassi generale 1/2
Distribuzione di frequenza univariata proc freq data= dataset option(s); tables variabile /option(s); run; OPTIONS: noprint non mostra i risultati nella finestra di output /missing considera anche i missing nel calcolo delle frequenze
9
PROC FREQ – Sintassi generale 2/2
Distribuzione di frequenza univariata con variabile di classificazione proc freq data= dataset option(s); by variabile_1; tables variabile_2 /option(s); run;
10
PROC FREQ: Esempio 1 Variabile qualitativa: operatore telefonico
proc freq data=corso.telefonia; table operatore; run;
11
Output PROC FREQ Frequenza assoluta: consiste nell’associare a ciascuna categoria, o modalità, il numero di volte in cui compare nei dati Frequenza relativa: rapporto tra la frequenza assoluta ed il numero complessivo delle osservazioni effettuate Frequenze cumulate 100.00 236 6.36 15 Wind 93.64 221 65.25 154 Vodafone 28.39 67 23.31 55 Tim 5.08 12 3 Cumulative Percent Cumulative Frequency Percent Frequency operatore
12
PROC FREQ: Esempio 2 Variabile quantitativa discreta:
numero medio giorni utilizzo alla settimana telefono fisso proc freq data=corso.telefonia; table fisso_g; run;
13
Output PROC FREQ fisso_g Frequency Percent Cumulative Frequency
Cumulative Percent 27 11.44 0.5 9 3.81 36 15.25 1 10 4.24 46 19.49 2 19 8.05 65 27.54 3 21 8.90 86 36.44 4 14 5.93 100 42.37 5 119 50.42 6 128 54.24 7 108 45.76 236 100.00
14
PROC FREQ: Esempio 3 Variabile qualitativa:
secondo motivo utilizzo mezzi di comunicazione proc freq data=corso.telefonia; table motivo_utilizzo_2 / missing; run; OPZIONE missing: considera anche i missing nel calcolo delle frequenze
15
Output PROC FREQ 100.00 236 8.47 20 Studio 91.53 216 54.24 128
Piacere/Tempo libero 37.29 88 9.32 22 Partner 27.97 66 16.95 40 Famigliari 11.02 26 0.85 2 Altro 10.17 24 Cumulative Percent Cumulative Frequency Percent Frequency motivo_utilizzo_2 MISSING
16
PROC FREQ: Esempio 4 Distribuzione di frequenza univariata con variabile di classificazione PROC SORT: ordinare le osservazioni in base alla variabile di by proc sort data=corso.telefonia; by sesso; run; proc freq data=corso.telefonia; tables operatore;
17
Output PROC FREQ sesso=F sesso=M operatore Frequency Percent
Cumulative Frequency Cumulative Percent 3 7 7.00 Tim 27 27.00 34 34.00 Vodafone 63 63.00 97 97.00 Wind 3.00 100 100.00 sesso=M operatore Frequency Percent Cumulative Frequency Cumulative Percent 3 5 3.68 Tim 28 20.59 33 24.26 Vodafone 91 66.91 124 91.18 Wind 12 8.82 136 100.00
18
PROC UNIVARIATE - Descrizione
La PROC UNIVARIATE permette di calcolare distribuzioni di frequenza univariate per variabili quantitative continue misure di sintesi di posizione, variabilità, forma per variabili quantitative continue
19
PROC UNIVARIATE – Sintassi 1/2
Distribuzione di frequenza univariata proc univariate data= dataset option(s); var variabile; run; OPTIONS: noprint non mostra i risultati nella finestra di output
20
PROC UNIVARIATE – Sintassi 2/2
Distribuzione di frequenza univariata con variabile di classificazione proc univariate data= dataset option(s); class variabile_1 (option(s)); var variabile_2; run; OPTIONS: noprint non mostra i risultati nella finestra di output (missing) considera anche la categoria “missing” (contenente tutti i valori mancanti) della variabile di classificazione
21
PROC UNIVARIATE – Esempio 1
Misure di sintesi della variabile quantitativa discreta numero medio sms inviati al giorno proc univariate data=corso.telefonia; var num_sms_e; run;
22
Output PROC UNIVARIATE (1/2)
Media aritmetica: somma dei valori diviso il numero di valori Mediana: in una lista ordinata, la mediana è il valore “centrale” (50% sopra, 50% sotto) Moda: valore che occorre più frequentemente Basic Statistical Measures Location Variability Mean Std Deviation Median Variance Mode Range Interquartile Range
23
Output PROC UNIVARIATE (2/2)
Quantiles (Definition 5) Quantile Estimate 100% Max 100 99% 95% 90% 70 75% Q3 30 50% Median 10 25% Q1 5 10% 2 5% 1% 1 0% Min I Quartili dividono la sequenza ordinata dei dati in 4 segmenti contenenti lo stesso numero di valori Il primo quartile, Q1, è il valore per il quale 25% delle osservazioni sono minori e 75% sono maggiori di esso Q2 coincide con la mediana (50% sono minori, 50% sono maggiori) Solo 25% delle osservazioni sono maggiori del terzo quartile
24
PROC UNIVARIATE – Esempio 2
Misure di sintesi della variabile quantitativa continua numero medio ore utilizzo al giorno telefono cellulare proc univariate data=corso.telefonia; var cell_h; run;
25
PROC UNIVARIATE – Esempio 3
Misure di sintesi della variabile numero medio ore utilizzo al giorno telefono cellulare suddivisa per sesso proc univariate data=corso.telefonia; class sesso; var cell_h; run;
26
PROC UNIVARIATE – Esempio 4
Misure di sintesi della variabile numero medio ore utilizzo al giorno telefono cellulare suddivisa per hobby con opzione “missing” proc univariate data=corso.telefonia; class hobby_3(missing); var cell_h; run;
27
SAS INSIGHT: Box Plot (1/2)
28
SAS INSIGHT: Box Plot (2/2)
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.