Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi Univariata.

Slides:



Advertisements
Presentazioni simili
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
Advertisements

QUANTILI.
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
Scale di misura delle variabili
STATISTICA DESCRITTIVA
Le misure di tendenza centrale informano sul centro della distribuzione 4 - Le medie a.a Le medie a.a
Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita.
Lez. 3 - Gli Indici di VARIABILITA’
Analisi preliminari dei dati
Descrizione dei dati Metodi di descrizione dei dati
C – Indici di Asimmetria e Curtosi
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4.
Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia l’analisi statistica.
Statistica descrittiva
Introduzione alla statistica per la ricerca Lezione I
Come descrivere un fenomeno in ambito sanitario: fondamenti di statistica descrittiva Brugnaro Luca.
Come descrivere un fenomeno in ambito sanitario: fondamenti di statistica descrittiva Brugnaro Luca.
Misurazione Le osservazioni si esprimono in forma di misurazioni
Nicola Paparella, Università degli Studi, Lecce, aprile 2006 Pedagogia sperimentale Note ed appunti Corso di base / 5
Pedagogia sperimentale
METODI E CONTROLLI STATISTICI DI PROCESSO
Statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Simone Mosca & Daniele Zucchini 4Bi.
INDICE I VALORI MEDI LA MEDIA GEOMETRICA LA MEDIA ARITMETICA
La Variabilità e La Concentrazione
Sintesi della lezione Il concetto di variabilità Campo di variazione Differenza interquartile La varianza La deviazione standard Scostamenti medi VARIABILITA’
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Statistica La statistica è
Analisi Univariata & Esercizi
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Gli indici di dispersione
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
COSA VUOL DIRE FARE STATISTICA
Accenni di analisi monovariata e bivariata
Strumenti statistici in Excell
Martina Serafini Martina Prandi
Elementi di statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
A.A STATISTICA E CALCOLO DELLE PROBABILITA’ Docenti: Stefania Mignani Maurizio Brizzi.
ANALISI E INTERPRETAZIONE DATI
STATISTICHE DESCRITTIVE
TRATTAMENTO STATISTICO DEI DATI ANALITICI
STATISTICA P IA F ONDAZIONE DI C ULTO E R ELIGIONE C ARD. G. P ANICO Azienda Ospedaliera CORSO DI LAUREA IN INFERMIERISTICA Sr. Margherita Bramato.
1 Cosa vuol dire fare statistica ? La statistica è la scienza che ha come fine lo studio quantitativo e qualitativo di fenomeni collettivi. “il profitto.
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Analisi delle osservazioni
Gli Indici di VARIABILITA’
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Quantitative Market Research Set-up Protocol
Quantitative Market Research Set-up Protocol
Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3.
Transcript della presentazione:

Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi Univariata

Business Aim Targeted population Choice of sample Fieldwork Data Audit Data Analysis Presentation Characters to be assesed Sampling error Techniques of data collection Set-up questionnarie Pre-test questionnarie Quantitative Market Research Set-up Protocol

Qualitative –Nominal it’s used for qualitative data which are classified in defined categories with no a specific order. –Ordinal the categories have got a specific order; it does not enable to define any numeric assessment. Quantitative –Ratio scale through this type of data it is possible to determine the different ratio between one category and an other; the value “0” of the scale is set. –Interval scale has the same characteristics as the previous scale, even though it has not got a fixed value “0”. Type of data Type of data guides the analyses Most of the quantitative methods deal with quantitative data

Tipologie di dati Qualitativi dati espressi in forma verbale, solitamente classificati in categorie Quantitativi dati espressi in forma numerica. si distinguono in: –discreti dati caratterizzati da una quantità finita o infinita numerabile di classi di misura –continui risposta numerica derivamte da un processo di misurazione che fornisce indicazioni puntuali all’interno di un continuum Territoriali Date

Nominale usato per dati qualitativi, che vengono così classificati in categorie distinte senza alcun ordine implicito (es. professione del cliente) Ordinale le categorie presentano un ordine implicito; consente di stabilire una relazione d’ordine tra le diverse categorie, ma nessuna asserzione numerica, ovvero si può dire che un determinato valore è più grande di un altro, ma non di quanto Tipologie di dati qualitativi

Scala di rapporti con questa tipologia si può dire di quanto una categoria è maggiore di un’altra; è fissato un valore “0” della scala. es. Le variabili spesa media e tempo impiegato sono misurate a livello di rapporto,ovvero rientrano in una scala di valutazione comparativa Tipologie di dati quantitativi

Scala di intervalli presenta le stesse caratteristiche della precedente, ma non possiede un valore “0” fissato. es. In una indagine sui clienti di un supermercato, il loro livello di soddisfazione può essere adeguatamente rappresentato mediante una scala di valutazione compresa tra 1 e 9, ciò che posso asserire è che la differenza tra 2 e 3 è la medesima di quella tra 8 e 9, ma non che 8 sia il doppio di 4. Tipologie di dati quantitativi La tipologia di dati guida l’analisis

L’analisi statistica dei dati Statistica descrittiva insieme dei metodi che riguardano la rappresentazione e sintesi di un insieme di dati al fine di evidenziarne le caratteristiche principali Statistica inferenziale insieme dei metodi che permettono la stima di una caratteristica di una popolazione basandosi sull’analisi di un campione Totalità degli elementi presi in esame dalla indagine La parte di popolazione selezionata per l’analisi Misura riassuntiva, calcolata sui dati campionari, utile per descrivere una caratteristica non nota della popolazione

Univariate descriptive statistics In the univariate descriptive statistics we analyze one variable at a time. Frequency distribution Synthesis measures –Measures of location –Measures of spread –Measures of shape ………… Data Audit –Input errors –Missing values –Outliers Basic insights

Le distribuzioni di frequenza Frequenza assoluta: è un primo livello di sintesi dei dati- consiste nell’associare a ciascuna categoria, o modalità, il numero di volte in cui compare nei dati Distribuzione di frequenza: insieme delle modalità e delle loro frequenze Frequenza relativa: rapporto tra la frequenza assoluta ed il numero complessivo delle osservazioni effettuate. I due tipi di frequenze vengono usati con dati quantitativi, qualitativi ordinali, quantitativi discreti. p i = n i / N

Rappresentazione grafica var.qualitative: Diagr. a barre: nell’asse delle ascisse ci sono le categorie, senza un ordine preciso; in quello delle ordinate le frequenze assolute/relative corrispondenti alle diverse modalità Diagr. a torta: la circonferenza è divisa proporzionalmente alle frequenze Diagramma a torta Le distribuzioni di frequenza

Rappresentazione grafica var.quantitative discrete: Diagr. delle frequenze: nell’asse delle ascisse ci sono i valori assunti dalla var. discreta (quindi ha un significato quantitativo); l’altezza delle barre è proporzionale alle frequenze relative o assolute del valore stesso Istogramma:nell’asse delle ascisse ci sono le classi degli intervalli considerati; l’asse delle ordinate rappresenta la densità di frequenza; l’area del rettangolo corrisponde alla frequenza della classe stessa. Le distribuzioni di frequenza

Misure di sintesi Misure di tendenza centrale: Media aritmetica Mediana Moda Misure di tendenza non centrale: Quantili Percentili Misure di dispersione: Campo di variazione Differenza interquantile Varianza Scarto quadratico medio Coefficiente di variazione Misure di forma della distribuzione: Skewness Kurtosis

Misure di Tendenza Centrale Tendenza Centrale MediaMediana Moda Valore centrale delle osservazioni ordinate Valore più frequente Media Aritmetica

La misura di tendenza centrale più comune Media = somma dei valori diviso il numero di valori Influenzata da valori estremi (outlier) Media = Media = 4

Mediana In una lista ordinata, la mediana è il valore “centrale” (50% sopra, 50% sotto) Non influenzata da valori estremi Mediana = Mediana = 3

Moda Valore che occorre più frequentemente Non influenzata da valori estremi Usata sia per dati numerici che categorici Può non esserci una moda Ci può essere più di una moda Moda = No Moda

I Quartili dividono la sequenza ordinata dei dati in 4 segmenti contenenti lo stesso numero di valori 25% Il primo quartile, Q 1, è il valore per il quale 25% delle osservazioni sono minori e 75% sono maggiori di esso Q 2 coincide con la mediana (50% sono minori, 50% sono maggiori) Solo 25% delle osservazioni sono maggiori del terzo quartile Q1Q2Q3 Misure di Tendenza Non Centrale

Box Plot Mediana (Q2) X massimo X minimo Q1Q3 25% 25% Differenza Interquartile 57 – 30 = 27 OUTLIERS: Q1 - 1,5 * Differenza interquartile Q3 + 1,5 * Differenza interquartile

Stesso centro, diversa variabilità Misure di Variabilità Variabilità Varianza Scarto Quadratico Medio Coefficiente di Variazione Campo di Variazione Differenza Interquartile Le misure di variabilità forniscono informazioni sulla dispersione o variabilità dei valori.

Campo di Variazione La più semplice misura di variabilità Differenza tra il massimo e il minimo dei valori osservati: Campo di variazione = X massimo – X minimo Campo di Variazione = = 13 Esempio:

Ignora il modo in cui i dati sono distribuiti Sensibile agli outlier Campo di Var. = = Campo di Var. = = 5 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120 Campo di Var. = = 4 Campo di Var = = 119 Campo di Variazione

Differenza Interquartile Possiamo eliminare il problema degli outlier usando la differenza interquartile Elimina i valori osservati più alti e più bassi e calcola il campo di variazione del 50% centrale dei dati Differenza Interquartile = 3 o quartile – 1 o quartile IQR = Q 3 – Q 1

Media dei quadrati delle differenze fra ciascuna osservazione e la media –Varianza della Popolazione: Varianza dove = media della popolazione N = dimensione della popolazione x i = i imo valore della variabile X

Scarto Quadratico Medio Misura di variabilità comunemente usata Mostra la variabilità rispetto alla media Ha la stessa unità di misura dei dati originali –Scarto Quadratico Medio della Popolazione:

Scarto quadratico medio piccolo Scarto quadratico medio grande Scarto Quadratico Medio

Media = 15.5 s = Dati B Dati A Media = 15.5 s = Media = 15.5 s = Dati C Scarto Quadratico Medio

Viene calcolato usando tutti i valori nel set di dati Valori lontani dalla media hanno più peso (poichè si usa il quadrato delle deviazioni dalla media) Le stesse considerazioni valgono anche per il calcolo della Varianza Scarto Quadratico Medio

Coefficiente di Variazione Misura la variabilità relativa Sempre in percentuale (%) Mostra la variabilità relativa rispetto alla media Può essere usato per confrontare due o più set di dati misurati con unità di misura diversa

Azione A: –Prezzo medio scorso anno = $50 –Scarto Quadratico Medio = $5 Azione B: –Prezzo medio scorso anno = $100 –Scarto Quadratico Medio = $5 Entrambe le azioni hanno lo stesso scarto quadratico medio, ma l’azione B è meno variabile rispetto al suo prezzo Coefficiente di Variazione

Forma della Distribuzione La forma della distribuzione si dice simmetrica se le osservazioni sono bilanciate, o distribuite in modo approssimativamente regolare attorno al centro.

La forma della distribuzione è detta asimmetrica se le osservazioni non sono distribuite in modo simmetrico rispetto al centro. Una distribuzione con asimmetria positiva (obliqua a destra) ha una coda che si estende a destra, nella direzione dei valori positivi. Una distribuzione con asimmetria negativa (obliqua a sinistra) ha una coda che si estende a sinistra, nella direzione dei valori negativi. Forma della Distribuzione

Descrive come i dati sono distribuiti Misure della forma –Simmetrica o asimmetrica Media = Mediana Media < Mediana Mediana < Media Obliqua a destra Obliqua a sinistra Simmetrica Misure di Forma della Distribuzione

Skewness: indice che informa circa il grado di simmetria o asimmetria di una distribuzione. –γ=0 ditribuzione simmetrica; –γ media); –γ>0 asimmetria positiva (mediana<media). Kurtosis: indice che permette di verificare se i dati seguono una distribuzione di tipo Normale (simmetrica). –β=3 se la distribuzione è “Normale”; –β<3 se la distribuzione è iponormale (rispetto alla distribuzione di una Normale ha densità di frequenza minore per valori molto distanti dalla media); –β>3 se la distribuzione è ipernormale (rispetto alla distribuzione di una Normale ha densità di frequenza maggiore per i valori molto distanti dalla media). Misure di Forma della Distribuzione

Basic Statistical Measures LocationVariability Mean Std Deviation Median Variance6563 Mode0.0000Range Interquartile Range IMPORTO NETTO UNITARIO

Basic Statistical Measures LocationVariability Mean Std Deviation Median Variance4134 Mode Range Interquartile Range IMPORTO NETTO UNITARIO