Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.

Slides:



Advertisements
Presentazioni simili
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
Advertisements

Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
LA VARIABILITA’ IV lezione di Statistica Medica.
Variabili casuali a più dimensioni
Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita.
Lez. 3 - Gli Indici di VARIABILITA’
Analisi preliminari dei dati
Descrizione dei dati Metodi di descrizione dei dati
C – Indici di Asimmetria e Curtosi
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Analisi Bivariata e Test Statistici
Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3.
Questionario - Analisi Univariata e Bivariata
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4.
Esercizio 1 In una indagine statistica si vuole rilevare il numero di cellulari posseduti dagli studenti iscritti alla facoltà di economia. Si dica: -
Corso di Calcolo delle Probabilità e Statistica II Parte – STATISTICA
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
COSA VUOL DIRE FARE STATISTICA
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Statistica La statistica è
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Gli indici di dispersione
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
COSA VUOL DIRE FARE STATISTICA
Accenni di analisi monovariata e bivariata
Strumenti statistici in Excell
Corso di Analisi Statistica per le Imprese Indici di variabilita’ ed eterogeneita’ Prof. L. Neri a.a
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi Univariata.
Esercizio 1: 1) La seguente distribuzione riporta i punteggi di ansia misurata su studenti di psicometria:
ORIENTAMENTO CONSAPEVOLE
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
A.A STATISTICA E CALCOLO DELLE PROBABILITA’ Docenti: Stefania Mignani Maurizio Brizzi.
Elaborazione statistica di dati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Accenni di analisi monovariata e bivariata
ANALISI E INTERPRETAZIONE DATI
STATISTICHE DESCRITTIVE
TRATTAMENTO STATISTICO DEI DATI ANALITICI
 In questa parte del nostro lavoro andremo ad analizzare i dati relativi ai consumi delle famiglie presenti nel sito ISTAT. I comportamenti di consumo.
analisi bidimensionale #2
STATISTICA P IA F ONDAZIONE DI C ULTO E R ELIGIONE C ARD. G. P ANICO Azienda Ospedaliera CORSO DI LAUREA IN INFERMIERISTICA Sr. Margherita Bramato.
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Direzione Centrale Gestione Tributi Customer Satisfaction 2015 RLI web.
Accenni di analisi monovariata e bivariata. ANALISI MONOVARIATA Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle.
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Analisi delle osservazioni
Classi di addettiF >2504 La seguente tabella riporta la distribuzione di 100 aziende per classi di addetti. a.Si calcoli:
Gli Indici di VARIABILITA’
Statistica descrittiva bivariata
Statistica descrittiva bivariata
Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3.
Transcript della presentazione:

Metodi Quantitativi per Economia, Finanza e Management Lezione n°6

Statistica descrittiva univariata Nella statistica descrittiva univariata possiamo trovare due principali metodologie usate per rappresentare i dati analizzati: Distribuzioni di frequenza Misure di sintesi: –Misure di tendenza centrale e non centrale; –Misure di dispersione; –Misure della forma della distribuzione

Misure di sintesi Misure di tendenza centrale: Media aritmetica Mediana Moda Misure di tendenza non centrale: Quantili Percentili Misure di dispersione: Campo di variazione Differenza interquantile Varianza Scarto quadratico medio Coefficiente di variazione Misure di forma della distribuzione: Skewness Kurtosis

Box Plot Mediana (Q2) X massimo X minimo Q1Q3 25% 25% Differenza Interquartile 57 – 30 = 27 OUTLIERS: Q1 - 1,5 * Differenza interquartile Q3 + 1,5 * Differenza interquartile

Stesso centro, diversa variabilità Misure di Variabilità Variabilità Varianza Scarto Quadratico Medio Coefficiente di Variazione Campo di Variazione Differenza Interquartile Le misure di variabilità forniscono informazioni sulla dispersione o variabilità dei valori.

Scarto quadratico medio piccolo Scarto quadratico medio grande Scarto Quadratico Medio

Media = 15.5 s = Dati B Dati A Media = 15.5 s = Media = 15.5 s = Dati C Scarto Quadratico Medio

Viene calcolato usando tutti i valori nel set di dati Valori lontani dalla media hanno più peso (poichè si usa il quadrato delle deviazioni dalla media) Le stesse considerazioni valgono anche per il calcolo della Varianza Scarto Quadratico Medio

Coefficiente di Variazione Misura la variabilità relativa Sempre in percentuale (%) Mostra la variabilità relativa rispetto alla media Può essere usato per confrontare due o più set di dati misurati con unità di misura diversa

Azione A: –Prezzo medio scorso anno = $50 –Scarto Quadratico Medio = $5 Azione B: –Prezzo medio scorso anno = $100 –Scarto Quadratico Medio = $5 Entrambe le azioni hanno lo stesso scarto quadratico medio, ma l’azione B è meno variabile rispetto al suo prezzo Coefficiente di Variazione

Forma della Distribuzione La forma della distribuzione si dice simmetrica se le osservazioni sono bilanciate, o distribuite in modo approssimativamente regolare attorno al centro.

La forma della distribuzione è detta asimmetrica se le osservazioni non sono distribuite in modo simmetrico rispetto al centro. Una distribuzione con asimmetria positiva (obliqua a destra) ha una coda che si estende a destra, nella direzione dei valori positivi. Una distribuzione con asimmetria negativa (obliqua a sinistra) ha una coda che si estende a sinistra, nella direzione dei valori negativi. Forma della Distribuzione

Descrive come i dati sono distribuiti Misure della forma –Simmetrica o asimmetrica Media = Mediana Media < Mediana Mediana < Media Obliqua a destra Obliqua a sinistra Simmetrica Misure di Forma della Distribuzione

Skewness: indice che informa circa il grado di simmetria o asimmetria di una distribuzione. –γ=0 ditribuzione simmetrica; –γ media); –γ>0 asimmetria positiva (mediana<media). Kurtosis: indice che permette di verificare se i dati seguono una distribuzione di tipo Normale (simmetrica). –β=3 se la distribuzione è “Normale”; –β<3 se la distribuzione è iponormale (rispetto alla distribuzione di una Normale ha densità di frequenza minore per valori molto distanti dalla media); –β>3 se la distribuzione è ipernormale (rispetto alla distribuzione di una Normale ha densità di frequenza maggiore per i valori molto distanti dalla media). Misure di Forma della Distribuzione

Basic Statistical Measures LocationVariability Mean Std Deviation Median Variance6563 Mode0.0000Range Interquartile Range IMPORTO NETTO UNITARIO

Basic Statistical Measures LocationVariability Mean Std Deviation Median Variance4134 Mode Range Interquartile Range IMPORTO NETTO UNITARIO

Analisi di Concentrazione Equidistribuzione: Max concentrazione: Per caratteri quantitativi trasferibili 2. Calcolare le quantità: 1. Ordinare le osservazioni

20% 50% 60% 90% Analisi di Concentrazione

20% 40% Analisi di Concentrazione

Ricerca di mercato “I biscotti”

Agenda Obiettivi della ricerca Descrizione del database Questionario di rilevazione Statistica descrittiva univariata Segmentazione a posteriori per omogeneità –Modalità classica Analisi Fattoriale Cluster Analysis –Modalità flessibile  Conjoint Analysis  Cluster Analysis Analisi Discriminante Lineare Conclusioni

Obiettivi della ricerca Indagine del comportamento dei consumatori in merito all’acquisto e al consumo di biscotti tramite l’applicazione di opportune tecniche di analisi statistica Individuazione di possibili azioni manageriali da parte delle aziende produttrici di biscotti

Descrizione del database Il database “DB Biscotti” contiene dati relativi ad una indagine di mercato realizzata nell’anno 2005 (nel corso del mese di Aprile) relativamente all’acquisto e al consumo di biscotti Si tratta di interviste personali realizzate a persone con età maggiore di 18 anni Il numero di interviste realizzate sono in totale 221 Il database contiene 2 tipologie di variabili: –Qualitative –Quantitative Le prime (sesso, età, dove acquista abitualmente i biscotti, etc..) sono state ricodificate e trasformate da stringhe a numeriche

Questionario di rilevazione 1.Informazioni sulle abitudini di consumo/acquisto In questa fase vengono rilevate le abitudini di acquisto dell’intervistato in relazione a: -occasione in cui consuma biscotti -luogo in cui consuma biscotti -chi acquista biscotti in famiglia -dove acquista biscotti -con quale frequenza acquista biscotti 2.Valutazione degli attributi rilevanti nell’atto di acquisto dei biscotti Si tratta di 20 attributi caratterizzanti la categoria di riferimento su cui ogni intervistato ha espresso un giudizio di importanza nel momento della scelta del prodotto, su una scala da 1 a 9 (1= gradimento minimo, 9= gradimento massimo) 3.Esplicitazione dell’insieme evocato E’ stato chiesto ad ogni intervistato di citare liberamente 3 marche di biscotti 4.Valutazione della soddisfazione dell’ultima marca di biscotti acquistata Sui medesimi 20 attributi ed in riferimento all’ultima marca acquistata il campione ha espresso una valutazione del grado di soddisfazione su una scala da 1 a 9 (1= gradimento minimo, 9= gradimento massimo)

Questionario di rilevazione 5.Informazioni extra sul comportamento del consumatore Marca preferita Grado di coinvolgimento nell’acquisto Attenzione al messaggio pubblicitario 6.Informazioni socio-demografiche In questa fase vengono rilevate le informazioni socio-demografiche dell’intervistato Sesso Età Status familiare Professione Titolo di studio

Abitudini di consumo/acquisto Quando consuma abitualmente biscotti E’ stata data la possibilità di fornire al massimo 2 risposte, ma solo il 55% del campione ne ha usufruito Si è compreso che i biscotti vengono consumati prevalentemente per la prima colazione (85,5% - risp. 1) e nell’arco della giornata, sia come snack a merenda (25,3% – risp. 2), sia come dessert dopo cena (12,2% - risp. 2)

Abitudini di consumo/acquisto Dove consuma abitualmente biscotti Anche per questa domanda erano consentite al massimo 2 risposte, ma solo il 38.9% degli intervistati le ha fornite entrambe Per il 96.4% (risp. 1) del campione il luogo preferito dove consumare biscotti è la casa Si evidenzia una sostanziale omogeneità in merito alle altre opzioni di risposta

Abitudini di consumo/acquisto Chi acquista biscotti in famiglia Con quale frequenza acquista biscotti Si osserva che nella maggioranza dei casi (64.3%) i biscotti vengono acquistati direttamente dal consumatore o da un parente stretto  genitore (21.7%)  coniuge (13.6%) Si evidenziano 2 tendenze  Acquisto frequente (62,9% - percentuale cumulata di “Più di una volta a settimana” e “Una volta a settimana”)  Acquisto sporadico (37,1% - percentuale cumulata di “Meno di una volta a settimana” e “Una volta al mese”)

Abitudini di consumo/acquisto Dove acquista abitualmente i biscotti Solo il 34,4% degli intervistati ha dato una seconda risposta Come prevedibile, nella grande maggioranza dei casi l’acquisto di biscotti avviene nel supermercato; solo in un secondo momento si sposta dal fornaio e in pasticceria Si sottolinea come le opzioni “bar” e “distributori automatici” siano state selezionate nella sola risp. 2 rispettivamente dal 5% e dal 2,7% del campione

Insieme evocato Appare evidente la netta predominanza di marche industriali, soprattutto Mulino Bianco Tale risultato è probabilmente diretta conseguenza della strategia aziendale fortemente focalizzata su pubblicità e comunicazione Mulino Bianco, Pavesi e Saiwa che solitamente preferiscono il canale televisivo hanno ottenuto valori marcatamente più alti rispetto a Galbusera, che invece privilegia il mezzo stampa Prima marca ricordata Seconda marca ricordata Terza marca ricordata Galbusera10,4%9,5%6,3% Mulino Bianco 58,4%16,7%10% Pavesi6,8%18,6%16,7% Saiwa9%14,9%16,7%

Informazioni extra Marca preferita Oltre la metà del campione ha una marca preferita (57.9%) Si evidenzia un sostanziale apprezzamento della marca preferita tanto che gli intervistati dichiarano di essere intenzionati a continuare ad acquistare tale marca Più discordanti sono le risposte in merito alla disponibilità a pagare un prezzo più alto. Si registra in questo caso un alto valore di Std. Deviation

Informazioni extra Grado di coinvolgimento I consumatori sono mediamente attenti alla scelta del prodotto (mean 6,74) e non scelgono la prima marca che capita (mean 2.68) Secondo il campione, le marche non propongono prodotti simili (mean 4.35) Dati i risultati in merito a “Scelgo tra le marche che trovo nel punto vendita” si deduce che esistono comportamenti di consumo contrastanti (Std. Deviation 2,319) – Alcuni si adeguano alle marche presenti nel punto vendita – Altri non acquistano se non trovano la loro marca preferita In media al consumatore piace provare marche diverse nonostante comportamenti di fedeltà alla marca (ampia Std. Deviation)

Informazioni extra Attenzione al messaggio pubblicitario La pubblicità non risulta essere un fattore determinante nella scelta del biscotto Si pone una maggiore attenzione al messaggio pubblicitario quale fonte di informazioni utili relativamente al prodotto Tale risultato è in netta contraddizione con quanto precedentemente esplicitato in merito all’insieme evocato. Si ritiene che l’intervistato non abbia espressamente voluto ammettere di farsi influenzare dalla pubblicità. Si suggerisce a questo punto una ricerca esplorativa di tipo qualitativo

Variabili socio-demografiche Sesso, Età, Status familiare Il campione intervistato è costituito in prevalenza da donne (61%) Si evidenzia la presenza di 2 principali gruppi di intervistati  I single (più della metà del campione)  Le coppie (in prevalenza quelle senza figli) La percentuale di nuclei famigliari allargati è invece residuale Per quanto riguarda l’età, gli individui sono distribuiti in modo sostanzialmente equilibrato fra le fasce proposte

Variabili socio-demografiche Professione La percentuale di studenti è molto alta (32.1% ) ed è coerente con il dato relativo all’età secondo cui i giovani tra i 18 e i 25 rappresentano il 35% del campione La categoria impiegato/a raggiunge una percentuale pari al 27.2%; ciò dipende dal fatto che il termine racchiude varie tipologie di lavoratori (dall’impiegato di banca al ragioniere, al dipendente della pubblica amministrazione) Le altre professioni sono presenti in modo omogeneo

Variabili socio-demografiche Titolo di studio Il livello culturale è medio-alto. Infatti oltre il 50% delle persone intervistate ha conseguito un diploma di scuola media superiore, circa il 30% è laureato, mentre solo il 4% ha ottenuto un master post-laurea Questo risultato è giustificato dal fatto che il 60% degli intervistati è composto da persone tra 18 e 35 anni. Tali individui si sono rivelati facilmente avvicinabili e disponibili alla compilazione del questionario

Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla tipologia delle variabili indagate: var. qualitative/quantitative discrete: tavole di contingenza (o a doppia entrata) var. quantitative: analisi di correlazione lineare una var. qualitativa e una quantitativa: confronto tra le medie

Tavole di contingenza Sono tabelle a doppia entrata; i valori riportati all’interno della tabella sono le frequenze congiunte assolute, e la loro somma è pari al totale dei casi osservati. Dalla tabella si possono ricavare inoltre le distribuzioni marginali, sommando per riga e per colonna le frequenze congiunte; le frequenze relative congiunte, pari al rapporto tra le frequenze assolute congiunte e il totale dei casi osservati.

Dalle tabelle di contingenza si possono ricavare ulteriori distribuzioni unidimensionali : –Frequenze subordinate ovvero la frequenza di osservare il carattere x dato il carattere y e viceversa. Formalmente: P y|x (x i,y j ) = P (x i,y j ) / P x(x i ) P x|y (x i,y j ) = P (x i,y j ) / P y(y j ) Indipendenza statistica se al variare di X le distribuzioni subordinate (Y|X)= x i sono tutte uguali tra loro,si può concludere che la distribuzione del carattere Y non dipende da X. Nel caso di indipendenza statistica, la frequenza relativa congiunta è pari al prodotto delle marginali corrispondenti P(x i,y j )=P x (x i )P y (y j ) L’indipendenza stat. è un concetto simmetrico: se vale per X, vale anche per Y. Se si verifica, vuol dire che l’analisi bivariata di X (Y) non dà informazioni aggiuntive rispetto all’analisi univariata. Tavole di contingenza

–Perfetta dipendenza unilaterale ad ogni valore di X corrisponde un solo valore di Y, ma non è detto che si verifichi il contrario. In generale, quando il numero di colonne (valori assunti dalla Y) è inferiore al numero di righe (valori assunti dalla X) non è mai possibile che X dipenda perfettamente da Y. –Perfetta dipendenza bilaterale ad ogni valore di X corrisponde un solo valore di Y e viceversa; la perfetta dipendenza bilaterale si può avere allora solo per matrici quadrate. Tavole di contingenza

Indici di connessione Nella realtà è difficile che si verifichi la condizione di indipendenza statistica. Pertanto è utile disporre di indici che misurino il grado di connessione tra le variabili. –χ² (chi-quadrato) assume valore nullo se i fenomeni X e Y sono indipendenti. Risente del numero delle osservazioni effettuate quindi al crescere di N, l’indice tende a crescere. χ²=N Σ Σ [P(x i,y j )-P x (x i ) y (y j )] ²/ P x (x i ) P y (y j )

–Un indice più efficace (perchè relativo, e dunque non risente del numero di osservazioni) è l’indice di Cramer V, basato sul χ². assume valori compresi tra 0 e 1: 0 nel caso di indipendenza statistica, 1 nel caso di perfetta dipendenza almeno unilaterale e tende a crescere all’aumentare del grado di dipendenza delle variabili considerate. Indici di connessione

Nella realtà è difficile che si verifichi la condizione di indipendenza statistica. Pertanto è utile disporre di indici che misurino il grado di connessione tra le variabili. –χ² (chi-quadrato) assume valore nullo se i fenomeni X e Y sono indipendenti. Risente del numero delle osservazioni effettuate quindi al crescere di N, l’indice tende a crescere. χ²=N Σ Σ [P(x i,y j )-P x (x i ) y (y j )] ²/ P x (x i ) P y (y j )

–Un indice più efficace (perchè relativo, e dunque non risente del numero di osservazioni) è l’indice di Cramer V, basato sul χ². assume valori compresi tra 0 e 1: 0 nel caso di indipendenza statistica, 1 nel caso di perfetta dipendenza almeno unilaterale e tende a crescere all’aumentare del grado di dipendenza delle variabili considerate. Indici di connessione