DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso

Slides:



Advertisements
Presentazioni simili
Statistica Economica I
Advertisements

Come organizzare i dati per un'analisi statistica al computer?
Dipartimento di Economia
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
La teoria di portafoglio: cap.7-9
“Teoria e metodi della ricerca sociale e organizzativa”
La regressione lineare trivariata
ANALISI DELLA COVARIANZA
Dipartimento di Economia
Regressione logistica
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
ALCUNI METODI STATISTICI PER LA SELEZIONE DELLE VARIABILI NELL’ANALISI DISCRIMINANTE Eliminazione di variabili con contributo discriminatorio statisticamente.
IL MODELLO DI REGRESSIONE MULTIPLA
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
MODELLO DI REGRESSIONE LINEARE MULTIPLA
E(’)= Riassumendo: ipotesi per OLS Modello lineare
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
1 Y Modello di regressione semplice Supponiamo che una variabile Y sia funzione lineare di unaltra variabile X, con parametri incogniti 1 e 2 che vogliamo.
STATISTICA PER LE DECISIONI DI MARKETING
Statistica economica (6 CFU)
STATISTICA PER LE DECISIONI DI MARKETING
Statistica economica (6 CFU) Corso di Laurea in Economia e Commercio a.a Docente: Lucia Buzzigoli Lezione 13 1.
Le distribuzioni campionarie
STATISTICA PER LE DECISIONI DI MARKETING
STATISTICA PER LE DECISIONI DI MARKETING
STATISTICA PER LE DECISIONI DI MARKETING
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LINEARE MULTIPLA Selezione.
La regressione come strumento di sintesi delle relazioni tra variabili
DATA MINING PER IL MARKETING
DATA MINING PER IL MARKETING
LABORATORIO DI ANALISI AVANZATA DEI DATI Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LINEARE MULTIPLA Esempio (d)istruttivo.
DATA MINING PER IL MARKETING
LABORATORIO DI ANALISI AVANZATA DEI DATI Andrea Cerioli Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.
DATA MINING PER IL MARKETING
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9 Regressione lineare multipla: la stima del modello e la sua valutazione, metodi automatici.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Strumenti statistici in Excell
Riassumendo: ipotesi per OLS 1.Modello lineare 2.X e Y sono frutto di osservazioni indipendenti 3.X è di rango pieno 4.I residui hanno media = 0 5.I residui.
3 June Biostatistica Biostatitistica= Statistica per scienze Biostatitistica= Statistica per scienze biologiche e sanitarie. biologiche e sanitarie.
Test basati su due campioni Test Chi - quadro
Analisi discriminante lineare - contesto
REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta.
LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
Stima di una funzione di domanda di moneta (3). Premessa Questa esercitazione è la terza di un ciclo dedicato alla stima di una funzione di domanda di.
Regressione logistica Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
Il modello di regressione lineare multivariato
Dalmine, 26 Maggio 2004 Esercitazioni di Statistica con Matlab Dott. Orietta Nicolis fttp:\ingegneria.unibg.it.
TRATTAMENTO STATISTICO DEI DATI ANALITICI
La covarianza.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
MODELLO DI REGRESSIONE LINEARE MULTIPLA
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Gli Indici di VARIABILITA’
Autocorrelazione dei residui
Transcript della presentazione:

DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso

Destagionalizzazione, detrendizzazione delle serie storiche

Serie storica della vendita di un bene

Modello trend + stagionalità + componente erratica

Primo modo per X

Secondo modo per X

Espressioni formali per le due parametrizzazioni

Stima dei parametri

Interpretazione delle stime dei parametri Il coefficiente del trend rimane immutato Nella seconda parametrizzazione i coeff. stagionali devono essere interpretati come effetto della stagione considerata relativo alla stagione esclusa

Confronto valori effettivi e valori stimati

Destagionalizzazione

Serie originaria e serie destagionalizzata

Detrendizzazione

Serie originaria e serie detrendizzata

Detrendizzazione e destagionalizzazione

Serie originaria e serie detr.-dest.

Destagionalizzazione Vincolo: la somma dei valori originari deve essere uguale alla somma dei valori destagionalizzati in ogni anno (all’interno del periodo s)  la somma degli effetti stagionali nel corso dell’anno deve essere zero Come si può imporre questo vincolo?

Nella parametrizzazione che non considera si prendono gli scarti dalla media degli effetti stagionali Intercetta = media degli effetti stagionali

Terza parametrizzazione Vincolo: somma dei coefficienti stagionali pari a zero Si parte dalla prima paraemtrizzazione Si fa la media dei coefficienti stagionali (stima della costante del modello) Si prendono gli scarti dalla media

In simboli p. 141

Sessione al computer File regrdum2

1) Grafico ss 2-3) Utilizzando la funzione regr.lin stimare i parametri (trend+stagio) nelle due parametrizzazioni 4) Interpretazione 5) Calcolare i valori stimati 6) Calcolare per entrambe le parametrizzazioni la serie a) destagionalizzata b) detrendizzata c) destagionalizzata e detrendizzata 7) Rappresentare graficamente a) i valori effettivi ed i valori teorici b) la serie destagionalizzata c) la serie detrendizzata d) la serie destagionalizzata e detrendizzata 8) Testare la presenza del trend e verificare il risultato con il componente aggiuntivo "analisi dati" 10) Testare la presenza della componente stagionale

Testare la presenza della comp. stagionale

r, R, q, n-k?

Verifica dell’ipotesi di omoschedasticità

Ipotesi di omoschedasticità

Es. reddito e spesa

Test di omoschedasticità

Si può utilizzare il rapporto che segue?

Test di omoschedasticità

Il suddetto criterio per l'omoschedasticità può anche essere applicato quando l'ipotesi alternativa stabilisca che la varianza delle perturbazioni è una funzione crescente di una delle variabili esplicative del modello. La procedura consiste quindi nel riordinare le osservazioni secondo i valori crescenti di quella particolare variabile.

Riordinare le osservazioni secondo i valori crescenti di quella particolare variabile. Funzione di EXCEL cerca.vert

Come si può tenere conto della presenza di eteroschedasticità?

Conseguenze della presenza di eteroschedasticità La stima della matrice di covarianze di beta cappello è inappropriata La stima appropriata è

Come cambia la nostra stima di beta cappello?

Stimatore WLS (weighted least squares) o GLS (generalized least squares))

Come si scelgono gli ωi

Two step estimation

Se il modello è

Scrittura generale

Previsioni nel modello eteroschedastico

File di excel EteroModel.xlsx La zona B2:F73 del foglio dati contiene informazioni sulle seguenti variabili per 72 individui Età Casa di proprietà (variabile dicotomica) Reddito Reddito elevato al quadrato Spesa mensile per l'acquisto di un determinato bene 1) Costruire il diagramma di dispersione tra Reddito (asse x) e spesa (asse y) e commentare l'eventuale presenza di eteroschedasticità 2) Calcolare le stime OLS del modello di regressione in cui la variabile dipendente è la spesa e le variabili esplicative sono l'età, la casa di proprietà, il reddito ed il quadrato del reddito 3) Scrivere un programma che consenta automaticamente di calcolare le stime GLS in un modello in cui la varianza della i-esima osservazione è modellata come σ 2 (reddito) α. Calcolare le stime GLS di questo modello. 4) Calcolare le stime GLS nel caso in cui il parametro α dell'equazione eteroschedastica venga stimato in base ai dati 5) Scrivere un programma che consenta di visualizzare un intervallo di confidenza al 95% della stima della spesa al variare del reddito da 2 a 10 (con passo della sequenza 0.1) per un individuo che presenta una età prefissata e sia proprietario (o meno) della casa in cui vive. Confrontare le previsioni OLS con le previsione GLS (alpha stimato in base ai dati). Commentare i risultati ottenuti.

Digramam di dispersione spesa vs reddito

Confronto tra intervalli di confidenza

Test per l’ipotesi di autocorrelazione nei residui

Coefficiente di autocorrelazione

Punto di partenza Se le perturbazioni sono incorrelate con la stessa varianza otteniamo 2σ 2 Se le perturbazioni sono correlate positivamente otteniamo 2σ 2 - termine positivo

Test di Durbin e Watson

Sessione al computer Implementare il test di DW per la serie storica delle vendite di un bene (file SV- dum2) T=20, k=5 d=1.12

Selezione delle variabili Procedure backward e forward

Es. pezzi venduti di un bene File riepilogo(out).xls

Monitoraggio t statistiche