DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso

Slides:



Advertisements
Presentazioni simili
Statistica Economica I
Advertisements

Come organizzare i dati per un'analisi statistica al computer?
Dipartimento di Economia
La teoria di portafoglio: cap.7-9
“Teoria e metodi della ricerca sociale e organizzativa”
La regressione lineare trivariata
Regressione lineare Esercitazione 24/01/04.
ANALISI DELLA COVARIANZA
Dipartimento di Economia
Progetto Pilota 2 Lettura e interpretazione dei risultati
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Regressione logistica
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
IL MODELLO DI REGRESSIONE MULTIPLA
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
MODELLO DI REGRESSIONE LINEARE MULTIPLA
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
1 Y Modello di regressione semplice Supponiamo che una variabile Y sia funzione lineare di unaltra variabile X, con parametri incogniti 1 e 2 che vogliamo.
STATISTICA PER LE DECISIONI DI MARKETING
Statistica economica (6 CFU)
STATISTICA PER LE DECISIONI DI MARKETING
Statistica economica (6 CFU) Corso di Laurea in Economia e Commercio a.a Docente: Lucia Buzzigoli Lezione 13 1.
Le distribuzioni campionarie
STATISTICA PER LE DECISIONI DI MARKETING
STATISTICA PER LE DECISIONI DI MARKETING
STATISTICA PER LE DECISIONI DI MARKETING
Capitolo 3 (parte seconda)
Test parametrici I test studiati nelle lezioni precedenti (test- t, test-z) consentono la verifica di ipotesi relative al valore di specifici parametri.
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
La regressione come strumento di sintesi delle relazioni tra variabili
DATA MINING PER IL MARKETING
DATA MINING PER IL MARKETING
DATA MINING PER IL MARKETING
LABORATORIO DI ANALISI AVANZATA DEI DATI Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LINEARE MULTIPLA Esempio (d)istruttivo.
DATA MINING PER IL MARKETING
LABORATORIO DI ANALISI AVANZATA DEI DATI Andrea Cerioli Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.
DATA MINING PER IL MARKETING
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Strumenti statistici in Excell
Riassumendo: ipotesi per OLS 1.Modello lineare 2.X e Y sono frutto di osservazioni indipendenti 3.X è di rango pieno 4.I residui hanno media = 0 5.I residui.
3 June Biostatistica Biostatitistica= Statistica per scienze Biostatitistica= Statistica per scienze biologiche e sanitarie. biologiche e sanitarie.
Test basati su due campioni Test Chi - quadro
Analisi discriminante lineare - contesto
REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
Il modello di regressione lineare multivariato
Dalmine, 26 Maggio 2004 Esercitazioni di Statistica con Matlab Dott. Orietta Nicolis fttp:\ingegneria.unibg.it.
TRATTAMENTO STATISTICO DEI DATI ANALITICI
La covarianza.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Dipartimento di Economia, Management e Istituzioni APPPLICAZIONI AZIENDALI MEDIANTE FOGLIO ELETTRONICO 4° modulo: Calcoli statistici, Regressione Prof.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
La funzione CASUALE. Gli istogrammi.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
Statistica per l’economia e l’impresa Capitolo 4 MODELLO DI REGRESSIONE LINEARE SEMPLICE.
MODELLO DI REGRESSIONE LINEARE MULTIPLA
Gli Indici di VARIABILITA’
Transcript della presentazione:

DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso

Destagionalizzazione, detrendizzazione delle serie storiche

Serie storica della vendita di un bene

Modello trend + stagionalità + componente erratica

Primo modo per X

Secondo modo per X

Espressioni formali per le due parametrizzazioni

Stima dei parametri

Interpretazione delle stime dei parametri Il coefficiente del trend rimane immutato Nella seconda parametrizzazione i coeff. stagionali devono essere interpretati come effetto della stagione considerata relativo alla stagione esclusa

Confronto valori effettivi e valori stimati

Destagionalizzazione

Serie originaria e serie destagionalizzata

Detrendizzazione

Serie originaria e serie detrendizzata

Detrendizzazione e destagionalizzazione

Serie originaria e serie detr.-dest.

Destagionalizzazione Vincolo: la somma dei valori originari deve essere uguale alla somma dei valori destagionalizzati in ogni anno (all’interno del periodo s)  la somma degli effetti stagionali nel corso dell’anno deve essere zero Come si può imporre questo vincolo?

Nella parametrizzazione che non considera si prendono gli scarti dalla media degli effetti stagionali Intercetta = media degli effetti stagionali

Terza parametrizzazione Vincolo: somma dei coefficienti stagionali pari a zero Si parte dalla prima paraemtrizzazione Si fa la media dei coefficienti stagionali (stima della costante del modello) Si prendono gli scarti dalla media

In simboli p. 141

Sessione al computer File regrdum2

1) Grafico ss 2-3) Utilizzando la funzione regr.lin stimare i parametri (trend+stagio) nelle due parametrizzazioni 4) Interpretazione 5) Calcolare i valori stimati 6) Calcolare per entrambe le parametrizzazioni la serie a) destagionalizzata b) detrendizzata c) destagionalizzata e detrendizzata 7) Rappresentare graficamente a) i valori effettivi ed i valori teorici b) la serie destagionalizzata c) la serie detrendizzata d) la serie destagionalizzata e detrendizzata 8) Testare la presenza del trend e verificare il risultato con il componente aggiuntivo "analisi dati" 10) Testare la presenza della componente stagionale

Testare la presenza della comp. stagionale

r, R, q, n-k?

Verifica dell’ipotesi di omoschedasticità

Ipotesi di omoschedasticità

Es. reddito e spesa

Test di omoschedasticità

Si può utilizzare il rapporto che segue?

Test di omoschedasticità

Il suddetto criterio per l'omoschedasticità può anche essere applicato quando l'ipotesi alternativa stabilisca che la varianza delle perturbazioni è una funzione crescente di una delle variabili esplicative del modello. La procedura consiste quindi nel riordinare le osservazioni secondo i valori crescenti di quella particolare variabile.

Riordinare le osservazioni secondo i valori crescenti di quella particolare variabile. Funzione di EXCEL cerca.vert

Come si può tenere conto della presenza di eteroschedasticità?

Conseguenze della presenza di eteroschedasticità La stima della matrice di covarianze di beta cappello è inappropriata La stima appropriata è

Come cambia la nostra stima di beta cappello?

Stimatore WLS (weighted least squares) o GLS (generalized least squares))

Come si scelgono gli ωi

Two step estimation

Se il modello è

Scrittura generale

Previsioni nel modello eteroschedastico

File di excel EteroModel.xlsx La zona B2:F73 del foglio dati contiene informazioni sulle seguenti variabili per 72 individui Età Casa di proprietà (variabile dicotomica) Reddito Reddito elevato al quadrato Spesa mensile per l'acquisto di un determinato bene 1) Costruire il diagramma di dispersione tra Reddito (asse x) e spesa (asse y) e commentare l'eventuale presenza di eteroschedasticità 2) Calcolare le stime OLS del modello di regressione in cui la variabile dipendente è la spesa e le variabili esplicative sono l'età, la casa di proprietà, il reddito ed il quadrato del reddito 3) Scrivere un programma che consenta automaticamente di calcolare le stime GLS in un modello in cui la varianza della i-esima osservazione è modellata come σ 2 (reddito) α. Calcolare le stime GLS di questo modello. 4) Calcolare le stime GLS nel caso in cui il parametro α dell'equazione eteroschedastica venga stimato in base ai dati 5) Scrivere un programma che consenta di visualizzare un intervallo di confidenza al 95% della stima della spesa al variare del reddito da 2 a 10 (con passo della sequenza 0.1) per un individuo che presenta una età prefissata e sia proprietario (o meno) della casa in cui vive. Confrontare le previsioni OLS con le previsione GLS (alpha stimato in base ai dati). Commentare i risultati ottenuti.

Digramam di dispersione spesa vs reddito

Confronto tra intervalli di confidenza