La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LOGISTICA Introduzione e inferenza.

Presentazioni simili


Presentazione sul tema: "STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LOGISTICA Introduzione e inferenza."— Transcript della presentazione:

1 STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LOGISTICA Introduzione e inferenza Materiale didattico: dispensa sulla regressione logistica (c/o Ufficio fotocopie del Dipartimento)

2 Previsione di una variabile dicotomica La variabile da prevedere (Y = var. dipendente del modello) è dicotomica: presenza/assenza di una caratteristica: La variabile da prevedere (Y = var. dipendente del modello) è dicotomica: presenza/assenza di una caratteristica: –Compra / non compra un prodotto o categoria di prodotti –Appartiene / non appartiene a un certo profilo o segmento di clientela –Aderisce / non aderisce a una campagna promozionale –E solvente / è insolvente –… Le variabili esplicative X 1, X 2, … X k-1 forniscono informazioni su fattori ritenuti rilevanti nella previsione di Y. Nel Trade marketing, spesso tali variabili sono tratte dal database aziendale: Le variabili esplicative X 1, X 2, … X k-1 forniscono informazioni su fattori ritenuti rilevanti nella previsione di Y. Nel Trade marketing, spesso tali variabili sono tratte dal database aziendale: –Spesa per prodotti/categorie correlate –Comportamento di acquisto precedente –Informazioni sul comportamento complessivo di acquisto (spesa tot., scontrino medio, numero di visite in pdv, tipologia di pdv frequentata …) Le variabili esplicative X 1, X 2, … X k-1 possono essere sia quantitative che qualitative Le variabili esplicative X 1, X 2, … X k-1 possono essere sia quantitative che qualitative Se disponibili, si possono usare anche informazioni esterne: Se disponibili, si possono usare anche informazioni esterne: –Reddito –Età, sesso e caratteristiche socio-demografiche –Comportamento presso i competitor (share of wallet, spesa c/o altre insegne …)

3 Punteggio (score) per lunità i k-1 variabili esplicative. Per ogni unità i (i=1, …, n): k-1 variabili esplicative. Per ogni unità i (i=1, …, n): La combinazione lineare fornisce un punteggio (score) per lunità i: analogia con la parte sistematica del modello di regressione lineare La combinazione lineare fornisce un punteggio (score) per lunità i: analogia con la parte sistematica del modello di regressione lineare L obiettivo è però differente rispetto alla regressione: il punteggio è utilizzato per prevedere la classe a cui appartiene lunità i (Y i ) separazione lineare tra le classi L obiettivo è però differente rispetto alla regressione: il punteggio è utilizzato per prevedere la classe a cui appartiene lunità i (Y i ) separazione lineare tra le classi In questo modello, che cosa descrive la combinazione lineare delle variabili esplicative (cioè che cosa mettiamo a sin. dell=)? In questo modello, che cosa descrive la combinazione lineare delle variabili esplicative (cioè che cosa mettiamo a sin. dell=)?

4 Nella regressione: Y = variabile dipendente quantitativa (con distribuzione normale) Nella regressione: Y = variabile dipendente quantitativa (con distribuzione normale) La combinazione lineare delle variabili esplicative descrive quindi il valore atteso di y i La combinazione lineare delle variabili esplicative descrive quindi il valore atteso di y i Nel problema in esame: Y = variabile dipendente dicotomica (che rappresentiamo con una distribuzione di Bernoulli) Nel problema in esame: Y = variabile dipendente dicotomica (che rappresentiamo con una distribuzione di Bernoulli) E(y i )= i : probabilità di successo per lunità i yiyiyiyiProbabilità0 1 - i 1 i Tot.1

5 Modello di regressione per Y dicotomica I parametri possono essere stimati con il metodo dei minimi quadrati (v. regressione multipla). Però: I parametri possono essere stimati con il metodo dei minimi quadrati (v. regressione multipla). Però: –Sono violate le ipotesi del modello sulla variabile dipendente Y (Quali?) –Non è detto che la stima di i sia compresa in [0; 1] –Adattare un modello in [0; 1] è più complicato che non su tutta la retta reale Trasformazione dallintervallo [0; 1] a R: logit Trasformazione dallintervallo [0; 1] a R: logit

6 Logit Logit di Y dicotomica Y=1 oppure Y=0: Logit di Y dicotomica Y=1 oppure Y=0: Logit = logaritmo della quota relativa (odds): Logit = logaritmo della quota relativa (odds): Odds = /(1 – ) = P(Y=1)/P(Y=0) v. Zani-Cerioli, p Complemento 1 v. Zani-Cerioli, p Complemento 1

7 Logit Logit in presenza di k-1 variabili esplicative X 1, X 2, …: Logit in presenza di k-1 variabili esplicative X 1, X 2, …: Modello di regressione per logit[ (x i )] Modello di regressione per logit[ (x i )]

8 Regressione Logistica Il modello è lineare nei parametri: lo score per lunità i è una combinazione lineare dei valori osservati x i1 … x i,k-1 Il modello è lineare nei parametri: lo score per lunità i è una combinazione lineare dei valori osservati x i1 … x i,k-1 Il modello non è però lineare in (x i ): non si può più utilizzare il metodo dei minimi quadrati Il modello non è però lineare in (x i ): non si può più utilizzare il metodo dei minimi quadrati Metodo alternativo di stima: massima verosimiglianza (maximum likelihood) v. Complemento 2 Metodo alternativo di stima: massima verosimiglianza (maximum likelihood) v. Complemento 2 Non esiste una formula esplicita per le stime dei parametri del modello: algoritmo di stima iterativo che risolve un sistema di equazioni non lineari Non esiste una formula esplicita per le stime dei parametri del modello: algoritmo di stima iterativo che risolve un sistema di equazioni non lineari Tale sistema di equazioni si basa sulla distribuzione congiunta di Y 1, Y 2 … Y n (quale distribuzione?) Tale sistema di equazioni si basa sulla distribuzione congiunta di Y 1, Y 2 … Y n (quale distribuzione?) Spesso i valori delle variabili esplicative sono raggruppati in classi: tabelle di contingenza (multiple) Spesso i valori delle variabili esplicative sono raggruppati in classi: tabelle di contingenza (multiple)

9 Regressione logistica - Esempio n = 40 clienti n = 40 clienti Obiettivo (semplificato): prevedere il comportamento di acquisto su un prodotto di largo consumo in base a reddito (supposto noto) e sesso del consumatore Obiettivo (semplificato): prevedere il comportamento di acquisto su un prodotto di largo consumo in base a reddito (supposto noto) e sesso del consumatore Prime 10 righe della matrice dei dati: Prime 10 righe della matrice dei dati: v. Sito del corso: Esempio introduttivo alla regressione logistica Analisi preliminari con SPSS (per esercizio): Distribuzione di X=reddito (valori anomali, forma di distribuzione …) Associazione tra Y e le X

10 In SPSS

11 Esempio: Modello 1 (regr. log. semplice) Comportamento di acquisto (Y) in funzione di X 1 = sesso del consumatore (variabile dummy): Comportamento di acquisto (Y) in funzione di X 1 = sesso del consumatore (variabile dummy): Codifica X 1 (arbitraria): x i1 = 0 (F);x i1 = 1 (M) Codifica X 1 (arbitraria): x i1 = 0 (F);x i1 = 1 (M) Output SPSS modello logistico: Output SPSS modello logistico: Quale interpretazione dei parametri? Quale interpretazione dei parametri? Significatività dei risultati (test e intervalli di confidenza) Significatività dei risultati (test e intervalli di confidenza)

12 Modello 1 – interpretazione parametri Una sola variabile esplicativa X 1 dicotomica (dummy) Una sola variabile esplicativa X 1 dicotomica (dummy) Se x i1 = 0 (consumatore femmina): Se x i1 = 0 (consumatore femmina): Se x i1 = 1 (consumatore maschio): Se x i1 = 1 (consumatore maschio): Quindi 1 è la differenza tra il logit per i maschi (X=1) e il logit per le femmine (X=0). Quindi 1 è la differenza tra il logit per i maschi (X=1) e il logit per le femmine (X=0). Proprietà di log: Proprietà di log: Pertanto: exp( 1 ) = Odds Ratio (v. ZC, pp ) Pertanto: exp( 1 ) = Odds Ratio (v. ZC, pp ) exp( 0 ) è la quota relativa (odds) (x i )/[1- (x i )] per il gruppo delle femmine exp( ) è la quota relativa (odds) per il gruppo dei maschi

13 Interpretazione parametri -2 E possibile scrivere il modello logistico esplicitando la probabilità di successo (x i ): E possibile scrivere il modello logistico esplicitando la probabilità di successo (x i ): Formula per la stima di (x i ) Formula per la stima di (x i ) Tale relazione vale anche con più variabili esplicative Tale relazione vale anche con più variabili esplicative Tale formula esprime (x i ) come funzione di ripartizione di una particolare v.a. (v.a. logistica) Funzione logistica: v. grafico Tale formula esprime (x i ) come funzione di ripartizione di una particolare v.a. (v.a. logistica) Funzione logistica: v. grafico

14 Funzione logistica ( 0 =0; 1 = 1) Funzione non lineare tra la probabilità (x) e x una retta crescerebbe invece indefinitamente (v. grafico) Funzione non lineare tra la probabilità (x) e x una retta crescerebbe invece indefinitamente (v. grafico) Pendenza della curva: 1 (x) [1- (x)] 1 >0 andamento crescente; 1 0 andamento crescente; 1 <0 andamento decrescente Leffetto sulla probabilità di una variazione unitaria di x non è costante: è max quando (x)=0.5 (punto di ascissa x=- 0 / 1 ) implicazioni di marketing Leffetto sulla probabilità di una variazione unitaria di x non è costante: è max quando (x)=0.5 (punto di ascissa x=- 0 / 1 ) implicazioni di marketing Tale effetto è simmetrico rispetto a (x)=0.5 Tale effetto è simmetrico rispetto a (x)=0.5

15 Modello 1 – aspetti inferenziali Output: Output: E.S.: errore standard (asintotico) = E.S.: errore standard (asintotico) = Se n è grande, la stima della matrice di cov. di cappello è: Se n è grande, la stima della matrice di cov. di cappello è: Wald = statistica t 2 per la verifica di H 0 : j =0 contro H 1 : j 0 Wald = statistica t 2 per la verifica di H 0 : j =0 contro H 1 : j 0 Se H 0 è vera, in grandi campioni Se H 0 è vera, in grandi campioni Chi-quadrato con df=1: [N(0, 1)] 2 Chi-quadrato con df=1: [N(0, 1)] 2 P-value: P-value: Intervalli di confidenza (asintotici): interpretazione (ZC§6.2) Intervalli di confidenza (asintotici): interpretazione (ZC§6.2)

16 Esempio: Modello 2 (per esercizio) Comportamento di acquisto (Y) in funzione del reddito del consumatore (3 classi): Comportamento di acquisto (Y) in funzione del reddito del consumatore (3 classi): Codifica X 1 (parzialmente arbitraria): Codifica X 1 (parzialmente arbitraria): –x i1 = 1 se Reddito < 45 –x i1 = 2 se Reddito compreso tra 45 e 54 –x i1 = 3 se Reddito > 54 Output modello logistico: Output modello logistico: Interpretazione dei parametri e inferenza Interpretazione dei parametri e inferenza Effetto della scelta delle classi e della loro quantificazione? Effetto della scelta delle classi e della loro quantificazione?

17 Esempio: Modello 2bis Comportamento di acquisto (Y) in funzione del reddito del consumatore (variabile quantitativa): Comportamento di acquisto (Y) in funzione del reddito del consumatore (variabile quantitativa): Output modello logistico: Output modello logistico: Interpretazione dei parametri e inferenza Interpretazione dei parametri e inferenza Effetto del reddito a parità di sesso? Effetto del reddito a parità di sesso?

18 Esempio: Modello 3 (regr. log. multipla) Comportamento di acquisto (Y) in funzione del sesso (X 1 ) e del reddito (X 2 ) del consumatore: Comportamento di acquisto (Y) in funzione del sesso (X 1 ) e del reddito (X 2 ) del consumatore: X 1 è dummy: X 1 è dummy: –Se x i1 = 1 (M) –Se x i1 = 0 (F) Adattare un modello logistico tra Y, X 1 (dummy) e X 2 equivale ad adattare due modelli logistici diversi tra Y e X 2 : un modello per M e un altro per F. Adattare un modello logistico tra Y, X 1 (dummy) e X 2 equivale ad adattare due modelli logistici diversi tra Y e X 2 : un modello per M e un altro per F. Tali modelli differiscono per lintercetta; la pendenza è invece la stessa ( 2 ) Tali modelli differiscono per lintercetta; la pendenza è invece la stessa ( 2 )

19 Esempio: Modello 3 (X 2 = reddito quant.) Output modello logistico: Output modello logistico: Interpretazione dei parametri: coefficienti netti (parziali) Interpretazione dei parametri: coefficienti netti (parziali) Leffetto del reddito (a parità di sesso) ora è triplicato ed è significativo Leffetto del reddito (a parità di sesso) ora è triplicato ed è significativo Confronto tra associazione marginale e parziale (v. tabella a doppia entrata e a tripla entrata) Confronto tra associazione marginale e parziale (v. tabella a doppia entrata e a tripla entrata)

20 Esempio: Relazione tra Y e reddito (in classi) Senza considerare il sesso (v. Modello 2): non significativa Senza considerare il sesso (v. Modello 2): non significativa Distinguendo M e F: la relazione è molto più forte nei 2 gruppi Distinguendo M e F: la relazione è molto più forte nei 2 gruppi

21 Modello 3: Stima della probabilità di acquisto Ad esempio: consumatore F di reddito 40: Ad esempio: consumatore F di reddito 40: Se invece il consumatore è M (reddito=40): Se invece il consumatore è M (reddito=40): Nel Modello 2bis (non distingue tra M e F): Nel Modello 2bis (non distingue tra M e F): E possibile considerare un coeff. del Reddito diverso per M e F? E possibile considerare un coeff. del Reddito diverso per M e F?

22 Modello 4: interazione tra le variabili esplicative Comportamento di acquisto in funzione del sesso (X 1 ), del reddito quantitativo (X 2 ) e di un fattore di interazione (X 1 X 2 ): Comportamento di acquisto in funzione del sesso (X 1 ), del reddito quantitativo (X 2 ) e di un fattore di interazione (X 1 X 2 ): Ora i modelli M e F differiscono sia per lintercetta sia per la pendenza Ora i modelli M e F differiscono sia per lintercetta sia per la pendenza Output modello logistico: Output modello logistico: In questo caso linterazione non è utile (Quando potrebbe esserlo?) In questo caso linterazione non è utile (Quando potrebbe esserlo?) E opportuno inserire con parsimonia le interazioni nel modello E opportuno inserire con parsimonia le interazioni nel modello


Scaricare ppt "STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LOGISTICA Introduzione e inferenza."

Presentazioni simili


Annunci Google