La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LOGISTICA Alcuni complementi.

Presentazioni simili


Presentazione sul tema: "STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LOGISTICA Alcuni complementi."— Transcript della presentazione:

1 STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LOGISTICA Alcuni complementi Materiale didattico: dispensa sulla regressione logistica (c/o Ufficio fotocopie del Dipartimento)

2 Complemento 1: Richiamo tabelle di contingenza (v. Zani-Cerioli, cap. 4) Y, X dicotomiche; Y = dipendente {0, 1}; X = esplicativa {A, B}; Y, X dicotomiche; Y = dipendente {0, 1}; X = esplicativa {A, B}; Odds(A) = P(Y=1|X=A)/P(Y=0|X=A) = A1 / A0 = A1 /(1- A1 ) Odds(A) = P(Y=1|X=A)/P(Y=0|X=A) = A1 / A0 = A1 /(1- A1 ) Odds(B) = P(Y=1|X=B)/P(Y=0|X=B) = B1 / B0 = B1 /(1- b1 ) Odds(B) = P(Y=1|X=B)/P(Y=0|X=B) = B1 / B0 = B1 /(1- b1 ) Odds Ratio = OR = Odds(A)/Odds(B) = ( A1 B0 )/( A0 B1 ) Odds Ratio = OR = Odds(A)/Odds(B) = ( A1 B0 )/( A0 B1 ) Odds e OR sono più utilizzati rispetto alla differenza ( A1 / A+ – B1 / B+ ) o al rischio relativo ( A1 / A+ )/( B1 / B+ ) Odds e OR sono più utilizzati rispetto alla differenza ( A1 / A+ – B1 / B+ ) o al rischio relativo ( A1 / A+ )/( B1 / B+ ) La definizione di Odds vale in generale: La definizione di Odds vale in generale: Odds(x i ) = P(Y=1|X=x i )/P(Y=0|X=x i ) = (x i )/[1 – (x i )] Quindi: logit[ (x i )] = log[Odds(x i )] X\Y01Tot A A0 A0 A1 A1 A+ A+ B B0 B0 B1 B1 B+ B+ Tot P(Y=1|X=A) = A1 / A+ P(Y=1|X=B) = B1 / B+ P(Y=1) = +1

3 Complemento 1: Richiamo indici operativi (v. ZC, pp ) Y, X dicotomiche; Y=dipendente {0, 1}; X=esplicativa {A, B}; Y, X dicotomiche; Y=dipendente {0, 1}; X=esplicativa {A, B}; Le probabilità nella tabella sono legate anche a indici operativi di largo impiego nel marketing. Se A è la categoria di riferimento di X: Supporto(X Y) = P(Y=1 X=A) = A1 Predicibilità(X Y) = P(Y=1 X=A)/P(X=A) = P(Y=1|X=A) = A1 / A+ Lift(X Y) = Predicibilità(X Y)/P(Y=1) = ( A1 / A+ )/ +1 Lift rappresenta quindi leffetto della conoscenza di X sulla previsione di Y: se X non è noto la previsione di Y è in base alla distribuzione marginale { +0, +1 } X\Y01Tot A A0 A0 A1 A1 A+ A+ B B0 B0 B1 B1 B+ B+ Tot P(Y=1|X=A) = A1 / A+ P(Y=1|X=B) = B1 / B+ P(Y=1) = +1

4 Complemento 2: Funzione di verosimiglianza Caso in cui le variabili esplicative sono qualitative: x i identifica una cella della tabella di contingenza (multipla) ottenuta incrociando le variabili esplicative X 1, X 2, … X k-1 Caso in cui le variabili esplicative sono qualitative: x i identifica una cella della tabella di contingenza (multipla) ottenuta incrociando le variabili esplicative X 1, X 2, … X k-1 Il numero di successi (ad es. acquisti) per le n i unità (clienti) che presentano il profilo x i ha distribuzione binomiale probabilità di osservare s i successi tra le n i unità che presentano il profilo x i : Il numero di successi (ad es. acquisti) per le n i unità (clienti) che presentano il profilo x i ha distribuzione binomiale probabilità di osservare s i successi tra le n i unità che presentano il profilo x i : La probabilità di successo (x i ) è rappresentata dal modello logistico: La probabilità di successo (x i ) è rappresentata dal modello logistico: La stima di max verosimiglianza è quel valore dei parametri β 0, β 1, β k-1 che rende massimo il prodotto delle probabilità binomiali: La stima di max verosimiglianza è quel valore dei parametri β 0, β 1, β k-1 che rende massimo il prodotto delle probabilità binomiali: L(β) = p(s 1 )p(s 2 ) p(s r ) dove r = numero celle della tabella di contingenza Si noti che i valori s 1,s 2,…s r sono quelli osservati: numero di successi per i diversi profili Si noti che i valori s 1,s 2,…s r sono quelli osservati: numero di successi per i diversi profili

5 Complemento 2: Funzione di verosimiglianza Problemi se X è continua: Problemi se X è continua: Se la variabile esplicativa X è continua: non vi sono valori ripetuti Se la variabile esplicativa X è continua: non vi sono valori ripetuti La tabella di contingenza (multipla) che si ottiene incrociando X con le altre variabili esplicative ha un numero di celle uguale al numero di unità: r=n e il profilo x i è diverso per ogni unità La tabella di contingenza (multipla) che si ottiene incrociando X con le altre variabili esplicative ha un numero di celle uguale al numero di unità: r=n e il profilo x i è diverso per ogni unità Anche quando n cresce, il numero di unità che presentano il profilo x i dunque è piccolo: n i = 1 Anche quando n cresce, il numero di unità che presentano il profilo x i dunque è piccolo: n i = 1 Non vale più il teorema centrale del limite: ad esempio non è più vero che Non vale più il teorema centrale del limite: ad esempio non è più vero che I risultati inferenziali (Wald, p-value, intervalli di confidenza) riportati da SPSS non sono più validi: essi infatti sono asintotici (presuppongono che n sia grande e che n i cresca con n) I risultati inferenziali (Wald, p-value, intervalli di confidenza) riportati da SPSS non sono più validi: essi infatti sono asintotici (presuppongono che n sia grande e che n i cresca con n) Una regola del pollice è che n i 5 Una regola del pollice è che n i 5 Spesso in pratica si hanno situazioni intermedie (v. reddito nellesempio): tabelle sparse Spesso in pratica si hanno situazioni intermedie (v. reddito nellesempio): tabelle sparse Bisognerebbe utilizzare procedure esatte (v. test esatto di Fisher in una tabella 2x2) Bisognerebbe utilizzare procedure esatte (v. test esatto di Fisher in una tabella 2x2) Cosa succede invece alle stime dei parametri se X è continua? Cosa succede invece alle stime dei parametri se X è continua?

6 Complemento 2: Funzione di verosimiglianza Diamo uno sguardo più in dettaglio alla funzione di verosimiglianza: Diamo uno sguardo più in dettaglio alla funzione di verosimiglianza: L(β) = p(s 1 )p(s 2 ) p(s r ) considerata come funzione dei parametri del modello logistico, date le osservazioni s 1, s 2, … s r. Di solito si lavora su scala logaritmica (perché?): log-verosimiglianza Di solito si lavora su scala logaritmica (perché?): log-verosimiglianza Se le variabili esplicative sono qualitative (v. prima): Se le variabili esplicative sono qualitative (v. prima): Se invece le X sono continue: i identifica ununità; n i =1; r=n Se invece le X sono continue: i identifica ununità; n i =1; r=n La funzione l(β) quindi è la stessa (a meno di una costante): la stima di β non cambia La funzione l(β) quindi è la stessa (a meno di una costante): la stima di β non cambia Cambia invece la distribuzione delle statistiche test perché non vale più il TCL (v. prima) Cambia invece la distribuzione delle statistiche test perché non vale più il TCL (v. prima)

7 Complemento 2: Funzione di verosimiglianza Funzione di verosimglianza nellesempio sul comportamento di acquisto: Output di SPSS Funzione di verosimglianza nellesempio sul comportamento di acquisto: Output di SPSS Modello con solo intercetta: log[L(0)] = Modello con solo intercetta: log[L(0)] = Modello con Sesso + Reddito: Modello con Sesso + Reddito: Nota: L(β) 0 Nota: L(β) 0 SPSS riporta anche la differenza nella verosimiglianza tra modelli annidati: test per il confronto tra modelli


Scaricare ppt "STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LOGISTICA Alcuni complementi."

Presentazioni simili


Annunci Google