La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.

Presentazioni simili


Presentazione sul tema: "Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11."— Transcript della presentazione:

1 Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11

2 Definizione X Stima modello OutliersInfluence si Multicollinearità Selezione Vars Analisi Fit no Modello Finale Il modello di regressione lineare

3 Si vuole verificare bontà delle stime adattamento del modello ai dati impatto delle singole osservazioni impatto dei regressori Strumenti test statistici indicatori di performance analisi dei residui analisi degli outliers analisi di influenza valutazione dei coefficienti e correlazioni parziali Il modello di regressione lineare La Valutazione del modello

4 Lobiettivo dellanalisi Prevedere la redditivita del socio fin dalle prime evidenze

5 Limpostazione del problema Redditività = ricavi - costi F F redditività var. continua F classi di redditività ( = 0)

6 F Y :Classi di Redditività F X :# ordini pagato ordini pagato rateale mensile sesso (dicotomica) area (dicotomiche) # liste Limpostazione del problema

7 F F Redditività var. dicotomica Pr (Y=1 | X) Limpostazione del problema Regressione Logistica

8 La regressione logistica appartiene alla categoria dei Modelli Lineari Generalizzati. Consente di prevedere una variabile discreta, che può essere intesa come lappartenenza a un gruppo, a partire da un insieme di variabili (continue, discrete, dicotomiche). Generalmente, la variabile dipendente, o variabile risposta, è dicotomica e rappresenta una assenza/presenza o un fallimento/successo. –Scorecard (evento: default) –Modello di Churn (evento: abbandono) –Modello di propensity (evento: acquisto) Esempi: Il modello di regressione logistica

9 n unità statistiche vettore colonna (nx1) di n misurazioni su una variabile dicotomica (Y) matrice (nxp) di n misurazioni su p variabili quantitative (X 1,…,X p ) la singola osservazione è il vettore riga (y i,x i1,x i2,x i3,…,x ip ) i=1,…,n Il modello di regressione logistica Le ipotesi del modello

10 Y, la variabile dipendente dicotomica, indica la presenza o lassenza di una particolare caratteristica. Y assume valore 1 con probabilità π e valore 0 con probabilità 1-π. Y si distribuisce come una variabile casuale bernoulliana di parametro π, che descrive lesito di un esperimento casuale che ha probabilità di risultare in successo con probabilità pari a π. Il modello di regressione logistica Le ipotesi del modello

11 Nellambito della regressione logistica si ipotizza che π: Pr(Y=1 l X) sia definito dalla seguente forma funzionale: Il modello di regressione logistica Le ipotesi del modello Funzione Logistica

12 Il modello logistico gode di alcune importanti proprietà: 1.Rispetta il vincolo che il valore stimato di π: Pr(Y=1 l X) sia compreso nellintervallo [0,1]; 2.La forma ad esse della funzione logistica garantisce un avvicinamento graduale ai valori estremi 0 e 1; 3.La funzione logit di π: lg[π/(1- π)] è esprimibile come combinazione lineare delle variabili indipendenti X 1,.., X k : Il modello di regressione logistica Le ipotesi del modello

13 Il principale problema è che la probabilità è limitata tra 0 e 1 e le funzioni lineari sono illimitate. Ai fini della formulazione di un modello di tipo lineare è stato necessario: 1.trasformare le probabilità in odds π/(1- π) per rimuovere il limite superiore (Sup=1) 2.applicare la funzione logaritmica agli odds per rimuovere il limite inferiore (Inf=0) Il modello di regressione logistica Le ipotesi del modello

14 Nelle scommesse si dice che un certo evento è dato 5 a 2 che vuol dire 5/2 è lodds: il rapporto tra il numero atteso di volte che un evento accada e il numero atteso di volte che un evento non accada. dove π è la probabilità dellevento e O è lodds. Cè una semplice relazione tra lodds e la probabilità: Il modello di regressione logistica Le ipotesi del modello

15 Probabilità dellevento odds 0.10.11 0.20.25 0.30.43 0.40.67 0.51.00 0.61.50 0.72.33 0.84.00 0.99.00 Un odds inferiore a 1 corrisponde a una probabilità inferiore a 0.5. Il limite inferiore è 0 come per la probabilità ma non ha limiti superiori. Il modello di regressione logistica Le ipotesi del modello

16 Si dimostra che equivale a LOGIT LOGISTICA (che è linverso del logit) Il modello di regressione logistica Le ipotesi del modello

17 Il modello di regressione lineare è inadeguato quando la variabile risposta è dicotomica, poiché: 1.Non garantisce il rispetto del campo di variazione [0,1] 2.La componente erratica può assumere solo due valori, non può avere una distribuzione normale. 3.La componente erratica viola lipotesi di omoschedasticità, la varianza dipende dal particolare valore di Xi Il modello di regressione logistica Le ipotesi del modello

18 In base alle ipotesi sottese dalla natura dicotomica di Y: E necessario introdurre delle restrizioni su poiché per definizione deve valere Il modello di regressione logistica Le ipotesi del modello

19 Supponiamo che daltra parte se La componente erratica può assumere solo due valori, non può avere una distribuzione normale. La variabile risposta dicotomica viola lassunzione di omoschedasticità e normalità della componente erratica. Il modello di regressione logistica Le ipotesi del modello

20 Gli risultano essere non omoschedastici (la varianza dipende dal particolare valore di ) La struttura dei modelli di regressione lineare non è adeguata per esprimere la relazione che lega una variabile dipendente dicotomica a una (o più) variabili indipendenti. Il modello di regressione logistica Le ipotesi del modello

21 Analogamente al modello di regressione lineare, la relazione tra la variabile dipendente e le indipendneti è nota a meno del valore dei parametri: E necessario un metodo che permetta di ottenere delle buone stime dei parametri sulla base delle osservazioni campionarie disponibili. Il modello di regressione logistica La stima del modello

22 Si dimostra che gli stimatori ottenuti mediante il metodo dei Minimi Quadrati non godono delle proprietà ottimali garantite nel caso della regressione lineare. Viene utilizzato il metodo più generale della Massima Verosimiglianza, che si basa sulla massimizzazione della probabilità di osservare linsieme di dati campionari disponibili, in funzione di β. Le equazioni di verosimiglianza non sono lineari nei parametri e non ammettono (salvo casi particolari) soluzione esplicita. E necessario ricorrere a metodi numerici iterativi per approssimare la soluzione (Algoritmo di Newton-Raphson o di Scorings Fisher ) Il modello di regressione logistica La stima del modello

23 Gli stimatori di massima verosimiglianza godono di proprietà ottimali in presenza di campioni numericamente grandi: –asintoticamente corretti (le stime sono non distorte, si avvicinano al valore vero) –asintoticamente efficienti (con standard error delle stime sono piccoli almeno come quelli di ogni altro metodo di stima) –asintoticamente normali (è possibile usare la distribuzione normale o chi quadro per calcolare gli intervalli di confidenza) Il modello di regressione logistica La stima del modello


Scaricare ppt "Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11."

Presentazioni simili


Annunci Google