Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.

Slides:



Advertisements
Presentazioni simili
Tecniche di analisi dei dati e impostazione dell’attività sperimentale
Advertisements

Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
2. Introduzione alla probabilità
Come organizzare i dati per un'analisi statistica al computer?
Intervalli di confidenza
Proprietà degli stimatori
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 10.
Regressione logistica
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
Inferenza statistica per un singolo campione
Valutazione delle ipotesi
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
MODELLO DI REGRESSIONE LINEARE MULTIPLA
La regressione logistica binomiale
Appunti di inferenza per farmacisti
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Corso di biomatematica lezione 6: la funzione c2
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
Modello di regressione lineare semplice
Determinazione Orbitale di Satelliti Artificiali Lezione 5
Lezione 4 Probabilità.
Lezione 7 i Test statistici
Analisi della varianza
STATISTICA PER LE DECISIONI DI MARKETING
Regressione Logistica
Regressione logistica
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Le distribuzioni campionarie
STATISTICA PER LE DECISIONI DI MARKETING
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
DATA MINING PER IL MARKETING
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9 Regressione lineare multipla: la stima del modello e la sua valutazione, metodi automatici.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°13 Regressione Logistica: La stima e l’interpretazione del del modello.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Lezione B.10 Regressione e inferenza: il modello lineare
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
Strumenti statistici in Excell
IL CAMPIONE.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°10 Regressione lineare multipla: la valutazione del modello, metodi automatici di selezione.
Test basati su due campioni Test Chi - quadro
Analisi discriminante lineare - contesto
Def : uno stimatore è una statistica T n le cui determinazioni servono a fornire delle stime del parametro ignoto  della v.c. X in cui sono state effettuate.
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
Intervalli di confidenza
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
TRATTAMENTO STATISTICO DEI DATI ANALITICI
TEST STATISTICI PER SCALE NOMINALI, TASSI E PROPORZIONI Non sempre la variabile aleatoria (risultato sperimentale) è un numero ma è spesso un esito dicotomico.
La covarianza.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
Teoria dei Sistemi di Trasporto Tematica 4: Elementi minimi di teoria della probabilità.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°12 Regressione Logistica: Le ipotesi del modello, la stima del modello.
Transcript della presentazione:

Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11

Definizione X Stima modello OutliersInfluence si Multicollinearità Selezione Vars Analisi Fit no Modello Finale Il modello di regressione lineare

Si vuole verificare bontà delle stime adattamento del modello ai dati impatto delle singole osservazioni impatto dei regressori Strumenti test statistici indicatori di performance analisi dei residui analisi degli outliers analisi di influenza valutazione dei coefficienti e correlazioni parziali Il modello di regressione lineare La Valutazione del modello

Lobiettivo dellanalisi Prevedere la redditivita del socio fin dalle prime evidenze

Limpostazione del problema Redditività = ricavi - costi F F redditività var. continua F classi di redditività ( = 0)

F Y :Classi di Redditività F X :# ordini pagato ordini pagato rateale mensile sesso (dicotomica) area (dicotomiche) # liste Limpostazione del problema

F F Redditività var. dicotomica Pr (Y=1 | X) Limpostazione del problema Regressione Logistica

La regressione logistica appartiene alla categoria dei Modelli Lineari Generalizzati. Consente di prevedere una variabile discreta, che può essere intesa come lappartenenza a un gruppo, a partire da un insieme di variabili (continue, discrete, dicotomiche). Generalmente, la variabile dipendente, o variabile risposta, è dicotomica e rappresenta una assenza/presenza o un fallimento/successo. –Scorecard (evento: default) –Modello di Churn (evento: abbandono) –Modello di propensity (evento: acquisto) Esempi: Il modello di regressione logistica

n unità statistiche vettore colonna (nx1) di n misurazioni su una variabile dicotomica (Y) matrice (nxp) di n misurazioni su p variabili quantitative (X 1,…,X p ) la singola osservazione è il vettore riga (y i,x i1,x i2,x i3,…,x ip ) i=1,…,n Il modello di regressione logistica Le ipotesi del modello

Y, la variabile dipendente dicotomica, indica la presenza o lassenza di una particolare caratteristica. Y assume valore 1 con probabilità π e valore 0 con probabilità 1-π. Y si distribuisce come una variabile casuale bernoulliana di parametro π, che descrive lesito di un esperimento casuale che ha probabilità di risultare in successo con probabilità pari a π. Il modello di regressione logistica Le ipotesi del modello

Nellambito della regressione logistica si ipotizza che π: Pr(Y=1 l X) sia definito dalla seguente forma funzionale: Il modello di regressione logistica Le ipotesi del modello Funzione Logistica

Il modello logistico gode di alcune importanti proprietà: 1.Rispetta il vincolo che il valore stimato di π: Pr(Y=1 l X) sia compreso nellintervallo [0,1]; 2.La forma ad esse della funzione logistica garantisce un avvicinamento graduale ai valori estremi 0 e 1; 3.La funzione logit di π: lg[π/(1- π)] è esprimibile come combinazione lineare delle variabili indipendenti X 1,.., X k : Il modello di regressione logistica Le ipotesi del modello

Il principale problema è che la probabilità è limitata tra 0 e 1 e le funzioni lineari sono illimitate. Ai fini della formulazione di un modello di tipo lineare è stato necessario: 1.trasformare le probabilità in odds π/(1- π) per rimuovere il limite superiore (Sup=1) 2.applicare la funzione logaritmica agli odds per rimuovere il limite inferiore (Inf=0) Il modello di regressione logistica Le ipotesi del modello

Nelle scommesse si dice che un certo evento è dato 5 a 2 che vuol dire 5/2 è lodds: il rapporto tra il numero atteso di volte che un evento accada e il numero atteso di volte che un evento non accada. dove π è la probabilità dellevento e O è lodds. Cè una semplice relazione tra lodds e la probabilità: Il modello di regressione logistica Le ipotesi del modello

Probabilità dellevento odds Un odds inferiore a 1 corrisponde a una probabilità inferiore a 0.5. Il limite inferiore è 0 come per la probabilità ma non ha limiti superiori. Il modello di regressione logistica Le ipotesi del modello

Si dimostra che equivale a LOGIT LOGISTICA (che è linverso del logit) Il modello di regressione logistica Le ipotesi del modello

Il modello di regressione lineare è inadeguato quando la variabile risposta è dicotomica, poiché: 1.Non garantisce il rispetto del campo di variazione [0,1] 2.La componente erratica può assumere solo due valori, non può avere una distribuzione normale. 3.La componente erratica viola lipotesi di omoschedasticità, la varianza dipende dal particolare valore di Xi Il modello di regressione logistica Le ipotesi del modello

In base alle ipotesi sottese dalla natura dicotomica di Y: E necessario introdurre delle restrizioni su poiché per definizione deve valere Il modello di regressione logistica Le ipotesi del modello

Supponiamo che daltra parte se La componente erratica può assumere solo due valori, non può avere una distribuzione normale. La variabile risposta dicotomica viola lassunzione di omoschedasticità e normalità della componente erratica. Il modello di regressione logistica Le ipotesi del modello

Gli risultano essere non omoschedastici (la varianza dipende dal particolare valore di ) La struttura dei modelli di regressione lineare non è adeguata per esprimere la relazione che lega una variabile dipendente dicotomica a una (o più) variabili indipendenti. Il modello di regressione logistica Le ipotesi del modello

Analogamente al modello di regressione lineare, la relazione tra la variabile dipendente e le indipendneti è nota a meno del valore dei parametri: E necessario un metodo che permetta di ottenere delle buone stime dei parametri sulla base delle osservazioni campionarie disponibili. Il modello di regressione logistica La stima del modello

Si dimostra che gli stimatori ottenuti mediante il metodo dei Minimi Quadrati non godono delle proprietà ottimali garantite nel caso della regressione lineare. Viene utilizzato il metodo più generale della Massima Verosimiglianza, che si basa sulla massimizzazione della probabilità di osservare linsieme di dati campionari disponibili, in funzione di β. Le equazioni di verosimiglianza non sono lineari nei parametri e non ammettono (salvo casi particolari) soluzione esplicita. E necessario ricorrere a metodi numerici iterativi per approssimare la soluzione (Algoritmo di Newton-Raphson o di Scorings Fisher ) Il modello di regressione logistica La stima del modello

Gli stimatori di massima verosimiglianza godono di proprietà ottimali in presenza di campioni numericamente grandi: –asintoticamente corretti (le stime sono non distorte, si avvicinano al valore vero) –asintoticamente efficienti (con standard error delle stime sono piccoli almeno come quelli di ogni altro metodo di stima) –asintoticamente normali (è possibile usare la distribuzione normale o chi quadro per calcolare gli intervalli di confidenza) Il modello di regressione logistica La stima del modello