La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Introduzione alla Regressione Logistica Rachid Salmi, Jean-Claude Desenclos, Alain Moren, Thomas Grein.

Presentazioni simili


Presentazione sul tema: "Introduzione alla Regressione Logistica Rachid Salmi, Jean-Claude Desenclos, Alain Moren, Thomas Grein."— Transcript della presentazione:

1 Introduzione alla Regressione Logistica Rachid Salmi, Jean-Claude Desenclos, Alain Moren, Thomas Grein

2 Contenuto regressione lineare semplice e multipla regressione logistica lineare semplice –La funzione logistica –Stima dei parametri –Interpretazione dei coefficienti Regressione logistica Multipla –Interpretazione dei coefficienti –Codifica delle variabili Esempi in Stata Modellare i propri dati

3 Regressione lineare Semplice Tabella 1 Età e pressione sistolica nel sangue (PAS) in 33 donne adulte

4 SBP (mm Hg) Age (years) Adattato da Colton T. Statistics in Medicine. Boston: Little Brown, 1974

5 Regressione lineare Semplice Relazione tra 2 variabili continue (PAS ed Età) y x Slope coefficiente di Regressione 1 –Misura lassociazione tra y ed x –Valore del cambiameto di y in media quando x cambia di una unità –Metodo dei minini quadrati

6 Regression lineare Multipla Relazione tra una variabile continua ed un a set di variabili continue coefficienti di regressione Parziale i –Valore del cambiamento di y in media quando x i cambia di una unità e tutte le altre x J, per ji, rimangono costanti –Misura lassociazione tra x i ed y corretta per tutte le altre x J Esempio –PAS verso età, peso, altezza, etc

7 Regressione lineare Multipla DipendenteVariabili indipendenti PredettaVariabili predittive Variabile Risposta Variabili esplicative Variabile Esito Covariate

8 Analisi Multivariata Modello Risultato. Regressione Linearequantitativo continuo. Regressione di Poissonconteggi. Cox modelsopravvivenza. Regressione Logistica binomiale Scelta del modello secondo lo studio, gli obiettivi, e le variabili. –Controllo del confondimento. –Costruzione di un modello, predizione.

9 Regressione logistica Modella la relazione tra un set di variabili x i –dicotomiche (mangiare : si/no) –categoriche (classe sociale,... ) –continue (eta,...) e –Variabile dicotomica Y esito dicotomico (binario) situazione molto comune in biologia e epidemiologia

10 Regressione logistica (1) tabella 2 Età e sintomi di malattia coronarica (CHD)

11 Come possiamo analizzare questi dati ? Confronto di Età media delle donne Malate e Non- Malate –Non- Malate : 38.6 anni –Malate: 58.7 anni (p<0.0001) Regressione Lineare?

12 Plot a punti: Dati di Tabella 2

13 Regressione logistica (2) tabella 3 Prevalenza (%) dei segni di CD in accordo con il gruppo di età

14 Dot-plot: Dati di Tabella 3 Malati % Età (anni)

15 La funzione logistica (1) Probabilità di malattia x

16 La funzione logistica (2) logit di P(y|x) {

17 La funzione logistica(3) Vantaggi del logit –transformazione semplice di P(y|x) –relazione lineare con x –Può essere continua (Logit tra - to + ) –E nota la distribuzione binomiale (P tra 0 ed 1) –Diretto legame con la nozione di odds di malattia

18 Interpretazione di (1)

19 Interpretazione di (2) β = incremento del log-odds per incremento unitario di x Test dipotesi H 0 β=0 (test di Wald) Intervallo di confidenza

20 Esempio rischio di sviluppare malattia delle arterie coronarie in accordo con età (<55 e 55+ anni).

21 Risultati del fitting del modello di regressione logistica

22 Adattamento dell'equazione ai dati regressione lineare: minimi quadrati regressione logistica: massima verosimiglianza funzione di verosimiglianza –I parametri stimati e hanno reso massima la verosimi- glianza (probabilità) dei dati osservati rispetto ad ogni altro valore –In pratica è più semplice lavorare con log-verosimiglianza

23 Massima verosimiglianza Calcolo terativo –scelta di un valore arbitrario per i coefficienti (usualmente 0) –Calcolo della log-verosimiglianza –Variazione dei valori dei coefficienti –Reiterazione fino alla massimizzazione (plateau) Resultati –stime di massima verosimiglianza (MLE) per e –stime di P(y) per a assegnato valore di x

24 Regressione logistica multipla Piu di una variabile indipendente –dicotomica, ordinale, nominale, continua … Interpretazione di b i –Incremento del log-odds per un Incremento unitario di x i con tutte le altre x i constanti –misure di associazione tra x i e log-odds corretta per tutte le altre x i

25 Regressione logistica Multipla Modifica delleffetto –Puo essere modellato includendo termini di interazione

26 Test dellipotesi Statistica Domanda –Il modello che include una variabile indipendente assegnata fornisce più informazione circa la variabile dipendente del modello in cui tale variabile è assente ? Tre test –statistica rapporto di verosimiglianza [statistica (LR)] –Wald test –Score test

27 statistica: rapporto di verosimiglianza Confronto di due modelli annidati (nested) Log(odds) = + 1 x x x x 4 (modello 1) Log(odds) = + 1 x x 2 (modello 2) statistica LR -2 log_lik (modello 2 / modello 1) = -2 log_lik (modello 2) meno -2log (modello 1) La statistica LR è 2 con DF = numero di extra parametri nel modello

28 Esempio P probabilità di arresto cardiaco Exc 1= sedentarietà, 0 = exercizio Smk 1= fumo, 0= non-fumo adapted from Kerr, Handbook di Public Health Methods, McGraw-Hill, 1998

29 Effetto di interazione tra fumo e sedentarietà ? Termine del Prodotto 3 = (SE ) Wald test = 0.75 (1df) -2log(L) = con termine interaczione = senza termine interaczione LR statistica = 0.74 (1df), p = 0.39 Non evidenza di interazione

30 Codifica di variabili (1) variabile dicotomica: yes = 1, no = 0 variabili continue –Incremento di OR per una variazione unitaria della variabile esposizione –Il modello Logistico è moltiplicativo OR Incrementa esponenzialmente con x »Se OR = 2, per la variazione unitaria di esposizione di x passa da 2 to 5: OR = 2 x 2 x 2 = 2 3 = 8 –verifica che OR Incrementi esponenzialmente con x. Quando in dubbio, trattare come variabile qualitative

31 variabile continua ? Relazione tra SBP>160 mmHg e BW (body weight) Introduci BW come variabile continua ? –Codifica del peso come variabile singlola, eg. 3 classi uguali: kg = 0, kg = 1, kg = 2 –Compatibile con assunto di modello moltiplicativo –Se non compatibile, usa variabili indicatori

32 Codifica delle variabili (2) variabili nominali o ordinali in classi disuguali : –Fumatori di tabacco : »no=0, »grey=1, »brown=2, »blond=3 –modello assume che lOR per (tabacco blond) = OR per (tabacco grey) 3 –Use indicator variabili (dummy variabili )

33 variabili indicatori: tipo di tabacco Neutralizza la gerarchia artificiale tra classi nella variabile "tipo di tabacco" Nessun assunto messo in atto 3 variabili (3 df) nel modello usando la medesima referenza OR per ogni tipo di tabacco, corretto per gli altri, riferito al non-fumo

34 Esempi usando stata Esempio 1: Low Birth Weight Study Esempio 2: Risk di death from bacterial meningitis according to treatment Referenze Hosmer DW, Lemeshow S. Applied logistic regression. Wiley & Sons, New York, 1989

35 Esempio 1: Studio «Low Birth Weight » 198 observations Low Birth Weigth [LBW] –1= Birth weight < 2500g –0= Birth weight >= 2500g Age di mother in years Weight di mother in pounds [LWT] Race (1,2,3) numero di doctors visit in last trimester [FTV]

36 Esempio 2: Rischio di morte per meningite batterica in accordo con il trattmento 161 observations Death (0,1) Treatment –(1=Chloramphenicol, 2=Ampicillin) Delay before treatment (onset, in days) Convulsions (1,0) Level di consciousness (1-3) Severity di dehydration (1-3) Age in years Pathogen –1 Others, 2 HiB, 3 Streptococcus pneumoniae


Scaricare ppt "Introduzione alla Regressione Logistica Rachid Salmi, Jean-Claude Desenclos, Alain Moren, Thomas Grein."

Presentazioni simili


Annunci Google