Introduzione alla regressione multipla

Slides:



Advertisements
Presentazioni simili
INTERPOLAZIONE MOD.10 CAP.1
Advertisements

Come organizzare i dati per un'analisi statistica al computer?
Dipartimento di Economia
ESERCITAZIONE Lanalisi della varianza: i disegni entro i soggetti e misti.
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
La regressione lineare trivariata
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
ANALISI DELLA COVARIANZA
Analisi multivariata.
Scopo della lezione Regressione lineare multipla Cos’è
Dipartimento di Economia
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 10.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8.
ESEMPIO DI ALBERO BRANCH-AND-BOUND
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
STATISTICA 6.0: REGRESSIONE LINEARE
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Analisi trivariata Lavorando con due variabili è possibile descrivere la relazione che fra queste esiste e formulare una congettura circa il tipo di legame.
Analisi della varianza (a una via)
La logica della regressione
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
(pane quotidiano dell’algebra, dannazione… degli studenti)
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Modello di regressione lineare semplice
POTENZE modificato da iprof.
G. Barbaro interpolazione1 INTERPOLAZIONE. G. Barbaro interpolazione1 In Statistica e in genere nelle scienze sperimentali, si studiano o si osservano.
1 Y Modello di regressione semplice Supponiamo che una variabile Y sia funzione lineare di unaltra variabile X, con parametri incogniti 1 e 2 che vogliamo.
Linee guida per la Chimica Analitica Statistica chemiometrica
Analisi della varianza
Verifica delle ipotesi su due campioni di osservazioni
Principali analisi statistiche
Cosa significa la parola funzione?
STATISTICA PER LE DECISIONI DI MARKETING
Vettori Finche’ il moto si svolge in una sola dimensione – moto unidimensionale, moto rettilineo – non abbiamo bisogno di vettori La posizione e’ individuata.
Regressione e correlazione
La divisione di un polinomio
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
La regressione come strumento di sintesi delle relazioni tra variabili
DATA MINING PER IL MARKETING
Le potenze.
Esonero di MODELLI DI SISTEMI BIOLOGICI 21/12/2012 TEMA 1 x x1x2 x3x4 k1 k2 k Kx4/(1+x4) u1u2 y1 y2 Si verifichi: 1.L’identificabilità del modello non.
DATA MINING PER IL MARKETING
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9 Regressione lineare multipla: la stima del modello e la sua valutazione, metodi automatici.
Esonero di MODELLI DI SISTEMI BIOLOGICI 18/12/2013 TEMA 1 Si verifichi: 1.L’identificabilità del modello non lineare (ingressi noti) con il metodo delle.
La regressione II Cristina Zogmaister.
Consideriamo due misurazioni, per esempio benessere e soddisfazione personale. Le due variabili sono simili. Chi ha punteggi sopra la media in una variabile,
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Strumenti statistici in Excell
Il residuo nella predizione
Metodi Quantitativi per Economia, Finanza e Management Lezione n°10 Regressione lineare multipla: la valutazione del modello, metodi automatici di selezione.
Analisi Multivariata dei Dati
1 “Metodi per la Ricerca Sociale e Organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università degli Studi di Milano-Bicocca.
REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta.
Rapporto incrementale
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Transcript della presentazione:

Introduzione alla regressione multipla 1

Che cos’è la regressione multipla A differenza della regressione semplice, utilizza più variabili indipendenti Usa più coefficiente angolari, uno per ciascuna VI Restano le caratteristiche dell’equazione di predizione: a) Criterio dei minimi quadrati per gli errori b) Una sola intercetta c) Errori o residui calcolabili nello stesso modo d) Verifica della significatività per ciascuna VI 2

Diagramma di Venn per la varianza di VI e VD I coefficienti parziali e semiparziali

Difficoltà del passaggio da una a più VI Correlazioni fra VI Calcolo dei coefficienti angolari Introduzione del concetto di correlazione parziale 4

R2Y12 = (a + b + c) / (a + b + c + e) Varianza di Y spiegata dalla regressione = a + b + c Varianza di Y non spiegata dal modello di regressione = e R2Y12 = (a + b + c) / (a + b + c + e) Semiparziale per X1 = sr21 = r2Y(1.2) = R2Y12 – r2Y2 = a / (a + b + c + e) Semiparziale per X2 = sr22 = r2Y(2.1) = R2Y12 – r2Y1 = b / (a + b + c + e) Parziale per X1 = pr21 = r2Y1.2 = (R2Y12 – r2Y2) / (1 - r2Y2) = a / (a + e) Parziale per X2 = pr22 = r2Y2.1 = (R2Y12 – r2Y1) / (1 - r2Y1) = b / (b + e)

Definizione di correlazione parziale È la correlazione fra la variabile X e Y al netto di una terza K. Al netto significa: facendo in modo che la variabile K non abbia nessuno effetto su X e Y Oppure Che X e Y siano indipendenti da K

Correlazione semi-parziale o indipendente X2 x3 e x4 predicono x1. I residui correlati con Y (VD) sono la correlazione semiparziale (sr1) o parziale indipendente

Correlazione parziale x2 x3 e x4 predicono x1. X2 x3 e x4 predicono Y. I residui delle due predizioni, messi in correlazione, producono la correlazione parziale (pr1)

Intepretazione dei coefficienti parziale e semiparziali Il coefficiente parziale informa in che modo la VI x è correlata con la VD tenendo costante l’influsso delle altre VI Il coefficiente semiparziale è invece interpretabile più semplicemente in riferimento a R2 : il quadrato del coefficiente semiparziale è uguale all’incremento di R attribuibile alla VI.

Esempio Per predire il Numero di esercizi a scuola, usiamo un primo modello (regressione semplice) Modello 1 Esercizi per casa  Esercizi a scuola Aggiungiamo anche le Ore di studio Modello 2 Esercizi per casa  Ore di studio  Esercizi a scuola

La varianza spiegata aumenta

Aggiungendo le OreStudio si può spiegare 35% di varianza in più 0,791-0,440 =0,351 0,5932 = 0,351 Aggiungendo le OreStudio si può spiegare 35% di varianza in più

sovraccarico Senso di fallimento Stress da genitori

Esempio terzo Aggiungiamo nel modello anche il numero di libri che uno studente possiede a casa

L’aumento nella predizione è quasi uguale al 10% Il livello di significatività è inferiore a 0,05, rifiutiamo l’ipotesi nulla di mancanza di effetto.

La correlazione di ordine zero è nulla, i libri a casa hanno un effetto nascosto sugli esercizi svolti nel compito, che appare solo in presenza di altre VI

Quadrato della correl fra x e z Formula del coefficiente di Correlazione Parziale fra X e Y, al netto dell’effetto di Z correl fra x e z correl fra x e y correl fra y e z Correlazione parziale fra x e y Quadrato della correl fra y e z Quadrato della correl fra x e z

Rapporto fra la correlazione parziale e la correlazione semplice Parziale può essere uguale a semplice Parziale può essere maggiore di semplice Parziale può essere più piccolo di semplice Quando “a” and “c” Sono piccoli: Semplice = Parziale Quando “a” è grande (e “c” è grande o piccolo): Parziale > Semplice Quando “c” è grande (e “a” non è molto grande): Parziale < Semplice d b X1 X2 Y a b d X1 X2 Y c d b X1 X2 Y a a c c Il motivo più frequente: X1 è scarsamente correlato con Y Il motivo più frequente : X1 è altamente correlato con Y Il motivo più frequente : X1 è altamente correlato con X2 18 18