REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta.

Slides:



Advertisements
Presentazioni simili
Corso di esperimentazione di fisica 1 Il metodo dei minimi quadrati
Advertisements

INTERPOLAZIONE MOD.10 CAP.1
Come organizzare i dati per un'analisi statistica al computer?
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Variabili casuali a più dimensioni
Fisica: lezioni e problemi
Analisi dei dati per i disegni ad un fattore
La regressione lineare trivariata
Residuo = yi – (bxi + a) La linea costruita con il metodo dei minimi quadrati è tale da minimizzare la somma dei quadrati dei residui corrispondenti a.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
MODELLO DI REGRESSIONE LINEARE MULTIPLA
Dip. Economia Politica e Statistica
Analisi della varianza (a una via)
La logica della regressione
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Corso di biomatematica lezione 5: propagazione degli errori
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
Modello di regressione lineare semplice
G. Barbaro interpolazione1 INTERPOLAZIONE. G. Barbaro interpolazione1 In Statistica e in genere nelle scienze sperimentali, si studiano o si osservano.
INTERPOLAZIONE Si parla di processo di interpolazione quando, conoscendo una serie di dati, sperimentali o statistici, riguardo ad un evento, si vuole.
Metodi numerici per lapprossimazione Laboratorio di Metodi Numerici a.a. 2008/2009 Prof. Maria Lucia Sampoli.
Esempio: somma se, allora [ per n addendi ] se ( se )
Quale valore dobbiamo assumere come misura di una grandezza?
STATISTICA PER LE DECISIONI DI MARKETING
LA SCOMPOSIZIONE DI POLINOMI IN FATTORI
Di Capuano,Colucci e Panunzi Valori medi I valori medi.
MEDIE STATISTICHE.
La ricerca delle relazioni tra fenomeni
Da cui sostituendo il subject S a P2 si avrà:
Interpolazione e regressione
INDICE I VALORI MEDI LA MEDIA GEOMETRICA LA MEDIA ARITMETICA
Regressione e correlazione
La regressione come strumento di sintesi delle relazioni tra variabili
DATA MINING PER IL MARKETING
Cap. 13 Regressione 1. Modello statistico Un modello statistico è una formula che interpreta e sintetizza matematicamente il comportamento congiunto di.
DATA MINING PER IL MARKETING
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Regressione Lineare parte 1
Fisica: lezioni e problemi
Regressione Lineare parte 2 Corso di Misure Meccaniche e Termiche David Vetturi.
DATA MINING PER IL MARKETING
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Il residuo nella predizione
IL CAMPIONE.
Analisi Multivariata dei Dati
Funzione y = f (x).
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
I modelli di valutazione delle opzioni su tassi
A.A STATISTICA E CALCOLO DELLE PROBABILITA’ Docenti: Stefania Mignani Maurizio Brizzi.
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Proporzionalità diretta
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
I GRAFICI – INPUT 1.
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
DIPENDENZA STATISTICA TRA DUE CARATTERI Per una stessa collettività può essere interessante studiare più caratteri presenti contemporaneamente in ogni.
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Classi di addettiF >2504 La seguente tabella riporta la distribuzione di 100 aziende per classi di addetti. a.Si calcoli:
Transcript della presentazione:

REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta di prevedere i valori della variabile risposta, dati i valori delle variabili esplicative

Indipendenza in Generale(1) In matematica si dice che la variabile y non dipende dalla variabile x quando essa rimane costante al variare dei valori assunti da x. Nel caso contrario si dice che la y dipende ed è funzione di x. …

Indipendenza in Generale (2) Partendo da questa definizione, è immediato stabilire se c’è INDIPENDENZA tra due V.S. espresse da una serie di coppie di valori. Nel caso di TABELLE A DOPPIA ENTRATA, perché ci sia indipendenza si deve verificare: Per tutte le caselle della tabella. L’INDIPENDENZA E’ RECIPROCA

Indipendenza in media (1) La moderna metodologia ha grandemente valorizzato la sostituzione delle distribuzioni parziali con i corrispondenti valori medi. Quando ricorrono le condizioni, si sarebbe indotti a ritenere che la relazione tra x e y farebbe corrispondere ad x il valore medio delle dato da …

Indipendenza in media (2) …quindi se si ha INDIPENDENZA IN MEDIA DI Y DA X. Così anche considerando le distribuzioni parziali di x dati da si ha INDIPENDENZA IN MEDIA di X da Y. se

Analisi della Dipendenza (1) (regressione lineare semplice) Nel caso in cui tra i due caratteri esiste una relazione unidirezionale nel senso che X indica il CARATTERE ANTECEDENTE o INDIPENDENTE e Y il CARATTERE CONSEGUENTE o DIPENDENTE si parla di DIPENDENZA DEL CARATTERE Y DAL CARATTERE X.

Analisi della Dipendenza (2) (regressione lineare semplice) Analisi della Dipendenza (2) (regressione lineare semplice) yi = a + bxi + εi dove: a è l’intercetta b è il coefficiente di regressione εi è l’errore relativo all’osservazione i-esima

Regressione lineare semplice (1) Il calcolo dei parametri della RETTA DI REGRESSIONE si effettua con il metodo dei MINIMI QUADRATI; in altre parole si sceglie la retta per la quale la somma dei quadrati degli scostamenti tra i valori teorici e quelli osservati del carattere y sia minima: ossia: …

Regressione lineare semplice (2) risolvendo abbiamo: dove σY e σx indicano gli scarti quadratici medi delle variabili X e Y e r(X,Y) indica il coefficiente di correlazione lineare LA STIMA DELLA RETTA DI REGRESSIONE E’ UN POTENTE STRUMENTO PREVISIVO

Regressione (3) Proprietà dei residui della retta di regressione …

Indice di Determinazione DEVIANZA TOTALE DEVIANZA DI REGRESSIONE DEVIANZA RESIDUA = INDICE DI DETERMINAZIONE, esprime QUANTA PARTE DELLA DEVIANZA TOTALE DI Y E’ DETERMINATA DALLA RETTA DI REGRESSIONE

REGRESSIONE LINEARE MULTIPLA 1

REGRESSIONE LINEARE MULTIPLA 2 Il piano interpolante è Per determinare il piano interpolante si tratta pertanto di stimare il vettore di parametri b sulla base dei dati a disposizione. Utilizzando il criterio di ottimalità dei minimi quadrati i parametri b si otterrano minimizzando il quadrato della distanza euclidea: