STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE

Slides:



Advertisements
Presentazioni simili
Montanari Maria Giulia
Advertisements

Equazioni differenziali
INTERPOLAZIONE MOD.10 CAP.1
I SISTEMI LINEARI.
Funzioni di due variabili
Come organizzare i dati per un'analisi statistica al computer?
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Autovalori e autovettori
METODI EQUAZIONI DIFFERENZIALI Funzioni che mettono in relazione una variabile indipendente ( es. x), una sua funzione ( es. y = f(x) ) e la.
FUNZIONI DI DUE VARIABILI
Fisica: lezioni e problemi
Lez. 3 - Gli Indici di VARIABILITA’
La regressione lineare trivariata
= 2x – 3 x Definizione e caratteristiche
STATISTICA 6.0: REGRESSIONE LINEARE
Elementi di Matematica
Elementi di Matematica
LA PROPAGAZIONE DEGLI ERRORI:
DISTRIBUZIONE CAMPIONARIA CONGIUNTA DI DUE VARIABILI (1)
La logica della regressione
Corso di biomatematica lezione 5: propagazione degli errori
STATISTICA a.a PARAMETRO t DI STUDENT
Modello di regressione lineare semplice
G. Barbaro interpolazione1 INTERPOLAZIONE. G. Barbaro interpolazione1 In Statistica e in genere nelle scienze sperimentali, si studiano o si osservano.
Differenziale di una funzione
INTERPOLAZIONE Si parla di processo di interpolazione quando, conoscendo una serie di dati, sperimentali o statistici, riguardo ad un evento, si vuole.
Metodi numerici per l’approssimazione
Metodi numerici per lapprossimazione Laboratorio di Metodi Numerici a.a. 2008/2009 Prof. Maria Lucia Sampoli.
1 Y Modello di regressione semplice Supponiamo che una variabile Y sia funzione lineare di unaltra variabile X, con parametri incogniti 1 e 2 che vogliamo.
Lezione 13 Equazione di Klein-Gordon Equazione di Dirac (prima parte)
Propagazione degli errori
Esempio: somma se, allora [ per n addendi ] se ( se )
Quale valore dobbiamo assumere come misura di una grandezza?
La ricerca delle relazioni tra fenomeni
Introduzione alla Regressione Lineare e alla Correlazione.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Interpolazione e regressione
INDICE I VALORI MEDI LA MEDIA GEOMETRICA LA MEDIA ARITMETICA
DISEQUAZIONI DI 1° GRADO
Regressione e correlazione
Sottospazi vettoriali
DATA MINING PER IL MARKETING
Fisica: lezioni e problemi
La verifica d’ipotesi Docente Dott. Nappo Daniela
4 < 12 5 > −3 a < b a > b a ≤ b a ≥ b
Strumenti statistici in Excell
Il residuo nella predizione
REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta.
LA RETTA Assi cartesiani e rette ad essi parallele
Metodo di Cramer Dato il sistema lineare a due incognite per risolvere il sistema dobbiamo costruire 3 matrici. È detta matrice un qualsiasi gruppo di.
TRATTAMENTO STATISTICO DEI DATI ANALITICI
LA RETTA NEL PIANO CARTESIANO
Le funzioni matematiche e il piano cartesiano
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
I GRAFICI – INPUT 1.
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Sistemi di equazioni lineari. Sistemi di primo grado di due equazioni a due incognite Risolvere un sistema significa trovare la coppia di valori x e y.
IISS "E. Medi" - Galatone Prof. Giuseppe Frassanito a.s. 2012/2013
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
Regressione lineare Misure Meccaniche e Termiche - Università di Cassino2 Distribuzioni Correlate Una variabile casuale z, può derivare dalla composizione.
Ancora sulle equazioni di secondo grado….. Equazione di secondo grado completa Relazione tra le soluzioni di un'equazione di secondo grado.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
Lezione n° 10 Algoritmo del Simplesso: - Coefficienti di costo ridotto - Condizioni di ottimalità - Test dei minimi rapporti - Cambio di base Lezioni di.
prof.Giuseppe Frassanito a.s
Luoghi di punti In geometria il termine
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
Gli Indici di VARIABILITA’
Classe II a.s. 2010/2011 Prof.ssa Rita Schettino
Transcript della presentazione:

STATISTICA a.a. 2002-2003 METODO DEI MINIMI QUADRATI REGRESSIONE CORRELAZIONE

RELAZIONE FRA VARIABILI Spesso si vuole trovare la relazione che lega due o più variabili (es. la pressione di un gas dipende da temperatura e volume) Vogliamo esprimere questa relazione in forma matematica

INTERPOLAZIONE Dobbiamo raccogliere dati che mostrino valori corrispondenti delle variabili Riportiamo i punti (Xi,Yi) delle due variabili su un sistema di coordinate Vogliamo individuare una curva (relazione non lineare) o una retta interpolante

INTERPOLAZIONE Il tipo più semplice è la retta Y = a0 + a1 X Dati due punti qualsiasi (X1 Y1) e (X2 Y2) , vogliamo determinare a0 e a1 .

INTERPOLAZIONE

INTERPOLAZIONE coefficiente angolare e’ Y per X=0 (ordinata all’origine).

METODO DEI MINIMI QUADRATI

METODO DEI MINIMI QUADRATI Chiamiamo Dn la deviazione (o errore) fra il valore Yn e il corrispondente valore della curva (positiva o negativa) Una misura della “bontà dell’interpolazione” è la somma D12 + D22 …..+ Dn2

METODO DEI MINIMI QUADRATI La curva avente la proprietà che D12 + D22 …..+ Dn2 è minima è detta migliore interpolante o retta/curva dei minimi quadrati.

METODO DEI MINIMI QUADRATI La retta dei minimi quadrati può essere espressa nella forma Y = a0 + a1 X dove a0 e a1 si trovano risolvendo il sistema SY = a0 N+ a1 SX SXY = a0 S X+ a1 SX2 equazioni normali della retta dei minimi quadrati.

METODO DEI MINIMI QUADRATI Si ottiene

METODO DEI MINIMI QUADRATI La prima delle due equazioni si ottiene dalla sommatoria di entrambi i membri di Y = a0 + a1 X , la seconda moltiplicando i membri per X e poi facendo la sommatoria. Per derivare le equazioni si minimizzano le derivate della retta

METODO DEI MINIMI QUADRATI Y1 = a0 + a1 X1 Y2= a0 + a1 X2 …. S=(a0 + a1 X2 -Y1)2 +(a0 + a1 X2 – Y2)2 +…. + (a0 + a1 Xn - Yn)2

LA REGRESSIONE Vogliamo stimare il valore di una variabile Y corrispondente a un dato valore di una variabile X. Si può ottenere questo stimando il valore di Y per mezzo di una curva dei minimi quadrati che interpoli i dati campionari. Questa è detta CURVA DI REGRESSIONE di X su Y. Se X è il tempo (variabile indipendente) i dati indicano i valori di Y in diversi tempi e vengono detti SERIE TEMPORALE. La retta/curva di regressione è detta retta/curva del trend e viene usata per scopi di previsione.

CORRELAZIONE E REGRESSIONE La correlazione indica il grado di relazione fra le variabili. Cercheremo di determinare quanto bene un’equazione spiega tale relazione Se tutti i valori delle variabili soddisfano esattamente un’equazione diciamo che le variabili sono perfettamente correlate (esempio: raggio e circonferenza; altezza e peso saranno in parte correlate).

CORRELAZIONE E REGRESSIONE Date due variabili X e Y costruiamo un diagramma di dispersione con i loro valori. Se tutti i punti giacciono più o meno su una retta, la correlazione è detta lineare e la relazione fra le variabili sarà retta da un’equazione lineare.

CORRELAZIONE E REGRESSIONE Se Y cresce al crescere di X la correlazione è positiva o diretta:

CORRELAZIONE E REGRESSIONE Se Y decresce al crescere di X, la correlazione è detta negativa o inversa: Se i punti stanno su una curva, la correlazione è non lineare.

CORRELAZIONE E REGRESSIONE Se non c’è relazione fra le variabili diciamo che sono incorrelate:

CORRELAZIONE E REGRESSIONE (1) Y = a0 + a1 X Può essere riscritta come dove

CORRELAZIONE E REGRESSIONE Chiamiamo Ystim i valori di Y per dati valori di X secondo una stima compiuta per mezzo della (1). Una misura della dispersione intorno alla retta di regressione di Y su X è oppure errore standard della stima

CORRELAZIONE E REGRESSIONE Il denominatore può anche essere posto a N-2 . L’errore standard della stima ha proprietà analoghe a quelle dello scarto quadratico medio.

COEFFICIENTE DI CORRELAZIONE Chiamiamo devianza totale di Y la somma dei quadrati degli scarti dei valori di Y dalla media Y¯. Si può anche scrivere devianza totale devianza residua devianza spiegata

COEFFICIENTE DI DETERMINAZIONE Se la devianza spiegata è zero (ossia la devianza totale equivale alla residua), r2=0 Se la devianza residua è uguale a zero, cioè devianza totale = devianza spiegata , r2=1 Dunque r2 è sempre positiva e varia fra 0 e 1.

COEFFICIENTE DI CORRELAZIONE Allora definiamo r coefficiente di correlazione

COEFFICIENTE DI CORRELAZIONE r varia fra +1 e –1 (+ o – a seconda di correlazione positiva o negativa). Poiché allora

COEFFICIENTE DI CORRELAZIONE Si dimostra che dove

COEFFICIENTE DI CORRELAZIONE che dà automaticamente il segno di r. Si può riscriverla come