L’analisi di regressione e correlazione Prof. Luigi Piemontese.

Slides:



Advertisements
Presentazioni simili
INTERPOLAZIONE MOD.10 CAP.1
Advertisements

I SISTEMI LINEARI.
MATEMATICA PER L’ECONOMIA
Funzioni di due variabili
Come organizzare i dati per un'analisi statistica al computer?
Dipartimento di Economia
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
FUNZIONI DI DUE VARIABILI
LE DERIVATE APPROCCIO INTUITIVO.
La regressione lineare trivariata
(se a = 0 l’equazione bx + c = 0 è di primo grado)
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
ANALISI DELLA COVARIANZA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
STATISTICA 6.0: REGRESSIONE LINEARE
Elementi di Matematica
Elementi di Matematica
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
MODELLO DI REGRESSIONE LINEARE MULTIPLA
DISTRIBUZIONE CAMPIONARIA CONGIUNTA DI DUE VARIABILI (1)
La logica della regressione
La forma normale di un’equazione di secondo grado è la seguente:
Sistemi di equazioni lineari
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
Modello di regressione lineare semplice
G. Barbaro interpolazione1 INTERPOLAZIONE. G. Barbaro interpolazione1 In Statistica e in genere nelle scienze sperimentali, si studiano o si osservano.
Equazioni di 2° grado.
Lezione 13 Equazione di Klein-Gordon Equazione di Dirac (prima parte)
Propagazione degli errori
“Il Piano cartesiano e la retta” realizzato dagli studenti della 2ª B Aielli Luca Pasquini Daniele Rosato Anna.
Quale valore dobbiamo assumere come misura di una grandezza?
La ricerca delle relazioni tra fenomeni
Introduzione alla Regressione Lineare e alla Correlazione.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
COVARIANZA e CORRELAZIONE.
Cenni teorici. La corrente elettrica dal punto di vista microscopico
Interpolazione e regressione
Regressione e correlazione
La regressione come strumento di sintesi delle relazioni tra variabili
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Strumenti statistici in Excell
Analisi Multivariata dei Dati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
“La cassetta degli arnesi”
La retta Prof. Nunzio ZARIGNO.
TRATTAMENTO STATISTICO DEI DATI ANALITICI
LA RETTA NEL PIANO CARTESIANO
Le funzioni matematiche e il piano cartesiano
La derivata Docente Grazia Cotroni classi V A e V B.
Equazioni Che cosa sono e come si risolvono. Osserva le seguenti uguaglianze: Equazioni Che cosa sono Queste uguaglianze sono «indeterminate», ovvero.
Teoremi sulle funzioni derivabili 1. Definizione di massimo globale x0x0 f(x 0 ) Si dice massimo assoluto o globale di una funzione il più grande dei.
IISS "E. Medi" - Galatone Prof. Giuseppe Frassanito a.s. 2012/2013
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
Il Moto. Partendo da una quesito assegnato nei test di ingresso alla facoltà di medicina, si analizza il moto di un oggetto.
Regressione lineare Misure Meccaniche e Termiche - Università di Cassino2 Distribuzioni Correlate Una variabile casuale z, può derivare dalla composizione.
Raccogliamo x al primo membro e 2 al secondo:
FUNZIONI MATEMATICHE DANIELA MAIOLINO.
Distribuzioni limite La distribuzione normale Si consideri una variabile casuale rappresentata mediante una combinazione lineare di altre variabili casuali.
prof.Giuseppe Frassanito a.s
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
Gli Indici di VARIABILITA’
Classe II a.s. 2010/2011 Prof.ssa Rita Schettino
Transcript della presentazione:

L’analisi di regressione e correlazione Prof. Luigi Piemontese

L’analisi di regressione e correlazione DATA UNA IPOTESI DI DIPENDENZA DI UNA VARIABILE ASSUNTA COME DIPENDENTE DA UNA O PIU’ VARIABILI ASSUNTE COME INDIPENDENTI SI PUO’ RICORRERE A: –L’analisi di regressione, che ha lo scopo di fornire informazioni circa le determinazioni che ci si può attendere assuma una variabile quando un'altra variabile o un insieme di altre variabili hanno assunto determinazioni note. –L’analisi di correlazione, che ha lo scopo di indicare il grado del loro legame, meglio il grado di associazione, o di mutua dipendenza statistica, che intercorre fra esse.

L’analisi di regressione e correlazione caso di 2 variabili Data una ipotesi di dipendenza fra due variabili, X e Y: se si dispone di un numero n di loro misure, prese in uno stesso sistema in n anni diversi, o alla stessa data in n sistemi analoghi, si possono predisporre i seguenti diagramma per mettere in evidenza se esiste, o meno, una relazione tra i loro rispettivi andamenti:

L’analisi di regressione e correlazione caso di 2 variabili

Se i punti rappresentati nel diagramma a dispersione sembrano avere un andamento medio regolare si pone il problema di individuare quale tipo di curva è più idoneo a descriverlo. Il problema è indeterminato se non si stabiliscono: –il tipo di curva, –le condizioni per il calcolo dei parametri in essa contenuti.

L’analisi di regressione e correlazione caso di 2 variabili In genere si usano funzioni matematiche semplici quali:

L’analisi di regressione e correlazione lineare

e cioè una funzione in cui le incognite sono a e b ed i termini noti sono le n x i e le n y i Se si sostituisce nella sommatoria al quadrato degli errori il valore di y i * calcolato mediante l’equazione della retta si ha:

L’analisi di regressione e correlazione lineare La condizione necessaria affinché una funzione abbia un minimo è che siano uguali a 0 le sue derivate parziali rispetto alle incognite a e b:

L’analisi di regressione e correlazione lineare risolvendo la prima equazione rispetto ad a si ottiene: Le precedenti si possono anche scrivere così: sostituendo a nella seconda equazione si ottiene:

L’analisi di regressione e correlazione lineare che, risolta rispetto a b, dà: moltiplicando numeratore e denominatore per:

L’analisi di regressione e correlazione lineare Sostituendo in si ha:

L’analisi di regressione e correlazione lineare Il concetto di media aritmetica è un concetto semplice ed esprime il valore che si attribuirebbe ad ogni termine se l’ammontare totale fosse equiripartito fra n termini. Distribuzioni diverse possono avere la medesima media, ad esempio la media di n valori uguali e, quindi, a variabilità nulla, potrebbe risultare uguale a quella di valori molto diversi fra loro e, quindi, a variabilità alta. Pertanto, prima di introdurre l’analisi di correlazione, si introducono ora i concetti di varianza e covarianza.

L’analisi di regressione e correlazione lineare La varianza, detta anche media degli scarti al quadrato, è un indice di dispersione che è nullo solo nei casi in cui tutti i valori sono uguali alla loro media e cresce con il crescere delle differenze reciproche dei valori. Varianza di x e di y:

L’analisi di regressione e correlazione lineare La covarianza è un indice che misura la “contemporaneità" della variazione di due variabili. Essa può assumere sia valori positivi che negativi. Nel primo caso indica che al crescere di una caratteristica statisticamente cresce anche l'altra, nel secondo caso accade il contrario. Covarianza di x e y:

L’analisi di regressione e correlazione lineare a e b si possono scrivere nel modo seguente: date la varianza di x, quella di y e la covarianza di x e y: e la retta di regressione diventa:

L’analisi di regressione e correlazione lineare Se si minimizzano gli scarti orizzontali o quelli verticali si possono avere due rette coincidenti o non coincidenti a seconda dell’andamento dei punti P i =(x i,y i ). Si hanno due casi limite: –i punti sono perfettamente allineati; –i punti si distribuiscono uniformemente intorno al loro punto medio nel piano.

L’analisi di regressione e correlazione lineare Se i punti sono perfettamente allineati le due rette coincidono per cui, risolvendo entrambe rispetto ad una stessa variabile, si avranno coefficienti angolari, o di regressione, uguali.

L’analisi di regressione e correlazione lineare Se i punti sono distribuiti in modo uniforme intorno al loro punto medio nel piano, le due rette di regressione sono una parallela all'asse delle X ed una a quello delle Y, per cui si ha: Il prodotto fra b e b’, cui si da il nome di coefficiente di determinazione, varia, pertanto, tra 0 e 1 ed esprime la percentuale della variazione di una variabile spiegata dal variare dell’altra.

L ’analisi di regressione e correlazione lineare Alla radice quadrata del prodotto bb’ si dà invece il nome di coefficiente di correlazione che varia fra -1 e 1: Per convenzione si assume che il segno negativo indichi la correlazione inversa, ovvero quando al crescere del valore assunto da una variabile decresce quello dell'altra, e quello positivo la correlazione diretta, ovvero quando al crescere del valore assunto da una variabile cresce pure quello dell'altra.

L’analisi della regressione parabolica

L’analisi della regressione esponenziale Se è ragionevole interpolare i punti P i con una funzione esponenziale del tipo: dove: si può prendere in considerazione la sua proprietà di as- sumere la forma di una retta in un diagramma in scala semilogatitmica, dove la x è misurata in scala naturale e la y in scala semilogatitmica.

L’analisi della regressione esponenziale

L’indice di correlazione curvilinea La varianza dalla stima è una misura della variazione di y non spiegata dalla variazione di x tramite la funzione di regressione: La variazione totale di y è data dalla varianza: per cui il rapporto: è la proporzione della variabilità di y non spiegata da quella di x

L’indice di correlazione curvilinea Allora la variabilità di y spiegata da quella di x sarà data da: alla cui radice quadrata si da il nome di indice di correlazione curvilinea: Solo nel caso della retta di regressione questo valore sarà uguale al coefficiente di correlazione lineare.

L’analisi della regressione multipla caso di 3 variabili Se è ragionevole ipotizzare che la variazione di y dipenda da quella di altre due variabili x e z si può utilizzare un piano di regressione: e stimarne i parametri a, b e c. la condizione è sempre la stessa si tratta di minimizzare la sommatoria degli errori al quadrato: e risolvere il sistema di equazioni ottenuto ponendo uguali a 0 le derivate parziali di f rispetto ad a, b e c.

L’analisi della regressione multipla caso di 3 variabili Una volta risolto il seguente sistema di equazioni basta sostituire i valori stimati di a, b e c nell’equazione del piano: L’indice di correlazione multipla si calcola nello stesso modo dell’indice di correlazione curvilinea.