Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.

Slides:



Advertisements
Presentazioni simili
Tecniche di analisi dei dati e impostazione dell’attività sperimentale
Advertisements

Come organizzare i dati per un'analisi statistica al computer?
LA VARIABILITA’ IV lezione di Statistica Medica.
Analisi dei dati per i disegni ad un fattore
La regressione lineare trivariata
Residuo = yi – (bxi + a) La linea costruita con il metodo dei minimi quadrati è tale da minimizzare la somma dei quadrati dei residui corrispondenti a.
Regressione lineare Esercitazione 24/01/04.
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
STATISTICA 6.0: REGRESSIONE LINEARE
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
MODELLO DI REGRESSIONE LINEARE MULTIPLA
Analisi della varianza (a una via)
La logica della regressione
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Alcune domande agli autori Lo studio affronta un argomento scientifico e/o clinico importante? Lo studio è originale? Lo studio è volto a provare le ipotesi.
Corso di biomatematica lezione 7-2: Test di significatività
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
Statistica con Excel Procedure utili per l’analisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011 Edizione 2011 prog. Giocìvanni Raho.
Modello di regressione lineare semplice
Linee guida per la Chimica Analitica Statistica chemiometrica
Analisi della varianza
Principali analisi statistiche
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
La ricerca delle relazioni tra fenomeni
Interpolazione e regressione
Simone Mosca & Daniele Zucchini 4Bi.
Regressione e correlazione
DATA MINING PER IL MARKETING
DATA MINING PER IL MARKETING
Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. SIGNIFICATIVITÀ.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
Strumenti statistici in Excell
Altri coefficienti di correlazione
Il residuo nella predizione
Corso di Laurea in Scienze e Tecniche psicologiche
Metodi Quantitativi per Economia, Finanza e Management Lezione n°10 Regressione lineare multipla: la valutazione del modello, metodi automatici di selezione.
Analisi Multivariata dei Dati
REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Riportare il segnale sulla scala Y
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Correlazione e regressione lineare
La regressione statistica IL CASO UNIVARIATO Consideriamo due variabili continue proponendoci di INDAGARE se esiste una relazione tra loro. Normalmente.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
DEFINIRE I REQUISITI DEL CLIENTE SVILUPPARE E VALUTARE IL QUESTIONARIO IMPIEGARE IL QUESTIONARIO Dimensioni della qualità 1.Perfomance 2.Optionals 3.Affidabilità.
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
Regressione lineare Misure Meccaniche e Termiche - Università di Cassino2 Distribuzioni Correlate Una variabile casuale z, può derivare dalla composizione.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.
L’analisidei dati L’analisi dei dati Analisi mutlidimensionali: Analisi delle corrispondenze multiple Cluster Analysis.
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione

Analisi di relazioni tra variabili Correlazione: analizza se esiste una relazione tra due variabili (come e quanto due variabili variano insieme) Regressione: analizza la forma della relazione tra variabili

Correlazione di variabili

2 coefficienti di correlazione: PearsonPearson product-moment (parametrico) SpearmanSpearman rank correlation (non parametrico) Entrambi vanno da -1 (correl. negativa) a +1 (correl. positiva). 0 corrisponde ad assenza di correlazione Analizzare la correlazione

CORRELAZIONE PARAMETRICA Assunzioni: entrambe le variabili devono essere continue i dati devono essere secondo una scala a intervalli o razionale entrambe le variabili devono seguire una distribuzione normale la relazione tra le variabili è lineare Coefficiente di correlazione di Pearson: r

Tipo di dati Scala nominaleScala nominale: categorie non ordinabili (es. ambiente:macchia/pineta/faggeta; forma foglia:ellittica/lanceolata...) Scala ordinaleScala ordinale: categorie ordinabili (es. alto/medio/basso; raro/comune/abbondante) Scala per intervalliScala per intervalli: distanza quantificabile tra categorie, è possibile sottrarre (es. date, temperature) Scala razionaleScala razionale: possibile tutte le operazioni (+ - * ÷), variabili quantitative (es. lunghezza)

Procedura: Calcolo di r tra le variabili X e Y: Coefficiente di correlazione di Pearson: r

La correlazione è significativa? Ipotesi nulla: = 0 ( è il coefficiente di correlazione della popolazione, r del campione). Calcolare t: Valutare significatività di t per GDL = n-2 Coefficiente di correlazione di Pearson: r

OK: la correlazione è significativa ma…. Le 2 variabili sono distribuite normalmente? La relazione tra le 2 variabili è lineare? (cf. trasformazione dei dati) Anche se cè correlazione non vuol dire che ci sia nesso di causa-effetto Osservare la frazione di variabilità spiegata (r 2, coefficiente di determinazione) Coefficiente di correlazione di Pearson: r

CORRELAZIONE NON PARAMETRICA CORRELAZIONE NON PARAMETRICA : I dati non devono necessariamente avere distribuzione normale Si possono usare dati da scala ordinale Si possono utilizzare anche campioni piccoli (da 7 a 30 coppie di dati) La relazione tra le 2 variabili è monotona Coefficiente di correlazione di Spearman: r s

Procedura: Ordinare i dati dal più piccolo al più grande Calcolare r s non sui dati ma sui ranghi (d=differenza tra ranghi) r s = 1 - 6*(d d d n 2 )/(n(n 2 -1)) Valutare la significatività di r s ricorrendo ad apposite tavole Coefficiente di correlazione di Spearman: r s

Lo scopo dellanalisi di regressione è di determinare la forma della relazione funzionale tra variabili (relazione causa-effetto) Regressione semplice: Regressione semplice: determinare la forma della relazione tra 2 variabili (una indipendente ed una dipendente) Regressione multipla: Regressione multipla: determinare la forma della relazione tra più variabili (più indipendenti ed una dipendente) Analisi di regressione

Perché è importante Perché è importante: Permette di costruire un modello funzionale della risposta di una variabile (effetto) rispetto ad unaltra (causa) Conoscendo la forma della relazione funzionale tra variabile indipendente e dipendente è possibile stimare il valore della variabile dipendente conoscendo quello della variabile indipendente (interpolazione) nellintervallo dei valori di X usato per la regressione Analisi di regressione

Nella regressione lineare la relazione tra variabili (causa-effetto) è rappresentata da una linea retta Regressione lineare (semplice) N.B.: se siamo indecisi su quale delle nostre variabili è dipendente e quale indipendente, allora lanalisi di regressione non è adatta!

La relazione tra variabili è espressa dallequazione: Y = a+bX dove X è la variabile indipendente, Y la variabile dipendente, a è lintercetta (il valore di y quando x =0) e b è la pendenza (di quanto varia la Y per ogni variazione di una unità di X ). N.B.: La retta passa sempre per il punto di incontro delle medie delle due variabili Regressione lineare

PARAMETRICO PARAMETRICO :Assunzioni: Dati da scala per intervalli o scala razionale La variabile indipendente ( X ) è misurata senza errore (è fissata dallo sperimentatore) La variabile dipendente ( Y ) è campionata indipendentemente a ogni valore di X Ad ogni valore di X i dati Y seguono la distribuzione normale e hanno la stessa varianza Regressione lineare

Procedura: Procedura: metodo dei minimi quadrati (least squares) Regressione lineare

Minimi Quadrati

Procedura Procedura: 1. Stima della pendenza Regressione lineare 2. Stima dellintercetta

Regressione lineare Variazione (devianza) spiegata / non spiegata dalla regressione nei dati Y La variazione totale nei dati Y in parte è spiegata dalla regressione non ed in parte non è spiegata dalla regressione (variazione residua)

Regressione lineare Come quantificare la bontà della regressione? Il coefficiente di determinazione (va da 0 a 1)

Regressione lineare La regressione è significativa? Lequazione è stata ricavata da un campione e non dalla popolazione 1. Test t sullerrore standard della pendenza b : Ipotesi nulla = la pendenza è uguale a 0 2. Analisi della varianza: si esamina il rapporto tra varianza spiegata dalla regressione e varianza residua.

Regressione lineare test F 2. Analisi della varianza: test F del rapporto tra varianza spiegata dalla regressione e varianza residua.