Correlazione e regressione

Slides:



Advertisements
Presentazioni simili
DISEQUAZIONI DI SECONDO GRADO INTERE Un approccio al METODO GRAFICO di risoluzione.
Advertisements

Funzioni reali di variabile reale. Definizione di funzione tra due insiemi Definizione: Dati due insiemi A e B si dice funzione (o anche applicazione)
Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.
Formulario di geometria Analitica Argomento: Punti e Rette Di Chan Yi 3°O a.s. 2009/2010.
FORMULARIO DI ANALITICA di ORIZIO STEFANO. DISTANZA TRA DUE PUNTI Se il segmento è parallelo all'asse x: d=|X 2 -X 1 | Se il segmento è parallelo all'asse.
Disequazioni in una variabile. LaRegola dei segni La disequazione A(x) · B(x) > 0 è soddisfatta dai valori di per i quali i due fattori A(x) e B(x) hanno.
Consentono di descrivere la variabilità all’interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche.
PENSARE DA ECONOMISTI equilibrio e empirismo
Precorso di Statistica per le Lauree Magistrali
La funzione seno è una corrispondenza biunivoca nell’intervallo
Equazioni di 2°grado Prof.ssa A.Comis.
x : variabile indipendente
Le funzioni matematiche e il piano cartesiano
La parabola e la sua equazione
Analisi dei Dati – Tabelle e Grafici
Corso di Analisi Statistica per le Imprese Cross tabulation e relazioni tra variabili Prof. L. Neri a.a
LA PARABOLA COSTANZA PACE.
Veridicità di fatti e risultati stilizzati nell’industria del beverage
Funzioni crescenti e decrescenti
Piano cartesiano e retta
L’integrale indefinito
GLI STRUMENTI AUSILIARI
La circonferenza nel piano cartesiano
x : variabile indipendente
Le primitive di una funzione
Le disequazioni DEFINIZIONE DISEQUAZIONI EQUIVALENTI
La circonferenza nel piano cartesiano
(continua) Capitolo 4 Le scelte del consumatore e Capitolo 3 (continua) 1.
Il concetto di derivata
PIANIFICAZIONE DEI TRASPORTI Regressione lineare
Analisi delle Traiettorie: Modelli di Crescita Latente (LGM)
Sistema di riferimento su una retta
x : variabile indipendente
Equazioni differenziali
Insiemi di punti: altre caratteristiche
Lo studio completo di una funzione
22) Funzioni (prima parte)
Prof.ssa Carolina Sementa
MATEMATICA III.
Le trasformazioni nel piano cartesiano
Corso di Laurea in Scienze e tecniche psicologiche
Scelte di consumo curva di domanda
Precorso di Statistica per le Lauree Magistrali
misure di eterogeneità
PENSARE DA ECONOMISTI equilibrio e empirismo
Statistica descrittiva bivariata
L’equazione dell’ellisse
Indici di variabilità La variabilità è la ragione dell’esistenza della psicologia. Le persone hanno dei comportamenti diversi che non possono essere predetti.
Corso di Analisi Statistica per le Imprese 2
LA PARABOLA E LA SUA EQUAZIONE
Esercitazioni psicometria
LE DISEQUAZIONI DI SECONDO GRADO
Confronto tra diversi soggetti:
Statistica descrittiva bivariata
Statistica descrittiva bivariata
LA RETTA.
Le primitive di una funzione
Produttività e isoquanti
Precorso di Statistica per le Lauree Magistrali
Economia Politica Lezione 4 B
IPSART “R. Drengot” – Aversa (CE) – Prof. Nunzio ZARIGNO
Esercizio 1 Si vuole studiare la mobilità di voto degli elettori di una certa circoscrizione. Da un sondaggio telefonico risulta che: Si calcolino le distribuzioni.
Associazione tra due variabili
L’EQUAZIONE DI UNA RETTA
Equazioni di 2°grado Prof.ssa A.Comis.
Interazioni tra v.i.: analisi di moderazione
Variabile interveniente
Statistica descrittiva bivariata
LA PARABOLA Esercitazioni Dott.ssa Badiglio S..
La circonferenza Esercitazioni Dott.ssa Badiglio S.
Transcript della presentazione:

Correlazione e regressione Dipendenza - Regressione Si presuppone che una variabile (Y) sia influenza-ta da un’altra (X). Ad es., Reddito (X) e Risparmio (Y). Interdipendenza - Correlazione Il caso contrario (non vi è alcuna ipotesi). Ad es., Reddito (X) Spesa beni necessari (Y)

Correlazione Interdipendenza (alcuni esempi) Valore medio della temperatura e n. di svaghi in un mese Età al matrimonio tra M e F. Reddito tra Mariti e Mogli

CLASSE SOCIALE ELEVATA Correlazione ? MENARCA PRECOCE ALTO QI CLASSE SOCIALE ELEVATA Possiamo dire che esiste una relazione causale tra MENARCA e QI? No! E’ una CORRELAZIONE SPURIA

Analisi con il diagramma a punti Al fine di avere informazioni sull’associazione (o interdipendenza) tra due variabili, è utile costruire un diagramma a punti. Paesi Indice fertilità totale % donne che usano contraccettivi UK 1,8 82 USA 2,1 71 Gambia 5,4 12 Indonesia 2,8 55 Messico 3,0 53 Brasile 2,3 66 Uganda 7,1 15 Slovacchia 74 Niger 7,3 4 Botswana 4,7 33

Diagramma a punti Correlazione positiva Correlazione negativa Correlazione nulla o indipendenza

Diagramma a punti

Diagramma a punti Quali informazioni ricaviamo? Sembra esistere una correlazione negativa (all’aumentare della % di donne che usa il contraccettivo diminuisce l’indice di fertilità). La correlazione negativa sembra moderata (scarsa inclinazione dei punti) Come possiamo misurare meglio la “forza” di questo legame statistico?

Coefficiente di correlazione Esiste il coefficiente di correlazione di Bravais-Pearson. Esso è dato da ove

Coefficiente di correlazione Quali sono i valori caratteristici del coeff. di correlazione? Correlazione negativa max -1 Indipendenza 0 Correlazione positiva max +1 Valori di riferimento r < - 0,50 correlazione negativa consistente 0,50 < r < + 0,50 correlazione meno importante r > + 0,50 correlazione positiva consistente

Y X 1,8 82 2,1 71 5,4 12 2,8 55 3,0 53 2,3 66 7,1 15 74 7,3 4 4,7 33 Y-MY X-MX -2.03 35.5 -1.73 24.5 1.57 -34.5 -1.03 8.5 -0.83 6.5 -1.53 19.5 3.27 -31.5 27.5 3.47 -42.5 0.87 -13.5 Y-MY^2 X-MX^2 4.12 1260.25 2.99 600.25 2.46 1190.25 1.06 72.25 0.69 42.25 2.34 380.25 10.69 992.25 756.25 12.04 1806.25 0.76 182.25 41.27 7282.50 (Y-MY)(X-MX) -72.07 -42.39 -54.17 -8.76 -5.40 -29.84 -103.01 -55.83 -147.48 -11.75 -530.70

X Y 20 21 18 22 19 24 26 29 30 27 X Y 20 28 18 19 26 24 29 30 27 21

Correlazione Quando il coefficiente di correlazione non va bene per misurare l’interdipendenza tra due variabili? Quando sussiste una relazione NON LINEARE tra X e Y.

Regressione Dipendenza (alcuni esempi) Valore medio della temperatura e n. di giorni di accensione del riscaldamento Età al primo parto e n. di figli. Reddito familiare e consumi

Regressione Tra la retta rossa e quella verde qual è la migliore? La scelta non potrà essere arbitraria, ma delegata ad un calcolo statistico

Regressione Poiché si è deciso di tracciare una retta, dobbiamo trovare il modo di determinarla. L’equazione sarà Del tutto equivalente a

Regressione a = intercetta della retta sull’asse Y b = coefficiente angolare della retta Un ottimo criterio per trovare la retta è minimizzare le distanze dei punti dalla stessa.

Regressione Applicando quel principio otteniamo Nel caso dell’esercizio su fertilità e contraccezione si ha

Regressione Quindi l’equazione della retta sarà Cosa significa b? Esso rappresenta l’incremento (decremento) nella variabile Y in corrispondenza ad un incremento UNITARIO nella variabile X. Per questo motivo X=variabile indipendente e Y=variabile dipendente

Regressione Cosa significa a? Rappresenta il punto in cui la retta interseca l’asse verticale (Y). 7,09

% donne che usa contraccettivo Regressione Si può usare la retta di regressione a fini previsionali % donne che usa contraccettivo Indice di fertilità 7,09 1 7,02 2 6,95 25 5,34 40 4,29 80 1,49 100 0,09

Regressione Come abbiamo ottenuto i precedenti valori? Allora b indica proprio di quanto diminuisce Y in corrispon-denza ad un incremento unitario in X

Regressione La retta di regressione può anche essere usata a fini previsionali.

Regressione Casi particolari b = 0 b = 

Regressione Ma siamo certi che la retta si adatta bene ai nostri dati? Che sia il modo migliore di spiegare la relazione di dipendenza di Y da X? Studiamo l’adattamento della retta ai dati per mezzo del coefficiente di correlazione. Se i punti stanno tutti sulla retta allora r=1 oppure r=-1 Per eliminare il problema del segno calcoliamo r2

Regressione Per l’es. fertilità-contraccezione si ha Poiché r2 varia tra 0 e 1, allora la retta di regressione della contraccezione sulla fertilità si adatta molto bene ai dati. Inoltre il coefficiente r2 spiega quanta parte della variabilità totale è interpretata dalla retta.

Esempio

Esempio Media X = 60,6 Media Y = 60 Dev(X) = 5624 Dev (Y) =1727,6 Cod (XY) = 2524,8 r = 0,81 y = a + bx = 32,8 + 0,45 x