La correlazione.

Slides:



Advertisements
Presentazioni simili
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
Advertisements

INTERPOLAZIONE MOD.10 CAP.1
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Come organizzare i dati per un'analisi statistica al computer?
Lo schema IS-LM.
LA VARIABILITA’ IV lezione di Statistica Medica.
Distribuzione Normale o Curva di Gauss
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Lez. 3 - Gli Indici di VARIABILITA’
La regressione lineare trivariata
Scelta del formato di risposta
Descrizione dei dati Metodi di descrizione dei dati
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
DISTRIBUZIONE CAMPIONARIA CONGIUNTA DI DUE VARIABILI (1)
Analisi della varianza (a una via)
Corso di biomatematica lezione 6: la funzione c2
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
Analisi delle corrispondenze
G. Barbaro interpolazione1 INTERPOLAZIONE. G. Barbaro interpolazione1 In Statistica e in genere nelle scienze sperimentali, si studiano o si osservano.
METODI E CONTROLLI STATISTICI DI PROCESSO
Quale valore dobbiamo assumere come misura di una grandezza?
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Le distribuzioni campionarie
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
ANALISI FATTORIALE. Cosè lanalisi fattoriale? Statistica descrittiva Rappresentazione delle variabili in studio. Statistica confermativa vs Confermare,
La ricerca delle relazioni tra fenomeni
Associazione tra due variabili
Introduzione alla Regressione Lineare e alla Correlazione.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Interpolazione e regressione
Simone Mosca & Daniele Zucchini 4Bi.
Regressione e correlazione
La regressione come strumento di sintesi delle relazioni tra variabili
Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. SIGNIFICATIVITÀ.
La verifica d’ipotesi Docente Dott. Nappo Daniela
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Esercitazione 1: Rispetto alla scala di pregiudizio sociale (Media=12; σ=3), calcolare: Quale percentuale della popolazione di adulti italiani otterrà.
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
Strumenti statistici in Excell
Altri coefficienti di correlazione
Il residuo nella predizione
Compito 1: 1) La seguente distribuzione riporta i punteggi di depressione su individui con disturbo post- traumatico da stress: a)Costruire.
Corso di Laurea in Scienze e Tecniche psicologiche
COVARIANZA: DEFINIZIONE E CALCOLO
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
ECONOMIA POLITICA E-I ESERCITAZIONI. 2 Richiami di matematica – Funzioni Funzioni FUNZIONE: ogni regola matematica che permette di calcolare il valore.
“La cassetta degli arnesi”
La distribuzione campionaria della media
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
STATISTICHE DESCRITTIVE
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Esercitazione. Su di un sistema di assi cartesiani si indichino la curva di domanda e di offerta di mercato del bene X. Si indichino graficamente il prezzo.
Correlazione e regressione lineare
Proporzionalità diretta
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Regressione lineare Misure Meccaniche e Termiche - Università di Cassino2 Distribuzioni Correlate Una variabile casuale z, può derivare dalla composizione.
Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
Gli Indici di VARIABILITA’
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Varianza.
Transcript della presentazione:

La correlazione

La correlazione È lo studio della relazione di due variabili misurate su scala a intervalli Il coefficiente di correlazione è la misura descrittiva di tale relazione, che varia fra -1 (relazione perfetta negativa) a +1(relazione perfetta positiva), passando per lo zero (assenza di correlazione lineare).

La relazione positiva indica che all’aumentare di una aumenta anche l’altra, (per esempio, atteggiamento conservatore e autoritarismo, oppure test di abilità cognitiva e medie di voti scolastici) mentre la relazione negativa indica che all’aumentare dell’una l’altra diminuisce, (per esempio età cronologia e test di memoria)

Osserviamo in un grafico, detto diagramma di dispersione, alcuni casi possibili di correlazione, usando due variabili standardizzate.

Correlazione positiva È possibile tracciare una retta che passi vicino a molti punti corrispondenti alle osservazioni compiute (ovvero che approssimi bene i punteggi). La retta passerà nel primo e terzo quadrante degli assi cartesiani.

Correlazione negativa È possibile tracciare una retta che passi vicino a molti punti corrispondenti alle osservazioni compiute (ovvero che approssimi bene i punteggi). La retta passerà nel secondo e quarto quadrante degli assi cartesiani.

* Perché le rette sono inclinate in questo modo? Proviamo a moltiplicare tra loro i segni delle variabili dipendente e indipendente nei vari quadranti: + + = + - + = - - - = + + - = - + correlazione positiva - correlazione negativa

Assenza di correlazione Non è possibile tracciare una retta che passi molto vicino ai punti corrispondenti alle osservazioni compiute (ovvero che approssimi bene i punteggi). I punti sono sparsi più o meno equamente nei quattro quadranti degli assi cartesiani.

Correlazione non lineare (curvilineare) Per approssimare in modo adeguato i punteggi occorre tracciare non una retta, come negli esempi precedenti, ma una curva. Questo esempio di correlazione non sarà trattato.

Come quantificare questa relazione? Con la media dei prodotti dei punti zeta rxy = coefficiente di correlazione di Bravais - Pearson zxi = punteggio standardizzato relativo alla variabile indipendente x ottenuto da un soggetto i zyi = punteggio standardizzato relativo alla variabile dipendente y ottenuto da un soggetto i N = numerosità del campione 10

Trasformazione in punti zeta quadrato del punteggio   soggetto test K scarto dalla media quadrato dello scarto quadrato del punteggio punto zeta (*) Anna 1 -3,4 11,56 -1,247 Brigida 2 -2,4 5,76 4 -0,880 Carlo -0,4 0,16 16 -0,147 Delia 7 2,6 6,76 49 0,953 Enrico 8 3,6 12,96 64 1,320 somma 22 37,2 134 media 4,4 7,44 26,8 varianza 7,44 [trovato con (26,8 – (4,4)2] dev stand 2,728 (*) z= (grezzo - media)/dev. stand.

Retta di trasformazione dei punti zeta e degli scarti dalla media

Esempio di calcolo -0,76 Anna 1 -1,25 9 1,53 -1,91 Brigida 2 -0,88 7 soggetto Test R punto zeta R [zx] Test Q punto zeta Q [zy ] Prodotto [zx· zy] Anna 1 -1,25 9 1,53 -1,91 Brigida 2 -0,88 7 0,77 -0,67 Carlo 4 -0,15 -1,15 0,17 Delia 0,95 -0,38 -0,37 Enrico 8 1,32 3 -0,77 -1,01 somma 22 25 -3,80 media 4,4 5 -0,76 varianza 7,44 6,8 dev stand 2,73 2,61 [correlazione= sommatoria(zx· zy)/ N]

Caratteristiche del coefficiente di correlazione di Bravais-Pearson (rxy) Varia fra -1 (correlazione negativa perfetta) e +1 (correlazione positiva perfetta). Se r = 0 : correlazione lineare assente. Indice standardizzato, e non una misura, quindi senza dimensione.

Calcolo del coefficiente r usando i dati grezzi soggetto Test R Quadrato di R Prodotto di R · Q Test Q Quadrato di Q Anna 1 9 81 Brigida 2 4 14 7 49 Carlo 16 8 Delia 28 Enrico 64 24 3 somma 22 134 83 25 159 media 4,4 26,8 16,6 5 32 varianza 7,44 6,8 dev. stand. 2,728 2,608

Formula che usa le cinque somme Dall’esempio precedente: ΣX=22 ΣX2=134 ΣY=25 ΣY2=159 ΣXY=83 N = 5 Quindi, applicando la formula, troverò:

Coefficienti di correlazione e grafici corrispondenti

Il coefficiente di determinazione Il quadrato del coefficiente di correlazione (r2) indica la quota di varianza comune fra le due variabili. Se moltiplicato per 100, indica la percentuale di varianza comune fra le due variabili. Esempio: rxy =-50, r2xy = 0,25 = 25 % varianza comune

Valori di r e interpretazione possibile <0,30 Inifluente, importante solo per ragioni teoriche 0,30 basso 0,40 dicreto 0,50,-0,60 Buono o molto buono 0,70 Eccellente ,80 Fantastico, 0,90 sospetto 0,9 - 0,99 Stessa variabili, correlazione fra somme delle stesse variabili I coefficienti di correlazione in psicologia sono suscettibili di questa interpretazione

Variabilità di r Ecco 100 estrazioni di 3 5 10 40 coppie di dati casuali, presentati come istogrammi.

Altri coefficienti di correlazione Coefficiente punto-biseriale Coefficiente fi (φ) Sono strettamente equivalenti al coefficiente di correlazione prodotto- momento di Bravais-Pearson. Si usano quando una (pb) o entrambe (fi) le misurazioni sono dicotomiche. La differenza di nome e di formula aveva senso quando era importante disporre di forme abbreviate di calcolo. Non c’è nessuna differenza nei risultati se non la formula e il nome.

Altri coefficienti di correlazione Quando una o entrambe le variabili sono dicotomiche, ma presuppongono una distribuzione continua e normale (es: accordo per un item) si usano i coefficienti: Biseriale Tetracorico (entrambe dicotomiche).

Il coefficiente policorico Si usa con le variabili continue che presuppongono una partizione in più parti (non solo in due come per il c. tetracorico), tipica degli item di un questionario. Si usa generalmente nei programmi di modellistica strutturale (SEM, LISREL). Richiede molte centinaia di casi per il calcolo