Associazione tra due variabili

Slides:



Advertisements
Presentazioni simili
- le Medie la Moda la Mediana
Advertisements

Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
Come organizzare i dati per un'analisi statistica al computer?
Il senso dei dati: Elaborazione e Interpretazione.
STATISTICA DESCRITTIVA
La teoria di portafoglio: cap.7-9
LA DISTRIBUZIONE NORMALE
Variabili casuali a più dimensioni
Pianificare l'investigazione – Progetto sperimentale E' necessario assolutamente conoscere quali sono le variabili –Cosa state facendo cambiare Come lo.
Variabilità Variabilità: inevitabile fluttuazione dei fenomeni naturali, fisici, sociali ecc le indicazioni fornite dalle misure di tendenza centrale (media.
Lez. 3 - Gli Indici di VARIABILITA’
La trasformazione dei punteggi
Descrizione dei dati Metodi di descrizione dei dati
ANALISI DELLA COVARIANZA
Progetto Pilota 2 Lettura e interpretazione dei risultati
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
RELAZIONI TRA 2 FENOMENI QUANTITATIVI STATISTICA A – K (60 ore) Marco Riani
VARIABILI DOPPIE: UN ESEMPIO
STATISTICA DESCRITTIVA
DISTRIBUZIONE CAMPIONARIA CONGIUNTA DI DUE VARIABILI (1)
COSA VUOL DIRE FARE STATISTICA
Progetto di statistica “SIAMO TUTTI STATISTICI”
Corso di biomatematica lezione 6: la funzione c2
Modello di regressione lineare semplice
Analisi delle corrispondenze
Misurazione Le osservazioni si esprimono in forma di misurazioni
Nicola Paparella, Università degli Studi, Lecce, aprile 2006 Pedagogia sperimentale Note ed appunti Corso di base / 5
Elementi di STATISTICA DESCRITTIVA
GRAFICO DI UNA FUNZIONE
STATISTICA PER LE DECISIONI DI MARKETING
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Esercizio 1: La seguente distribuzione riporta i punteggi di un test sullo spettro autistico misurato su un gruppo di bambini: a)Costruire una tabella.
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
La ricerca delle relazioni tra fenomeni
Introduzione alla Regressione Lineare e alla Correlazione.
Proprietà delle matrici con variabili standardizzate.
COVARIANZA e CORRELAZIONE.
Correlazione e regressione Correlazione Come posso determinare il legame tra due o più variabili? COEFFICIENTE DI CORRELAZIONE (r di Pearson) massimo.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Esercizio 1: La seguente distribuzione riporta i punteggi di un test sullo spettro autistico misurato su un gruppo di bambini: a)Costruire una tabella.
Legge o relazione della Proporzionalità diretta e inversa
Anova a due fattori Esempio di piano fattoriale: il caso della progettazione robusta di batterie Tipo di Materiale Temperatura (°F)
Corso di Analisi Statistica per le Imprese Cross tabulation e relazioni tra variabili Prof. L. Neri a.a
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
COSA VUOL DIRE FARE STATISTICA
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
Il residuo nella predizione
Compito 1: 1) La seguente distribuzione riporta i punteggi di depressione su individui con disturbo post- traumatico da stress: a)Costruire.
Martina Serafini Martina Prandi
Esercizio 1: 1) La seguente distribuzione riporta i punteggi di ansia misurata su studenti di psicometria:
La correlazione.
3 June Biostatistica Biostatitistica= Statistica per scienze Biostatitistica= Statistica per scienze biologiche e sanitarie. biologiche e sanitarie.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
ECONOMIA POLITICA E-I ESERCITAZIONI. 2 Richiami di matematica – Funzioni Funzioni FUNZIONE: ogni regola matematica che permette di calcolare il valore.
STATISTICHE DESCRITTIVE
TRATTAMENTO STATISTICO DEI DATI ANALITICI
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
Esponenziali e Logaritmi
Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Compito 1: 1)La seguente distribuzione riporta i punteggi di ansia su un campione non clinico: a)Costruire una tabella di frequenza, indicando: f, fc,
Elementi di statistica descrittiva Prof.ssa Nadia Andreuzzi
Associazione tra due variabili
Transcript della presentazione:

Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili, ossia per capire il grado di associazione tra due variabili. Variabili quantitative: si parla di correlazione tra variabili e si utilizza il grafico di dispersione Variabili qualitative: si parla di dipendenza tra variabili e si usa la tabella di frequenza doppia

Variabili quantitative SOGGETTI ANSIA DEPRESSIONE 1 5 7 2 3 4 9 6 8 La relazione tra due variabili quantitative si rappresenta sul “grafico di dispersione”, utilizzando i punteggi di ciascun soggetto in X e in Y come coordinate. Per interpretare il grafico si usano le medie delle due variabili, che vanno a formare 4 quadranti.

Grafico crescente: ansia e depressione

Grafico decrescente: ansia e voto

Punteggi sparsi: ansia e intelligenza

Il grafico di dispersione Quando la nuvola di punti è inclinata verso l’alto, da sinistra a destra, vi è una relazione crescente : le variabili sono direttamente proporzionali. Quando la nuvola di punti è inclinata verso il basso, da sinistra a destra, vi è una relazione decrescente : le variabili sono inversamente proporzionali. Quando la nuvola di punti è sparsa, ossia vi sono dei punti in tutti i quadranti, vi è assenza di correlazione.

La correlazione La correlazione è un “valore” che esprime la relazione lineare tra due variabili quantitative, ossia indica se e quanto due variabili “variano” insieme. È necessario pertanto calcolare la “covarianza” e poi, per standardizzare, ossia dividere per il prodotto delle due deviazioni standard. Essendo un coefficiente standardizzato varia tra -1 e 1. -1<r<-0,5 -0,5<r<0,5 0,5<r<1 Correlazione alta e negativa Assenza di correlazione Correlazione alta e positiva

Calcolo della varianza La varianza indica quanto variano i punteggi di una variabile e consiste nel calcolare la somma degli scarti quadratici, diviso N Per calcolare la covarianza, invece, bisogna considerare due variabili contemporaneamente. Per calcolare la correlazione, la covarianza deve essere standardizzata per il prodotto delle due deviazioni standard.

Calcolo del coefficiente r rxy= Coefficiente di correlazione di Pearson Numeratore = covarianza (σ2XY) Denominatore = prodotto delle deviazioni standard

Calcolo del coefficiente r Sog X Y 1 5 7 2 3 4 9 6 8 (X-4) (Y-6) 1 -2 -1 -3 -4 3 2 (X-4) (Y-6) 1 2 12 9 4 (X-4)2 (Y-6)2 1 4 9 16 Σ28/6 Σ32/6 σ=√4,67 σ=√5,33 Σ29 Cov=29/6 Cov=4,83 Ẍ 4 Ȳ 6 σx 2,16 σy 2,31 σxσy 4,99

Coefficiente r rxy=0,97 Essendo r compreso tra 0,5 e 1, e come anticipato dal grafico la correlazione è alta e positiva.

Formule alternative: punti z (da non usare) Procedura: 1) Calcolare i punti z per X e Y; 2) Moltiplicare i punti z relativi allo stesso soggetto; 3) Sommare tutti i prodotti 4) Dividere per N

Calcolo del coefficiente r: Punti z Sog X Y 1 5 7 2 3 4 9 6 8 Zx Zy Zx Zy 0,46 0,43 0,2 -0,93 -0,43 0,4 -1,39 -1,73 2,4 -0,46 1,39 1,30 1,8 0,93 0,87 0,8 Σ5,8 Ẍ 4 Ȳ 6 σx 2,16 σy 2,31 σxσy 4,99

Formula alternativa “semplificata” (da non usare) Procedura: Moltiplicare ciascun punteggio di X per il relativo punteggio di Y Sommare tali prodotti Dividere per N Sottrarre per il prodotto delle medie di X e Y Dividere il numeratore per il prodotto delle DS

Calcolo del coefficiente r: f. sempl. X Y 1 5 7 2 3 4 9 6 8 X*Y 35 10 2 15 63 48 Σ173 Mx 4 My 6 MxMy 24 σx 2,16 σy 2,31 σxσy 4,99

Interpretazione di r Il coefficiente r di Pearson è sempre compreso tra -1 ed 1. In particolare: -1<r<-0,5 -0,5<r<0,5 0,5<r<1 Correlazione alta e negativa: grafico decrescente Assenza di correlazione: assenza di linearità Correlazione alta e positiva: grafico crescente

Esercitazione: Costruire il grafico di dispersione e calcolare la correlazione Soggetti Ansia Intelligenza 1 2 5 3 4

Grafico di dispersione Possiamo supporre che vi sia assenza di correlazione, poiché i punti sono sparsi

Calcolo del coefficiente r Sog X Y 1 2 5 3 4 (X-3) (Y-4) -1 1 -2 (X-3) (Y-4) -1 (X-3)2 (Y-4)2 1 4 Σ2/4 Σ6/4 σ=√0,5 σ=√1,5 Σ-1 Cov=-1/4 Cov=-0,25 Ẍ 3 Ȳ 4 σx 0,71 σy 1,22 σxσy 0,87 Assenza di correlazione