Analisi bivariata Passiamo allo studio delle relazioni tra variabili

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
L’Analisi della Varianza ANOVA (ANalysis Of VAriance)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI
Il chi quadro indica la misura in cui le
Variabili casuali a più dimensioni
Analisi dei dati per i disegni ad un fattore
Gli errori nell’analisi statistica
Progetto Pilota 2 Lettura e interpretazione dei risultati
Elementi di STATISTICA DESCRITTIVA
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8.
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Popolazione, campione, parametri e stimatori
Esercizio 1 In una indagine statistica si vuole rilevare il numero di cellulari posseduti dagli studenti iscritti alla facoltà di economia. Si dica: -
Corso di Calcolo delle Probabilità e Statistica II Parte – STATISTICA
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Analisi della varianza (a una via)
Le analisi per singolo item
L’analisi Bivariata Studia la relazione fra coppie di variabili.
Matematica e statistica Versione didascalica: parte 8 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste
Appunti di inferenza per farmacisti
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Corso di biomatematica lezione 7: Test di significatività
STATISTICA a.a LA STATISTICA INFERENZIALE
CORSO DI ECONOMIA POLITICA 3° parte Docente Prof. GIOIA
Dietro alla curva di domanda
Modello di regressione lineare semplice
Analisi delle corrispondenze
Verifica delle ipotesi su due campioni di osservazioni
Regressione Logistica
Un buon latinista è anche un bravo matematico? I.S. Artemisia Gentileschi - NAPOLI Convegno finale Progetto Lauree Scientifiche – Matematica Università
Le distribuzioni campionarie
Test parametrici I test studiati nelle lezioni precedenti (test- t, test-z) consentono la verifica di ipotesi relative al valore di specifici parametri.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Corso di biomatematica lezione 7-3: Test di significatività
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Il test del Chi-quadrato
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Corso di Analisi Statistica per le Imprese Cross tabulation e relazioni tra variabili Prof. L. Neri a.a
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9 Regressione lineare multipla: la stima del modello e la sua valutazione, metodi automatici.
La verifica d’ipotesi Docente Dott. Nappo Daniela
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Domande riepilogative per l’esame
Accenni di analisi monovariata e bivariata
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
“Teoria e metodi della ricerca sociale e organizzativa”
UNIVERSITA’ DEGLI STUDI DI PERUGIA
L’analisi bivariata L’analisi bivariata serve a studiare la relazione fra coppie di variabili. Le sue funzioni sono: Stabilire se date due variabili (x.
Accenni di analisi monovariata e bivariata
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
analisi bidimensionale #2
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
DIPENDENZA STATISTICA TRA DUE CARATTERI Per una stessa collettività può essere interessante studiare più caratteri presenti contemporaneamente in ogni.
Accenni di analisi monovariata e bivariata. ANALISI MONOVARIATA Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle.
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Statistica di Base per le Scienze Pediatriche luigi greco D.C.H, M.D., M.Sc.M.C.H., Ph.D. Dipartimento di Pediatria UniFEDERICOII.
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

Analisi bivariata Passiamo allo studio delle relazioni tra variabili Andremmo a cercare se esiste una relazione tra due o più variabili, cioè se esiste una variazione concomitante tra i valori, una COVARIAZIONE, ad esempio al variare del titolo di studio varia il reddito. Si tratta di una relazione statistica probabilistica: l’affermazione al crescere del titolo di studio cresce il reddito vale in termini medi. Noto che c’è questa relazione ma possono esserci eccezioni (sicuramente nei casi studiati avrò degli individui che si comportano in modo diverso) ma, in media, la relazione regge. Si tratta di una relaziona causale, di tipo causa effetto. La statistica ci dice soltanto che esiste una relazione, sta al ricercatore definire, dove possibile, la relazione di causa ed effetto.

Tipi di relazioni tra variabili Una variabile è detta esplicativa o indipendente se spiega o influenza le variazioni di una variabile dipendente Si parla di dipendenza logica tra due o più caratteri quando tra questi sono ipotizzabili relazioni di causa ed effetto Si parla di indipendenza logica quando tra due o più caratteri si presuppone a priori con non può esistere nessuna relazione di causa effetto. L’analisi delle dipendenza studia come le modalità di un carattere dipendano da un altro carattere. Il legame tra i caratteri è unidirezionale o asimmetrico L’analisi dell’interdipendenza studia come le modalità di un carattere variano al variare di un altro carattere. Il legame tra i due caratteri è bidirezionale o simmetrico.

Tabelle di contingenza Per studiare la relazione tra 2 variabili iniziamo facendo una tabella di contingenza, o tabella a doppia entrata, o incrocio, o tabella doppia La colonna e la riga dei totali si chiama: FREQUENZA MARGINALE r x c è l’ORDINE della tavola e sta indicare il numero di righe per il numero di colonne La DIMENSIONE della tavola indica il numero di variabili coinvolte (a 2 dimensioni, a 3 …) Si calcolano poi la percentuale di riga, la percentuale di colonna e la percentuale sul totale

Tabelle di contingenza QUALE % scegliere? Se sto cercando di cogliere la relazione tra due variabili esiste una regola: Si sceglie la % di colonna quando si vuole analizzare l’influenza che la variabile posta in colonna ha sulla variabile posta in riga Si sceglie la % di riga quando si vuole analizzare l’influenza che la variabile posta in riga ha sulla variabile posta in colonna

Tabelle di contingenza E se vogliamo esaminare i profili di un fenomeno? Possiamo confrontare i valori delle % di riga e di colonna con i valori delle % marginali

Tabella di contingenza y1 y2 … yj yc totale x1 n11 n12 n1j n1c n10 x2 n21 n22 n2j n2c n20 xi ni1 ni2 nij nic ni0 xr nr1 nr2 nrj nrc nr0 n01 n02 n0j n0c n

Tabelle di contingenza Costruzione secondo alcuni criteri PARSIMONIOSITA’ – riportare solo le % che servono TOTALI – riportare sempre i totali di riga e di colonna (in % o in valore assoluto) BASI DELLE % - se riporto solo le % è meglio riportare anche i totali (N) sui quali è calcolata la % - sotto un numero ragionevole di unità N non ha senso calcolare le % CIFRE DECIMALI– sono previsti arrotondamenti e riporto di 1 o al massimo 2 cifre decimali INTESTAZIONE – le tavole devono essere sempre intestate

Test del chi-quadrato Esiste un criterio oggettivo per dire che tra due variabili esiste o non esiste una relazione? Sì per tabelle di contingenza di un campione sufficientemente grande (N>100) è ed il testo del chi-quadrato χ2 Il test del χ2 si utilizza in presenza di caratteri qualitativi nominali ma può essere applicato a caratteri qualitativi ordinali o quantitativi divisi in classi

Test del chi-quadrato Test statistico di verifica delle ipotesi – il primo passo è formulare una ipotesi, chiamata ipotesi nulla o H0 secondo la quale nella popolazione non esiste una relazione tra le variabili e cercheremo di dimostrare con i dati che questa ipotesi è falsa, non è compatibile con i nostri dati Se l’ipotesi nulla H0 viene respinta, automaticamente accettiamo l’ipotesi alternativa o ipotesi di ricerca H1 che sostiene l’esistenza della relazione. Se tra le 2 variabili della tabella di contingenza non ci fosse relazione (ci fosse indipendenza) come sarebbero le frequenze della tavola?

Frequenze attese Dobbiamo costruire la tabella teorica di frequenze attese in caso di assenza di relazione tra le 2 variabili Nell’esempio, in caso di assenza di relazione, l’età non influirebbe sulla propensione al viaggio Questo accade quando le percentuali di chi viaggia e di chi non viaggia sono uguali nelle tre classi d’età e quindi sono uguali a quanto accade in tutta la popolazione della tavola nij = frequenza congiunta della cella di incrocio tra la variabile Xi e la variabile Yi ni0 = frequenza marginale della variabile Xi n0j = frequenza marginale della variabile Yi nij attesa = ( ni0 * n0j ) / n

Test del chi quadrato L’indice chi-quadrato χ2 misura la distanza della distribuzione di frequenza osservata dalla distribuzione di frequenza attesa che si avrebbe in caso di indipendenza Tale distanza è funzione delle differenze tra le frequenze osservate e quelle teoriche e sono pari a cij = nij - nij attesa χ2 = ∑ c2ij / nij attesa All’aumentare degli scarti in valore assoluto fra le frequenze osservate e quelle teoriche il χ2 aumenta. L’indice è nullo quando le frequenze osservate sono uguali a quelle attese e sono in un caso di indipendenza

Test del chi quadrato Quanto deve essere grande il χ2 per poter dire con ragionevole certezza che la distribuzione osservata presenta una associazione? Potrebbe capitare che l’associazione tra le variabili sia da attribuire ad errori casuali…. La statistica ci dice quanto un certo valore del chi quadrato è sufficientemente piccolo da poter essere attribuito ad errori casuali e quindi pur non essendo = 0 è tuttavia compatibile con l’ipotesi nulla (H0) di indipendenza tra variabili La statistica ci dice per ogni valore del chi quadrato qual è la probabilità che esso derivi da una popolazione con indipendenza. Se troviamo una prob= 0,50 (50%) non possiamo respingere l’ipotesi nulla di indipendenza Anche se troviamo una prob = 0,10 (10%) non possiamo respingerla Per convenzione si respinge l’ipotesi nulla di indipendenza se p<= 0,05, cioè se il valore del chi quadrato è così grande da avere solo il 5% o meno di probabilità di essere dovuto al caso

Test del chi quadrato Questi valori di riferimento si trovano sulle tavole del chi-quadrato o vengono stilati dai calcolatori Le tavole sono riferite ai gradi di libertà di una distribuzione Gradi di libertà = gl = (numero di righe -1)*(numero di colonne – 1)