1 “Metodi per la Ricerca Sociale e Organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università degli Studi di Milano-Bicocca.

Slides:



Advertisements
Presentazioni simili
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
Advertisements

Come organizzare i dati per un'analisi statistica al computer?
Dipartimento di Economia
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
La teoria di portafoglio: cap.7-9
“Teoria e metodi della ricerca sociale e organizzativa”
“Teoria e metodi della ricerca sociale e organizzativa”
Variabili casuali a più dimensioni
Analisi dei dati per i disegni ad un fattore
La regressione lineare trivariata
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
Analisi multivariata.
La natura delle ipotesi
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
MODELLO DI REGRESSIONE LINEARE MULTIPLA
Analisi trivariata Lavorando con due variabili è possibile descrivere la relazione che fra queste esiste e formulare una congettura circa il tipo di legame.
Analisi della varianza (a una via)
La logica della regressione
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Corso di biomatematica lezione 6: la funzione c2
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Modello di regressione lineare semplice
Regressione Logistica
La ricerca delle relazioni tra fenomeni
Introduzione alla Regressione Lineare e alla Correlazione.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
La regressione come strumento di sintesi delle relazioni tra variabili
DATA MINING PER IL MARKETING
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
DATA MINING PER IL MARKETING
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9 Regressione lineare multipla: la stima del modello e la sua valutazione, metodi automatici.
Introduzione alla regressione multipla
La regressione II Cristina Zogmaister.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Strumenti statistici in Excell
Il residuo nella predizione
Martina Serafini Martina Prandi
Analisi Multivariata dei Dati
Riassumendo: ipotesi per OLS 1.Modello lineare 2.X e Y sono frutto di osservazioni indipendenti 3.X è di rango pieno 4.I residui hanno media = 0 5.I residui.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
1 “Teoria e metodi della ricerca sociale e organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università Milano-Bicocca.
REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
“Teoria e metodi della ricerca sociale e organizzativa”
1 “Teoria e metodi della ricerca sociale e organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università Milano-Bicocca.
L’INTEPRETAZIONE DEI DATI STATISTICI
Introduzione a rischio, rendimento e costo opportunità del capitale
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Correlazione e regressione lineare
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
L’analisidei dati L’analisi dei dati Analisi mutlidimensionali: Analisi delle corrispondenze multiple Cluster Analysis.
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
Teoria dei Sistemi di Trasporto Tematica 4: Elementi minimi di teoria della probabilità.
Transcript della presentazione:

1 “Metodi per la Ricerca Sociale e Organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università degli Studi di Milano-Bicocca 2009 Simone Sarti

2 LOGICA TRIVARIATA

3 Logica trivariata Quando ad una relazione bivariata aggiungiamo una terza variabile operiamo un’analisi trivariata.

4 Perché considerare una terza variabile? Quando consideriamo un’ipotesi causale tra due fenomeni ed empiricamente corroboriamo l’esistenza di una relazione, non possiamo tuttavia escludere che i due fenomeni non siano dovuti ad un terzo che non abbiamo preso in considerazione.

5 La causa di un fenomeno in senso generico può essere definita come la somma totale delle condizioni, la totalità delle contingenze alla cui realizzazione segue invariabilmente il conseguente. (Campelli 1999) Tuttavia, “Nulla può meglio mostrare l’assenza di qualsiasi fondamento scientifico per la distinzione fra la causa d’un fenomeno e le sue condizioni della maniera capricciosa in cui scegliamo fra le condizioni quella che preferiamo chiamare causa “ (J.S.Mill)

6 1.Il numero di pompieri impegnati nello spegnere un incendio è correlato con la stima finale dei danni provocati dall’incendio stesso. 2.I bambini nelle cui case vi sono più finestre mostrano migliori rendimenti scolastici. Cause ed effetti ?

7 1. Considerando le dimensioni dell’incendio, la relazione tra numero di vigili del fuoco e stima dei danni sparisce. 2.Considerando la ricchezza patrimoniale dei genitori, la relazione tra numero di finestre e rendimento scolastico sparisce. Presenza di un effetto SPURIO, cioè di una terza variabile, antecedente alle due, che è la “vera” causa della relazione!

8 Posizione delle variabili Una volta ipotizzata una relazione tra due variabili X “indipendente” e Y “dipendente”, l’altra o le altre variabili considerate possono assumere quattro posizioni: variabili antecedenti, variabili intervenienti, variabili susseguenti, variabili concomitanti.

9 Variabili antecedenti Quelle variabili che nell’ordine causale precedono sia X che Y. XY A

10 Variabili intervenienti Quelle variabili che nell’ordine causale precedono Y ma seguono X. XY I

11 Variabili susseguenti Quelle variabili che nell’ordine causale seguono sia Y che X. XY S

12 Variabili concomitanti Quelle variabili che nell’ordine causale precedono Y ma sono correlate (senza direzione causale) ad X. XY C

13 LOGICA degli effetti EFFETTO SPURIO: l’inserimento di una variabile di controllo Z, annulla la relazione tra X e Y. XY Z XY

14 LOGICA degli effetti EFFETTO SOPPRESSO: l’inserimento di una variabile di controllo Z, rende palese la relazione tra X e Y. XY Z XY

15 SCOMPOSIZIONE degli effetti Variabili categoriali e differenze di probabilità

16 ESEMPIO 1. tra variabili dicotomiche. Incrocio tra titolo di studio e fiducia nel sistema giudiziario … XY X Titolo di studio (L – H) YFiducia nel sistema giudiziario (S – N) Esempio 1

17 … controllato per la variabile antecedente Z XY Z Z Coorte di nascita (G – A) Esempio 1

18 Effetto bivariato XY= Effetto causale netto + Effetto spurio d yx = d yx.z + d (yx)z Esempio 1 XY Z XY d yx.z d yx d (yx)z

19 Fonte: EB 60.1 Italia (30 e più anni) Esempio 1

20 d yx Effetto bivariato: educaz. e fiducia giustizia In un incrocio dicotomico l’effetto bivariato è misurabile attraverso una semplice differenza di probabilità. d yx equivale alla differenza di probabilità sull’avere fiducia nella giustizia dato l’avere un titolo di studio alto piuttosto che basso. Esempio 1

21 d yx Effetto bivariato: educaz. e fiducia giustizia Pr (Y=1 | X=2) – Pr (Y=1 | X=1) Equivale alla probabilità che la variabile Y assuma valore y, dato che la variabile X assume valore x: Pr (Y=y | X=x) La categoria di riferimento è la “SI” (Y=1). d yx = 0, ,436 = 0,145 Esempio 1

22 d yx = 0, ,436 = 0,145 La relazione tra possesso della laurea (piuttosto che un titolo di studio inferiore) e fiducia nella giustizia (“si” piuttosto che “no”) è positiva. Esempio 1

23 GIOVANI Z=1 ANZIANI Z=2 Esempio 1

24 Effetti condizionati di Z Considerando Z, troviamo diversi effetti di X su Y. d yx|z=1 = 0,593 -0,425 = 0,168 d yx|z=2 = 0,553 -0,448 = 0,105 Esempio 1

25 Effetto condizionato complessivo di Z Considerando che le numerosità in Z tra giovani ed anziani sono diverse, occorre ponderare gli effetti condizionati. Giovani= 388/685 = 0,567 quota di giovani (q g ) Anziani= 297/685 = 0,433 quota di anziani (1 - q g ) d yx.z = (0,168*0,567) + (0,105*0,433) = 0,141 Esempio 1

26 Effetto bivariato = Effetto causale + Effetto spurio d yx = d yx.z + d (yx)z d (yx)z =d yx – d yx.z = 0,145 – (0,141) = 0,004 d (yx)z Effetto spurio Esempio 1

27 L’effetto della variabile Z è sostanzialmente nullo, ossia la relazione tra titolo di studio e fiducia nella giustizia permane immutata anche a parità di fascia d’età. Non c’è effetto SPURIO. XY Z + ~ 0 Esempio 1

28 ESEMPIO 2. tra variabili dicotomiche. Incrocio tra genere e fiducia nei sindacati … XY X Genere (M - F) YFiducia nei sindacati (S - N) Esempio 2

29 … controllato per la variabile interveniente I condizione occupazionale (occupato/non occupato) XY I Z Condizione occupazionale (O - D) Esempio 2

30 Effetto bivariato XY = Effetto diretto + Effetto indiretto d yx = c + a*b XY I ab c Esempio 2

31 SINO M31,768,3 F23,376,7 N=1000 Esempio 2

32 d yx Effetto bivariato: genere e fiducia nei sindacati In un incrocio dicotomico l’effetto bivariato è misurabile attraverso una semplice differenza di probabilità. d yx equivale alla differenza di probabilità sull’avere fiducia nei sindacati dato l’essere femmina piuttosto che maschio. Esempio 2

33 d yx Effetto bivariato: genere e fiducia nei sindacati Pr (Y=1 | X=2) – Pr (Y=1 | X=1) Equivale alla probabilità che la variabile Y assuma valore y, dato che la variabile X assume valore x: Pr (Y=y | X=x) La categoria di riferimento è la “SI” (Y=1). d yx = 0, ,317 = -0,084 Esempio 2

34 d yx = 0, ,317 = -0,084 La relazione tra genere (essere femmina piuttosto che maschio) e fiducia nei sindacati (“si” piuttosto che “no”) è negativa. Esempio 2

35 NON OCCUPATI I=2 OCCUPATI I=1 SINO M33,966,1 F30,869,2 SINO M12,587,5 F9,590,5 N i=1 =750 N i=2 =250 Esempio 2

36 Effetti condizionati di I Considerando I, troviamo diversi effetti di X su Y. d yx|i=1 = 0, ,339 = -0,031 d yx|i=2 = 0,095 -0,125 = -0,030 Esempio 2

37 Effetto diretto c a parità di I Considerando che le numerosità in I nella condizione occupazionale sono diverse, occorre ponderare gli effetti condizionati. Occupati= 750/1000 = 0,750quota occupati (q o ) Non occupati= 250/1000 = 0,250quota non occupati (1-q o ) d yx.i = (-0,031*0,750) + (-0,030*0,250) = -0,031 Esempio 2

Effetto bivariato XY = Effetto diretto + Effetto indiretto d yx = c + a*b Effetto indiretto = -0,084 - (-0,031) = -0,053 -0,084 = -0,031 + Effetto indiretto Esempio 2 XY I ab c

39 L’effetto indiretto della variabile I (occupazione) è circa due terzi (-0,053 di -0,084) dell’effetto complessivo tra genere e fiducia nei sindacati. Ciò significa che la tendenza a mostrare sfiducia nei sindacati da parte delle femmine è dovuta in buona parte alla condizione occupazionale. XY I c = -0,031 XY -0,084 a*b = -0,053 Esempio 2

40 SCOMPOSIZIONE degli effetti Le correlazioni

41 Ipotizziamo che la variabile Z influenzi la relazione tra Y e X. Come misurare l’effetto di X su Y al netto di Z ? XY Z XY

42 Correlazioni tra le variabili: XY Z XZY X Z Y Matrice di correlazione, r.. osservati

43 E’ possibile calcolare il coefficiente di correlazione parziale tra X e Y “tenendo costante” Z:

44 Coefficiente di correlazione parziale tra X e Y “tenendo costante” Z: Correlazione lordaCorrelazione di Z su X e Y Residui di Z-X e Z-Y Più la Z spiega X eY, più grande è il denominatore Misura quanto Z spiega di X eY

45 XY Z XZY X Z Y Matrice di correlazione, r.. osservati E’ possibile calcolare il coefficiente di correlazione parziale tra X e Y “tenendo costante” Z:

46 XY Z La correlazione tra X e Y tenendo sotto controllo Z diventa praticamente nulla.

47 Correlazioni fra tre variabili Calcolare la correlazione parziale tra anni di scolarità e reddito

48 SCOMPOSIZIONE degli effetti Regressione e correlazione

49 YX1X1 Ipotizziamo un’antecedenza (lineare) causale: X2X2

50 La regressione trivariata La covariazione tra le variabili indipendenti X e la dipendente Y può essere ricostruita attraverso una figura complessa chiamata iperpiano. La regressione stima i valori dei parametri a e b che minimizzano i valori osservati e quelli predetti che costituiscono l’iperpiano. Più tecnicamente la regressione minimizza la somma degli errori di predizione al quadrato.

51 La regressione trivariata Il valore α esprime il valore predetto di Y, quando tutti i regressori X k sono uguali a 0. I valori b k rappresentano la variazione (gli effetti) apportati dalle rispettive variabili X k al netto degli effetti delle altre variabili incluse nel modello. O anche: “a parità di ogni altra condizione considerata”.

52 Assunti per la regressione trivariata a partire dai coefficienti campionari 1.Relazione lineare tra variabili dipendenti ed indipendenti. 2. Gli errori sono: -distribuiti normalmente, -il valore atteso è zero, -hanno varianze costanti (omoschedasticità), -sono tra loro indipendenti,

53 Pesi di correlazione e causazione Esistono legami bidirezionali, che si sostanziano in “coefficienti di correlazione” e legami unidirezionali (o causali) che si sostanziano in coefficienti di regressione.

54 Esempio di modello causale (regressione) X1X1 X2X2 Y X1X1 X2X2 Y X1X X2X Y Matrice di correlazione, r.. osservati eYeY Stime effettuate con il metodo dei minimi quadrati Coefficienti standardizzati

55 Coefficiente di determinazione multiplo Il coefficiente di determinazione multiplo della variabile Y, è dato dall’insieme degli effetti beta delle variabili X che agiscono direttamente su essa, pesate per la correlazione osservata tra le X e la Y. In sostanza R 2 è la somma degli effetti netti tra le X e la Y.

56 Esempio di modello causale (regressione) X1X1 X2X2 Y X1X X2X Y Matrice di correlazione

57 Analisi dei coefficienti di regressione std Essendo std i beta possono essere confrontati direttamente. I due effetti sono positivi, ma l’effetto di X 2 è molto più intenso. Precisamente l’aumento di una unità di X 2 corrisponde all’aumento di deviazioni standard di Y. Una unità di X produce solo lo 0,065 di aumento in Y. X1X1 X2X2 Y 0.453

58 X1X1 X2X2 Y X1X1 X2X2 Y X X2X Y Matrice di correlazione r

59 Analisi dei residui Ciò significa che le variabili antecedenti del modello (X 1 e X 2 nel- l’esempio) contribuiscono a spiegare circa un terzo della varianza di Y. Il peso causale del fattore residuale è 0,801. La correlazione con “altre” cause pesa 0,801.

60 REGRESSIONE TRIVARIATA UN’APPLICAZIONE

61 YX1X1 Ipotizziamo un’antecedenza (lineare) causale: X2X2 Anni scolarità padre Anni scolarità madre Anni scolarità figlio

62 Regressione trivariata X1X1 X2X2 Y Matrice di correlazione, r.. osservati b1b1 b2b2 eYeY Stime effettuate con il metodo dei minimi quadrati

63

64 Varianza spiegata dal modello Il peso causale del fattore residuale è 0,801. La correlazione con cause terze pesa 0,801.

65

66 L’effetto di interazione

67 L’effetto di interazione Quando l’effetto causale esercitato dalla variabile indipendente X sulla variabile indipendente Y si manifesta in modi diversi a seconda del valore assunto dalla variabile di controllo Z. XY Z

Z=0Z=1 X=0 X=1 Y=0Y=1 Y=0Y=1Y=0Y=1

69 X Y X Y X Y Z=0Z=1 Effetto di interazione di Z (dicotomica) su X e Y (cardinali) β>0 β z=0 >0β z=1 <0

70 Esempi di effetti di interazione (titolo*età)