La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

1 Teoria e metodi della ricerca sociale e organizzativa Corso di Laurea in Scienze dellOrganizzazione Facoltà di Sociologia Università Milano-Bicocca 2009.

Presentazioni simili


Presentazione sul tema: "1 Teoria e metodi della ricerca sociale e organizzativa Corso di Laurea in Scienze dellOrganizzazione Facoltà di Sociologia Università Milano-Bicocca 2009."— Transcript della presentazione:

1 1 Teoria e metodi della ricerca sociale e organizzativa Corso di Laurea in Scienze dellOrganizzazione Facoltà di Sociologia Università Milano-Bicocca 2009 Simone Sarti

2 Applicazioni di analisi bivariata su variabili cardinali

3 3 Diagramma di dispersione tra voto maturità e reddito Per rappresentare graficamente la relazione tra due variabili cardinali si utilizza solitamente il piano cartesiano dove i valori assunti sulle due variabili costituiscono le coordinate dei punti. Soggetto con reddito=1000 e voto=52.

4 4 COVARIANZA La covarianza è una misura della covariazione di due variabili cardinali. Ci dice se al variare di una variabile anche laltra varia. Varianza di YVarianza di X

5 5 La covarianza appartiene allinsieme dei numeri reali (-infinito, +infinito). Se due variabili sono tra loro indipendenti la covarianza è nulla !. COVARIANZA La covarianza è una misura simmetrica.

6 6 XY prodotti Covarianza tra voto di maturità e voto laurea La covarianza è uguale a 74/5 = +14,8

7 7 Covarianza tra voto di maturità e voto laurea

8 8

9 9 XY prodotti ,85,8 -74, ,8-1,2 4, ,8-0,2 0, ,2-2,2 -13, ,2-2,2 -26,8 -109,8 Covarianza tra età e n. amici incontrati settimanalmente La covarianza è uguale a -109,8/5 = - 22

10 10 XY prodotti ,2-1,6 27, ,2-5,6 68, ,213,4 -56, ,8-7,6 -74, ,81,4 33,3 -1,6 Covarianza tra Q.I. e giorno di nascita La covarianza è uguale a -1,6/5 = -0,3

11 11 Covarianza tra Q.I. e giorno di nascita

12 12 Covarianza tra Q.I. e giorno di nascita circa zero

13 13 La regressione lineare bivariata e la correlazione

14 Y X Lo scopo della regressione è tradurre la relazione tra X e Y in forma di unequazione lineare del tipo: Dove, ad ogni incremento di una unità di X, corrisponde un aumento di Y equivalente a b XY 14 23, ,4 54,5 66 6,25 76,5

15 Y X La stima di a e b si ottiene attraverso il metodo dei minimi quadrati (OLS – Ordinary Least Squares), in cui viene minimizzato lerrore tra la Y osservata e lY predetta. MIN e1e1

16 16 I parametri a e b dellequazione che minimizzano lerrore vengono calcolati attraverso la soluzione delle derivate prime parziali (due incognite per due equazioni). MIN

17 Attraverso il metodo dei minimi quadrati troviamo lequazione di regressione tra Y e X, stimando a e b della retta: Equazione predittivaEquazione di regressione

18 B (o beta) è detto COEFFICIENTE DI REGRESSIONE, e indica, per ogni incremento di una unità di X, quanto aumenta Y

19 Valore osservato i-esimo Valore medio della distribuzione Valore predetto i-esimo Y X e1e1 Errore i-esimo

20 Y X e1e1 10 – 12 = (10 – 5) + (5 – 12) e1e1

21 Scomposizione della somma dei quadrati In una regressione è possibile scomporre la variazione in una parte spiegata dalla variabile indipendente (o dalla regressione) ed un parte residua (o errore) Elevando al quadrato e sommando tutti gli scarti si arriva alla:

22 Coefficiente di determinazione R 2 varia tra 0 ed 1 ed è massimo quando lerrore di predizione è nullo, ed è 0 quando Y ed X sono completamente indipendenti tra loro. Esprime la forza di predizione di X su Y.

23 Coefficiente di determinazione R 2 non è altro che il rapporto tra la covarianza tra X e Y, ed il prodotto delle varianze delle due variabili. Vedi

24 Coefficiente di correlazione lineare di Pearson r varia tra -1 ed 1, e quindi informa sul segno della relazione tra X e Y. Esso è simmetrico, nel senso che invertendo X con Y troviamo lo stesso r.

25 Relazione tra correlazione e regressione

26 26 XY 14 23, ,4 54,5 66 6,25 76,5 ESEMPIO DI REGRESSIONE

27 Variabili standardizzate: quando le variabili vengono standardizzate (sottratte della media e divise della dev.std.), annulliamo leffetto di scala e possiamo confrontare i coefficienti in termini standard. Equazione predittiva

28 Variabili standardizzate: In tal caso e solo in tal caso, in una regressione bivariata, il coefficiente di regressione è uguale al coefficiente di correlazione. Equazione predittiva Covarianza tra Z x e Z Y

29 STIMA DEI PARAMETRI DI REGRESSIONE Affinché si possano inferire le stime di regressione alla popolazione di riferimento di un campione devono essere rispettati due assunti: 1) La popolazione Y è distribuita normalmente per ogni valore di X. 2) Le varianze degli errori di predizione sono identiche per ogni valore di X (omoschedasticità)

30 1) La popolazione Y è distribuita normalmente per ogni valore di X. Y X Se non è rispettato lassunto: le stime puntuali non sono corrette.

31 2) Le varianze degli errori di predizione sono identiche per ogni valore di X (omoschedasticità) Se non è rispettato lassunto: le stime puntuali sono corrette, ma gli I.C. potrebbero risultare distorti. Y X Situazione di eteroschedasticità

32 32 PARAMETRI DELLA POPOLAZIONE STIME DEI PARAMETRI

33 33 CAMPIONEPOPOLAZIONE Correlazione Coeff.regressione Varianza Dev.standard Covarianza

34 Applicazioni di analisi bivariata tra una variabile cardinale ed una nominale

35 Lanalisi della varianza ANOVA ( ANalysis Of Variance) Quando poniamo in relazione due variabili, una nominale e laltra cardinale possiamo utilizzare lanalisi della varianza.

36 In quale area geografica ci sono più figli presenti nel nucleo familiare? Modalità K=5

37 37 Rappresentazione grafica della relazione.

38 38 Rappresentazione in tabella della relazione. MEDIA GENERALE

39 39 Come è possibile inferire se le differenze nelle medie tra i gruppi sono vere anche nella popolazione ?

40 Lo scarto tra il singolo valore osservato e la media generale può essere visto come la somma di due entità: 1) lo scarto con il valore dalla media del gruppo, 2) lo scarto di questultima dalla media generale SCOMPOSIZIONE DELLA VARIANZA Media gruppo kMedia generale Caso i del gruppo k

41 SCOMPOSIZIONE DELLA VARIANZA Somma totale degli scarti Somma interna degli scarti Somma esterna degli scarti Parte non spiegata dai gruppi !!! Parte spiegata dai gruppi !!!

42 Se le differenze tra i gruppi sono massime, la relazione tra le variabili è perfetta, le medie di gruppo Y k spiegano tutta la varianza complessiva e la varianza interna (o residua) è uguale a zero. Se non ci sono differenze tra i gruppi, le medie di gruppo non spiegano nulla. La varianza complessiva è uguale alla varianza interna (o residua). Somma totale degli scarti Somma interna degli scarti Somma esterna degli scarti SCOMPOSIZIONE DELLA VARIANZA WithinBetweenTotal

43 Stima Varianza totale = Stima Varianza intra + Stima Varianza tra Per stimare la varianza nella popolazione occorre tenere presente i gradi di libertà dei diversi elementi: Gradi di libertà totali Gradi di libertà interni Gradi di libertà esterni Varianza spiegata dai gruppi !!! Varianza residua, non spiegata dai gruppi !!!

44 Il rapporto F ha una distribuzione casuale nota, detta F di Snedecor. E possibile applicare un test di significatività statistica. F molto piccolo significa che i gruppi non fanno differenza (ossia non spiegano nulla delleterogeneità della variabile cardinale). Le due variabili sono tra loro indipendenti. Maggiore è F, maggiore è la spiegazione apportata dai gruppi, maggiore è la relazione tra le due variabili. RAPPORTO F F = Stima Varianza fra Stima Varianza intra

45 F di Snedecor F = Stima Varianza fra Stima Varianza intra K=3 Gradi di libertà: N=120

46 46 Alcuni valori critici della F di Snedecor ,964,103,713, ,923,072,682,45 3,853,002,612, ,04 7,566,555, ,854,793,953,48 6,654,623,793,33 gdl fra = K-1 gdl intra N-K gdl fra = K-1

47 47 In quale area geografica ci sono più figli presenti nel nucleo familiare?

48 48 F osservato = 396,4 Valore critico di F alfa=0,05 =2,38 Dato che il valore osservato ricade nellarea a destra della soglia critica rifiuto H 0. La relazione è statisticamente significativa allo 0,05. Con numerosità elevate il test ha quasi sempre esito positivo !!!

49 49 Come misura della forza della relazione tra la variabile cardinale e la variabile nominale viene usata la misura ETA-QUADRO. Eta 2 varia tra 0 ed 1 ed è interpretabile come il coefficiente di determinazione R 2.R 2


Scaricare ppt "1 Teoria e metodi della ricerca sociale e organizzativa Corso di Laurea in Scienze dellOrganizzazione Facoltà di Sociologia Università Milano-Bicocca 2009."

Presentazioni simili


Annunci Google