Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoAmedeo Valentino Modificato 11 anni fa
1
“Teoria e metodi della ricerca sociale e organizzativa”
Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università Milano-Bicocca 2009 Simone Sarti
2
Applicazioni di analisi bivariata su variabili cardinali
3
Diagramma di dispersione tra voto maturità e reddito
Per rappresentare graficamente la relazione tra due variabili cardinali si utilizza solitamente il piano cartesiano dove i valori assunti sulle due variabili costituiscono le coordinate dei punti. Soggetto con reddito=1000 e voto=52.
4
Ci dice se al variare di una variabile anche l’altra varia.
COVARIANZA La covarianza è una misura della covariazione di due variabili cardinali. Ci dice se al variare di una variabile anche l’altra varia. Varianza di Y Varianza di X
5
La covarianza è una misura simmetrica.
La covarianza appartiene all’insieme dei numeri reali (-infinito, +infinito). Se due variabili sono tra loro indipendenti la covarianza è nulla ! .
6
Covarianza tra voto di maturità e voto laurea
X Y prodotti 48 98 -6 36 53 105 -1 1 54 100 -4 55 107 3 60 110 6 74 La covarianza è uguale a 74/5 = +14,8
7
Covarianza tra voto di maturità e voto laurea
8
Covarianza tra voto di maturità e voto laurea
9
La covarianza è uguale a -109,8/5 = - 22
Covarianza tra età e n. amici incontrati settimanalmente X Y prodotti 16 10 -12,8 5,8 -74,2 25 3 -3,8 -1,2 4,6 27 4 -1,8 -0,2 0,4 35 2 6,2 -2,2 -13,6 41 12,2 -26,8 -109,8 La covarianza è uguale a -109,8/5 = - 22
10
La covarianza è uguale a -1,6/5 = -0,3
Covarianza tra Q.I. e giorno di nascita X Y prodotti 80 15 -17,2 -1,6 27,5 85 11 -12,2 -5,6 68,3 93 30 -4,2 13,4 -56,3 107 9 9,8 -7,6 -74,5 121 18 23,8 1,4 33,3 La covarianza è uguale a -1,6/5 = -0,3
11
Covarianza tra Q.I. e giorno di nascita
12
Covarianza tra Q.I. e giorno di nascita circa zero
13
La regressione lineare bivariata e la correlazione
14
Y X Y 1 4 2 3,5 5 4.5 3,4 4,5 6 6,2 7 6,5 X Lo scopo della regressione è tradurre la relazione tra X e Y in forma di un’equazione lineare del tipo: Dove, ad ogni incremento di una unità di X, corrisponde un aumento di Y equivalente a b
15
Y e1 X La stima di a e b si ottiene attraverso il metodo dei minimi quadrati (OLS – Ordinary Least Squares), in cui viene minimizzato l’errore tra la Y osservata e l’Y predetta. MIN
16
I parametri a e b dell’equazione che minimizzano l’errore vengono calcolati attraverso la soluzione delle derivate prime parziali (due incognite per due equazioni). MIN
17
Attraverso il metodo dei minimi quadrati troviamo l’equazione di regressione tra Y e X, stimando a e b della retta: Equazione predittiva Equazione di regressione
18
B (o beta) è detto COEFFICIENTE DI REGRESSIONE, e indica, per ogni incremento di una unità di X, quanto aumenta Y
19
e1 Y X Valore osservato i-esimo Valore medio della distribuzione
Valore predetto i-esimo Errore i-esimo
20
Y e1 X e1 10 – 12 = (10 – 5) + (5 – 12)
21
Scomposizione della somma dei quadrati
Elevando al quadrato e sommando tutti gli scarti si arriva alla: Scomposizione della somma dei quadrati In una regressione è possibile scomporre la variazione in una parte “spiegata” dalla variabile indipendente (o dalla regressione) ed un parte residua (o errore)
22
Coefficiente di determinazione
R2 varia tra 0 ed 1 ed è massimo quando l’errore di predizione è nullo, ed è 0 quando Y ed X sono completamente indipendenti tra loro. Esprime la forza di predizione di X su Y.
23
Coefficiente di determinazione
R2 non è altro che il rapporto tra la covarianza tra X e Y, ed il prodotto delle varianze delle due variabili. Vedi
24
Coefficiente di correlazione lineare di Pearson
r varia tra -1 ed 1 , e quindi informa sul segno della relazione tra X e Y. Esso è simmetrico, nel senso che invertendo X con Y troviamo lo stesso r.
25
Relazione tra correlazione e regressione
26
ESEMPIO DI REGRESSIONE
X Y 1 4 2 3,5 5 4.5 3,4 4,5 6 6,2 7 6,5
27
Variabili standardizzate:
quando le variabili vengono standardizzate (sottratte della media e divise della dev.std.), annulliamo l’effetto di scala e possiamo confrontare i coefficienti in termini “standard”. Equazione predittiva
28
Variabili standardizzate:
In tal caso e solo in tal caso, in una regressione bivariata, il coefficiente di regressione è uguale al coefficiente di correlazione. Equazione predittiva Covarianza tra Zx e ZY
29
STIMA DEI PARAMETRI DI REGRESSIONE
Affinché si possano inferire le stime di regressione alla popolazione di riferimento di un campione devono essere rispettati due assunti: La popolazione Y è distribuita normalmente per ogni valore di X. Le varianze degli errori di predizione sono identiche per ogni valore di X (omoschedasticità)
30
1) La popolazione Y è distribuita normalmente per ogni valore di X.
Se non è rispettato l’assunto: le stime puntuali non sono corrette.
31
2) Le varianze degli errori di predizione sono identiche per ogni valore di X (omoschedasticità)
Y Situazione di eteroschedasticità X Se non è rispettato l’assunto: le stime puntuali sono corrette, ma gli I.C. potrebbero risultare distorti.
32
PARAMETRI DELLA POPOLAZIONE
STIME DEI PARAMETRI
33
Correlazione Coeff.regressione Varianza Dev.standard Covarianza
CAMPIONE POPOLAZIONE Correlazione Coeff.regressione Varianza Dev.standard Covarianza
34
Applicazioni di analisi bivariata tra una variabile cardinale
ed una nominale
35
L’analisi della varianza ANOVA (ANalysis Of Variance)
Quando poniamo in relazione due variabili, una nominale e l’altra cardinale possiamo utilizzare l’analisi della varianza.
36
In quale area geografica ci sono più figli presenti nel nucleo familiare?
Modalità K=5
37
Rappresentazione grafica della relazione.
38
Rappresentazione in tabella della relazione.
MEDIA GENERALE
39
Come è possibile inferire se le differenze nelle medie tra i gruppi sono “vere” anche nella popolazione ?
40
SCOMPOSIZIONE DELLA VARIANZA
Lo scarto tra il singolo valore osservato e la media generale può essere visto come la somma di due entità: 1) lo scarto con il valore dalla media del gruppo, 2) lo scarto di quest’ultima dalla media generale Caso i del gruppo k Media gruppo k Media generale
41
SCOMPOSIZIONE DELLA VARIANZA
Somma totale degli scarti Somma interna degli scarti Somma esterna degli scarti Parte non spiegata dai gruppi !!! Parte spiegata dai gruppi !!!
42
SCOMPOSIZIONE DELLA VARIANZA
Somma totale degli scarti Somma interna degli scarti Somma esterna degli scarti Total Within Between Se le differenze tra i gruppi sono massime, la relazione tra le variabili è perfetta, le medie di gruppo Yk spiegano tutta la varianza complessiva e la varianza interna (o residua) è uguale a zero. Se non ci sono differenze tra i gruppi, le medie di gruppo non spiegano nulla. La varianza complessiva è uguale alla varianza interna (o residua).
43
Varianza residua, non spiegata dai gruppi !!!
Per stimare la varianza nella popolazione occorre tenere presente i gradi di libertà dei diversi elementi: Gradi di libertà totali Gradi di libertà interni Gradi di libertà esterni Stima Varianza totale = Stima Varianza “intra” + Stima Varianza “tra” Varianza residua, non spiegata dai gruppi !!! Varianza spiegata dai gruppi !!!
44
RAPPORTO F F = Il rapporto F ha una distribuzione casuale nota,
Stima Varianza “fra” Stima Varianza “intra” Il rapporto F ha una distribuzione casuale nota, detta F di Snedecor. E’ possibile applicare un test di significatività statistica. F molto piccolo significa che i gruppi non fanno differenza (ossia non spiegano nulla dell’eterogeneità della variabile cardinale). Le due variabili sono tra loro indipendenti. Maggiore è F, maggiore è la “spiegazione” apportata dai gruppi, maggiore è la relazione tra le due variabili.
45
Stima Varianza “intra”
F di Snedecor F = Stima Varianza “fra” Stima Varianza “intra” Gradi di libertà: K=3 N=120 1 2 3 4 5
46
Alcuni valori critici della F di Snedecor
gdl “fra” = K-1 gdl “fra” = K-1 1 2 3 4 10 4,96 4,10 3,71 3,48 120 3,92 3,07 2,68 2,45 3,85 3,00 2,61 2,38 1 2 3 4 10 10,04 7,56 6,55 5,99 120 6,85 4,79 3,95 3,48 6,65 4,62 3,79 3,33 gdl “intra” N-K
47
In quale area geografica ci sono più figli presenti nel nucleo familiare?
48
F osservato = 396,4 Valore critico di Falfa=0,05 =2,38 Dato che il valore osservato ricade nell’area a destra della soglia critica rifiuto H0. La relazione è statisticamente significativa allo 0,05. Con numerosità elevate il test ha quasi sempre esito positivo !!!
49
Come misura della forza della relazione tra la variabile cardinale e la variabile nominale viene usata la misura ETA-QUADRO. Eta2 varia tra 0 ed 1 ed è interpretabile come il coefficiente di determinazione R2.
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.