Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoTimoteo Ferrario Modificato 11 anni fa
1
RELAZIONI TRA 2 FENOMENI QUANTITATIVI STATISTICA A – K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it
2
RELAZIONI TRA 2 FENOMENI QUANTITATIVI Vi è una relazione tra le variabili oggetto di studio? Di quanto variano i valori duna variabile quando cambiano i valori dellaltra? CORRELAZIONE REGRESSIONE
3
X = NUMERO DI DIPENDENTI Y = FATTURATO (in milioni di euro) Supermercatoxixi yiyi A101,9 B183,1 C203,2 D81,5 E306,2 F122,8 G142,3 Tot.11221,0 M(X) = 16 M(Y) = 3,0
4
DIAGRAMMA DI DISPERSIONE (SCATTER) M(X) = 16 M(Y) = 3,0 G (14 2,3) E (30 6,2)
5
DIAGRAMMA DI DISPERSIONE (SCATTER) Punti in I e III relazione diretta Punti in II e IV relazione inversa Punti si distribuiscono casualmente in tutti i quadranti allincirca nella stessa proporzione nessuna relazione lineare tra le due variabili I quadranti in cui compare la maggioranza dei punti indicano il tipo di relazione Losservazione della nuvola di punti nel diagramma di dispersione fornisce una prima idea sulla relazione eventualmente esistente tra i due fenomeni.
6
X = NUMERO DI DIPENDENTI Y = FATTURATO (in milioni di euro) Supermercatoxixi yiyi (x i – M x )(y i – M y ) A101,9- 6- 1,1 B183,1+ 2+ 0,1 C203,2+ 4+ 0,2 D81,5- 8- 1,5 E306,2+ 14+ 3,2 F122,8- 4- 0,2 G142,3- 2- 0,7 Tot.11221,000 M(X) = 16 M(Y) = 3,0
7
COVARIANZA = MEDIA ARITMETICA DEI PRODOTTI DEGLI SCOSTAMENTI COV(X,Y) >0 RELAZIONE DIRETTA COV(X,Y) <0 RELAZIONE INVERSA COV(X,Y) =0 X, Y INCORRELATE
8
X = NUMERO DI DIPENDENTI Y = FATTURATO (in milioni di euro) Supermercatoxixi yiyi (x i – M x )(y i – M y ) (x i -M x )(y i -M y ) A101,9- 6- 1,16,6 B183,1+ 2+ 0,10,2 C203,2+ 4+ 0,20,8 D81,5- 8- 1,512 E306,2+ 14+ 3,244,8 F122,8- 4- 0,20,8 G142,3- 2- 0,71,4 Tot.11221,00066,6 M(X) = 16 M(Y) = 3,0 COV(X,Y)=66,6/7=9,514
9
Osservazione: per ottenere la covarianza è sufficiente calcolare solo gli scostamenti di una variabile, moltiplicandoli per i valori dell'altra variabile (p. 153)
10
X = NUMERO DI DIPENDENTI Y = FATTURATO (in milioni di euro) Superm ercato xixi yiyi (x i – M x )(y i – M y ) (x i -M x ) (y i -M y ) (x i -M x ) y i (y i – M y ) x i A101,9- 6- 1,16,6 -11,4-11 B183,1+ 2+ 0,10,2 6,21,8 C203,2+ 4+ 0,20,8 12,84 D81,5- 8- 1,512 -12 E306,2+ 14+ 3,244,8 86,896 F122,8- 4- 0,20,8 -11,2-2,4 G142,3- 2- 0,71,4 -4,6-9,8 Tot.112210066,6 M(X) = 16 M(Y) = 3,0 COV(X,Y)=66,6/7=9,514
11
Osservazione: può essere ottenuta anche in funzione dei dati originari (p.154) Superm ercato xixi yiyi xiyixiyi A101,9 19 B183,1 55,8 C203,2 64 D81,5 12 E306,2 186 F122,8 33,6 G142,3 32,2 Tot.11221 402,6 COV(X,Y) = 402,6/7-16*3=9,514 M(X) = 16 M(Y) = 3,0
12
Proprietà della covarianza E ESPRESSA NEL PRODOTTO DELLE UNITA DI MISURA DI X E DI Y COV(X,X)=VAR(X) E scale equivariant
13
Proprietà della covarianza
14
max | COV (X, Y) | = = [VAR(X) VAR(Y)] 1/2 = = σ(X) σ(Y)
15
Dimostrazione var(tX-Y)>0 t 2 var(X) -2t cov(X,Y) + var(Y) >0 h(t) è una funzione quadratica in t. Se h(t)>0 le radici non sono reali Δ<0 implica che 4 [cov(X,Y)] 2 -4 var(X) var(Y) <0 [cov(X,Y)] 2 < var(X) var(Y) |cov(X,Y)| < σ(X) σ(Y)
16
Come ovviare ai difetti della COV? La covarianza ha il difetto di risentire dell'unità di misura e dell'ordine di grandezza dei due fenomeni originari essendo espressa in termini del prodotto delle unità di misura di X e Y I valori che essa può assumere non sono compresi in un intervallo di interpretazione immediata,
17
RICHIAMO SCOSTAMENTI STANDARDIZZATI (p. 125) Proprietà: M z = 0 z = 1 puri numeri confronto tra fenomeni diversi
18
COEFFICIENTE DI CORRELAZIONE r xy (media dei prodotti degli scostamenti standardizzati è un numero puro)
19
SCOSTAMENTI STANDARDIZZATI Superm ercato xixi yiyi (x i – M x )/σ x (y i – M y )/σ y (x i – M x ) (y i – M y )/(σ x σ y ) A101,9 -0,87-0,770,67 B183,1 0,290,070,02 C203,2 0,580,140,08 D81,5 -1,15-1,051,21 E306,2 2,022,244,53 F122,8 -0,58-0,140,08 G142,3 -0,29-0,490,14 Tot.11221,0 006,73
20
r xy =6,73/7 =0,961 Superm ercato xixi yiyi (x i – M x ) (y i – M y )/σ x σ y A101,9 0,67 B183,1 0,02 C203,2 0,08 D81,5 1,21 E306,2 4,53 F122,8 0,08 G142,3 0,14 Tot.11221,0 6,73
21
Formule di calcolo alternative (p. 157)
22
Formule di calcolo alternative:
23
Interpretazione di r r xy = -1 perfetta relazione lineare inversa tra X ed Y (cioè quando y i = a + bx i, con b < 0 e a numero qualsiasi) r xy = 0 X ed Y sono incorrelate (non vi è tra loro un legame lineare; non si esclude però leventuale esistenza duna relazione non lineare, ad esempio parabolica o sinusoidale) r xy = +1 perfetta relazione lineare diretta tra X ed Y (cioè quando y i = a + bx i, con b > 0 e a numero qualsiasi)
24
Punti in situazioni estreme e r xy
25
Esemplificazione di dati con diverso valore del coefficiente di correlazione lineare
26
|r xy |= 1 se e solo cè perfetta relazione lineare tra X ed Y Se Y = a+|b| X
27
Esempio: 7 supermercati Super- mercat o (x i – M x )(y i – M y )(x i -M x )* (y i -M y ) (x i -M x ) 2 (y i -M y ) 2 A- 6- 1,16,6361,21 B+ 2+ 0,10,240,01 C+ 4+ 0,20,8160,04 D- 8- 1,512642,25 E+ 14+ 3,244,819610,24 F- 4- 0,20,8160,04 G- 2- 0,71,440,49 Tot.0066,633614,28 COV(X,Y) = 66,6/7=9,514 VAR(X) = 336/7 = 48 VAR(Y) = 14,28/7 =2,04
28
Esempio: 7 supermercati (continua) Super- mercato (x i -M x )(y i -M y )(x i -M x ) 2 (y i -M y ) 2 A6,6361,21 B0,240,01 C0,8160,04 D12642,25 E44,819610,24 F0,8160,04 G1,440,49 Tot.66,633614,28 COV(X,Y) = 66,6/7=9,514 VAR(X) = 336/7 = 48 VAR(Y) = 14,28/7=2,04
29
Caratteristiche di r Dato che r xy = r yx, il coefficiente di correlazione è una misura simmetrica in X ed Y interdipendenza tra le due variabili. In esso non si assume una variabile come antecedente e laltra come conseguente, ma si valuta semplicemente il legame vicendevole tra X ed Y.
30
Proprietà di r xy (p. 160) è invariante in senso forte (cioè presenta lo stesso valore numerico) per trasformazioni lineari crescenti di una o di entrambe le variabili
31
Proprietà di r xy Proprietà di invarianza per trasformazioni lineari: il coefficiente di correlazione lineare rimane invariato effettuando una trasformazione lineare crescente di una o di entrambe le variabili. se si cambia lorigine del sistema di misurazione e/o lunità di misura in cui sono espresse le variabili, il valore del coefficiente di correlazione non varia.
32
Applicazione della precedente proprietà Si ottiene il medesimo valore di r xy anche effettuando il calcolo sui n.i. a base fissa
33
Esemplificazione di dati con diverso valore del coefficiente di correlazione lineare, in presenza di dati contaminati indicati con il simbolo * (p. 162)
34
Es: 6 famiglie, ammontare della spesa annua (in euro) per lacquisto di due generi di largo consumo: latte fresco e biscotti. (i) r xy ? (ii) commento (iii) diagramma di dispersione (iv) concordanza tra r xy e diagramma di dispersione (v) Perché r xy invece della retta di regressione? Famiglia Spesa annua per lacquisto di latte fresco () Spesa annua per lacquisto di biscotti () A 105 65 B 190 130 C 80 160 D 120 90 E 240 220 F 60 50 M(x)= 132.5 M(y)= 119.2
35
CORRELAZIONE FRA DUE S.S. Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount Calcolare e commentare r XY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile AnniXY 199372.644600 199485.9931.300 199596.2871.930 1996136.9422.328 1997140.1002.523
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.