Distribuzioni Bivariate Sulle unità statistiche del collettivo di 50 famiglie sulle quali abbiamo rilevato il carattere X = “n° Figli per Famiglia” rileviamo un secondo carattere Y = “Settore di Attività Economica del Capofamiglia”, le cui modalità sono: A= agricoltura; I= industria; S= servizi; elenco modalità rilevate: dal conteggio delle singole modalità diverse xi e dall’analogo conteggio delle singole modalità diverse yi si ottengono distribuzioni univariate di X e di Y: (3,A) (1,I) (2,S) (2,I) (0,A) (1,S) (5,A) (4,I) (2,A) (3,I) (1,A) (0,I) (4,A) (4,S) (3,S) (0,S) Prof. G. Latorre
Y=Settore Attità Economica X=N° figli Frequenze 5 1 12 2 19 3 9 4 Totale 50 Y=Settore Attità Economica Frequenze Agric. 13 Indus. 19 Serv. 18 Totale 50 Distribuzioni Univariate di Frequenze (o anche Distribuzioni Marginali) Conteggiando le coppie di modalità diverse (xi , yi) dei due caratteri (X,Y) avremo: Distribuzione Bivariata di Frequenze X / Y 1 2 3 4 5 TOT. A 13 I 9 19 S 6 7 18 12 50 Prof. G. Latorre
Simbologia delle Distribuzioni Bivariate I valori nella tabella vengono chiamati: frequenze congiunte; mentre i totali parziali vengono chiamati: frequenze marginali. Simbologia delle Distribuzioni Bivariate Prof. G. Latorre
Frequenze Congiunte: fr(X=xi;Y=yj)=fr(xi;yj)=nij . X e Y sono i caratteri qualitativi e/o quantitativi che costituiscono la distribuzione doppia. Frequenze Congiunte: fr(X=xi;Y=yj)=fr(xi;yj)=nij . Frequenze Marginali fr(X=xi ) = fr(xi ) = fr(Y=yJ ) = fr(yJ) = Totale complessivo delle freq. Prof. G. Latorre
Freq. relative congiunte: f(xi,yj)=nij/n=fij (i=1,…,r;j=1,…,s) Frequenze Relative: Freq. relative congiunte: f(xi,yj)=nij/n=fij (i=1,…,r;j=1,…,s) Freq. relative marginali: f(xi)=ni./n=fi. (i=1,...,r) f(yj)=nj./n=f.j (j=1,..,s) Naturalmente: Prof. G. Latorre
Dalle 50 coppie di modalità ricaviamo la distribuzione di frequenze bivariata (X,Y) mediante il conteggio delle frequenze di ciascuna coppia di modalità diverse (in tutto 6x3=18) (xi , yi ): Nota: alle coppie di modalità (3,A) e (3,I) compete la stessa frequenza relativa: 0.08 (8% del totale delle 50 famiglie), ma il peso delle famiglie con 3 figli è molto diverso tra le famiglie “A” e quelle “I”. Per sapere se la % di famiglie con 3 figli è maggiore tra quelle “agricole” che tra quelle “operaie” dobbiamo calcolare le frequenze di X condizionate ad Y. Prof. G. Latorre
Per far risaltare questo diverso peso dovremmo calcolare le frequenze relative delle famiglie con 3 figli nei sotto–collettivi delle famiglie “A”, “I” ed “S”. In modo più completo calcoleremo tutte le frequenze relative nelle tre sotto – distribuzioni: X|Y=A 1 2 3 4 5 Totali fr. 13 fr. rel. 0.08 0.15 0.23 0.31 1.00 X|Y=I 1 2 3 4 5 Totali fr. 9 19 fr. rel. 0.05 0.21 0.48 0.00 1.00 X|Y=S 1 2 3 4 5 Totali fr. 6 7 18 fr. rel. 0.17 0.33 0.38 0.06 0.00 1.00 Prof. G. Latorre
Distribuzioni di X Condizionate ad Y Le tre distribuzioni univariate (che si aggiungono alle due distribuzioni marginali) appena illustrate si chiamano: Distribuzioni di X Condizionate ad Y che possiamo sintetizzare nella seguente tabella: X 1 2 3 4 5 Totali fr(X|Y=A) 0.08 0.15 0.23 0.31 1.00 fr(X|Y=I) 0.05 0.21 0.48 0.00 fr(X|Y=S) 0.17 0.33 0.38 0.06 Si noti ora che le famiglie con 3 figli sono 31% tra quelle agricole ed il 21% tra quelle operaie. In generale, quando su n unità statistiche vengono rilevati due caratteri, X e Y, si possono determinare le Distribuzioni Univariate dei caratteri X e Y considerati singolarmente, la Distribuzione Bivariariata (o Distribuzione Congiunta) dei caratteri X e Y considerati congiuntamente ed, infine, le Distribuzioni Condizionate. Prof. G. Latorre
In simboli le distribuzioni univariate di X, pertanto, sono: .. xi xr nr. Tot. n X f(X) x1 f(x1 ) = n1./n .. xi f(xi ) = ni./n xr f(xr ) = nr./n Tot. 1 X f( X | yj ) x1 f(x1|yj ) = n1j /n.j .. xi f(xi|yj ) = nij /n.j xr f(xr|yj ) = nrj /n.j Totali 1 L’ultima delle tre tabelle è la generica distribuzione di X condizionata a Y=yj , poiché (j=1,...,s) di distribuzioni condizionate di X ce ne sono proprio s. Prof. G. Latorre
Calcoliamo ora le distribuzioni di frequenze del carattere Y nei sotto-collettivi di famiglie che hanno, rispettivamente, “0”, “1”, “2”, “3”, “4”, “5”: Y|X=0 fr. fr. rel. A 1 0.20 I S 3 0.60 Totali 5 1.00 Y|X=1 fr. fr. rel. A 2 0.17 I 4 0.33 S 6 0.50 Totali 12 1.00 Y|X=2 fr. fr. rel. A 3 0.16 I 9 0.47 S 7 0.37 Totali 19 1.00 Y|X=3 fr. fr. rel. A 4 0.44 I S 1 0.12 Totali 9 1.00 Y|X=4 fr. fr. rel. A 2 0.50 I 1 0.25 S Totali 4 1.00 Y|X=5 fr. fr. rel. A 1 1.00 I 0.00 S Totali Prof. G. Latorre
Distribuzioni di Y Condizionate ad X che possiamo sintetizzare nella seguente tabella: Y fr(Y|X=0) fr(Y|X=1) fr(Y|X=2) fr(Y|X=3) fr(Y|X=4) fr(Y|X=5) A 0.20 0.17 0.16 0.44 0.50 1.00 I 0.33 0.47 0.25 0.00 S 0.60 0.37 0.12 Totali Prof. G. Latorre
In simboli le distribuzioni univariate di Y sono: n.j y1 n.1 .. yj yr n.s Tot. n Y f(Y) y1 f(y1 )=n.1 /n .. yj f(yi )=n.j /n ys f(ys )=n.s /n Tot. 1 Y f(Y|xi ) y1 f(y1|xi )=ni1 /ni. .. yj f(yj|xi )=nij /ni. ys f(ys|xi )=nis /ni. Totali 1 L’ultima delle tre tabelle è la generica distribuzione di Y condizionata a X=xi , poiché (i=1,...,r) di distribuzioni condizionate di Y ce ne sono proprio r. Prof. G. Latorre
Centralità, dispersione e dipendenza per distribuzione bivariate Medie Marginali: Centro della distribuzione bivariata: [M(x), M(y)] Varianze Marginali: Prof. G. Latorre
Medie Condizionate per (j=1,…,s) per (i=1,…,r) Prof. G. Latorre
Varianze Condizionate: per (j=1,…,s) per (i=1,…,r) Prof. G. Latorre
Quantità di composto additivo (X) e resistenza alla torsione (Y) rilevate su 100 barre d’acciaio sperimentali: (1.71, 6.12) (2.77, 6.23) (2.34, 7.32) (1.42, 5.66) (0.48, 3.12) (2.10, 7.44) (2.18, 7.23) (2.93, 5.92) (1.76, 7.29) (0.95, 4.81) (0.92, 4.14) (0.96, 4.16) (0.58, 2.82) (2.45, 5.82) (2.96, 8.10) (1.60, 6.28) (1.07, 4.50) (2.49, 6.30) 4.84) (2.33, 6.08) (1.66, 4.32) (0.45, 3.90) (1.87, 5.94) (0.44, 3.99) (2.54, 5.32) (1.23, 4.20) (0.51, 3.74) (1.21, 4.63) 5.45) (0.64, 4.47) (1.12, 4.60) (2.53, 7.89) (2.13, 6.02) (0.89, 4.92) (1.20, 5.01) (2.90, 7.65) (1.97, 6.27) (1.56, 5.09) (1.19, 3.16) (0.06, 4.58) (2.89, 8.44) (2.07, 6.65) (0.73, 4.66) 4.59) (1.37, 6.85) (1.85, 6.10) (0.23, 3.81) 5.48) (2.57, 5.78) (1.33, 3.88) (1.46, 5.08) (0.17, 3.29) (0.10, 3.20) (0.18, 2.53) (2.95, 7.78) (0.49, 2.48) (1.06, 4.83) (2.74, 6.97) (2.76, 6.58) (2.83, 8.13) (0.26, 3.86) (2.87, 8.50) (0.65, 4.42) (2.63, 7.34) (2.11, 6.78) (0.75, 4.39) 6.68) (0.01, 3.01) 6.00) (2.16, 6.99) (1.89, 7.12) (2.38, (1.25, 4.64) (1.65, 4.17) (1.39, 5.50) (2.98, 6.70) (2.97, 6.86) (0.30, 3.54) (1.95, 7.47) (2.86, 7.11) (0.40, 4.03) (0.52, 4.68) (1.73, 6.39) (2.78, 6.16) (1.70, 3.45) (0.76, 3.02) (0.83, 4.25) (0.50, 3.41) (0.99, 5.38) (1.80, 3.64) (2.15, 6.42) (0.62, 3.32) (1.81, 4.62) (2.00, 5.83) 4.09) 6.14) 5.87) Prof. G. Latorre
Diagramma SCATTER: X=quantità di composto additivo; Y=resistenza alla torsione Prof. G. Latorre X
Distribuzione Bivariata (X,Y) Quantità di composto additivo (X) e resistenza alla torsione (Y) rilevate su 100 barre d’acciaio sperimentali: X/Y 2 - 4 4 - 5 5 - 6 6 - 7 7 - 9 Totali 0,00-0,75 15 6 21 0,75-1,50 4 13 1 24 1,50-2,25 2 5 7 35 2,25-3,00 9 20 25 23 16 100 Distribuzione Bivariata (X,Y) Domanda: a quali valori di X si associano, in prevalenza, i valori di Y? Prof. G. Latorre
Prof. G. Latorre
Distribuzioni di Y condizionate ad X (val. centr. X=0,375; 1,125; 1,875; 2,625) (val.centr. Y=3; 4,5; 5,5;6,5; 8) Y n1j f(Y| x1) yj f(Y| x1) 2 - 4 15 0,7143 2,1429 4 - 5 6 0,2857 1,2857 5 - 6 0,0000 6 - 7 7 - 9 Totali 21 1,0000 3,4286 Y n2j f(Y| x2) yj f(Y| x2) 2 - 4 4 0,1667 0,5000 4 - 5 13 0,5417 2,4375 5 - 6 6 0,2500 1,3750 6 - 7 1 0,0417 0,2708 7 - 9 0,0000 Totali 24 1,0000 4,5833 M(Y| X=x1=0,375)=3,43; M(Y| X=x2=1,125)=4,583; Prof. G. Latorre
Distribuzioni di Y condizionate ad X (val. centr. X=0,375; 1,125; 1,875; 2,625) (val.centr. Y=3; 4,5; 5,5;6,5; 8) Y n3j f(Y| x3) yj f(Y| x3) 2 - 4 2 0,0571 0,1714 4 - 5 6 0,7714 5 - 6 5 0,1429 0,7857 6 - 7 15 0,4286 2,7857 7 - 9 7 0,2000 1,6000 Totali 35 1,0000 6,1143 Y n4j f(Y| x4) yj f(Y| x4) 2 - 4 0,0000 4 - 5 5 - 6 4 0,2000 1,1000 6 - 7 7 0,3500 2,2750 7 - 9 9 0,4500 3,6000 Totali 20 1,0000 6,9750 M(Y| X=x3=1,875)=6,114; M(Y| X=x4=2,625)=6,975; Prof. G. Latorre
Andamento delle Medie di Y condizionate ad X Prof. G. Latorre
Distribuzione Bivariata X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali ( Y , X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 … Y val.c. Y 2 - 4 3 11 6 2 21 4 - 5 4,5 5 1 25 5 - 6 5,5 4 15 6 - 7 6,5 10 7 23 7 - 9 8 9 16 13 18 14 17 20 100 Prof. G. Latorre
Distribuzioni Condizionate X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali ( Y | X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 … Y val.c. Y 2 -4 3 0,8462 0,3333 0,1429 0,1111 0,0000 0,2100 4 - 5 4,5 0,1538 0,6111 0,4286 0,2778 0,0588 0,2500 5 - 6 5,5 0,0556 0,3571 0,1667 0,1176 0,2000 0,1500 6 - 7 6,5 0,0714 0,5882 0,3500 0,2300 7 - 9 8 0,2353 0,4500 0,1600 1,0000 Prof. G. Latorre
Medie Condizionate X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali ( Y | X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 … Y val.c. Y 2 -4 3 2,5385 1,0000 0,4286 0,3333 0,0000 0,6300 4 - 5 4,5 0,6923 2,7500 1,9286 1,2500 0,2647 1,1250 5 - 6 5,5 0,3056 1,9643 0,9167 0,6471 1,1000 0,8250 6 - 7 6,5 0,4643 1,8056 3,8235 2,2750 1,4950 7 - 9 8 1,3333 1,8824 3,6000 1,2800 3,2308 4,0556 4,7857 5,6389 6,6176 6,9750 5,3550 Prof. G. Latorre
Momenti II° Condizionati Varianze Condizionate ( Y | X ) X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali ( Y | X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 … Y val.c. Y 2 - 4 3 7,6154 3,0000 1,2857 1,0000 0,0000 1,8900 4 - 5 4,5 3,1154 12,3750 8,6786 5,6250 1,1912 5,0625 5 - 6 5,5 1,6806 10,8036 5,0417 3,5588 6,0500 4,5375 6 - 7 6,5 3,0179 11,7361 24,8529 14,7875 9,7175 7 - 9 8 10,6667 15,0588 28,8000 10,2400 10,7308 17,0556 23,7857 34,0694 44,6618 49,6375 31,4475 Varianze Condizionate ( Y | X ) 0,2929 0,6080 0,8827 2,2724 0,8685 0,9869 2,7715 Prof. G. Latorre
M(X|Y) X Prof. G. Latorre
Proprietà Associativa della Media Aritmetica 𝑴 𝒀 𝑥 𝑖 = 1 𝑛 𝑖. 𝑗=1 𝑠 𝑦 𝑗 𝑛 𝑖𝑗 𝑴 𝒀 = 1 𝑛 𝑗=1 𝑠 𝑦 𝑗 𝑛 .𝑗 ; 1 𝑛 𝑖=1 𝑟 𝑴 𝒀 𝑥 𝑖 ∙ 𝑛 𝑖. = 1 𝑛 𝑖=1 𝑟 1 𝑛 𝑖. 𝒋=1 𝒔 𝑦 𝑗 𝑛 𝑖𝑗 ∙ 𝑛 𝑖. = 1 𝑛 𝒋=1 𝒔 𝑦 𝑗 𝑖=1 𝑟 𝑛 𝑖𝑗 = 1 𝑛 𝒋=1 𝒔 𝑦 𝑗 𝑛 .𝑗 =𝑴(𝒀) In altre parole: la media (ponderata) di Y delle distribuzioni condizionate ad xi é uguale alla Media di Y marginale. Prof. G. Latorre
essere cosi enunciata: La proprietà associativa della Media Aritmetica è vera in generale e può essere cosi enunciata: Se un collettivo di n unità viene suddiviso in H gruppi ciascuno contenente ni unità (i=1, 2,…,H) allora la Media Aritmetica delle Medie, che indichiamo con Mi (i=1, 2,…,H), delle modalità di ciascun gruppo ponderata con le ni è pari alla Media Aritmetica M calcolata su tutte le modalità del collettivo, cioè: 𝑀= 1 𝑛 𝑖=1 𝐻 𝑀 𝑖 ∙ 𝑛 𝑖 Prof. G. Latorre