Distribuzioni Bivariate

Slides:



Advertisements
Presentazioni simili
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
Advertisements

1 Principali analisi statistiche 1. Confronto fra medie (2 o piú campioni) 2. Correlazione e regressione 3. Analisi di tabelle di contigenza Variabile.
Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.
Rappresentazioni grafiche di una distribuzione di frequenze 1)Istogramma e poligono delle frequenze ● Dati raggruppati in classi ● Costituito da un insieme.
Consentono di descrivere la variabilità all’interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche.
Genetica delle Popolazioni a.a prof S. Presciuttini DIMENSIONE EFFETTIVA DELLA POPOLAZIONE Questo documento è pubblicato sotto licenza Creative.
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
STATISTICA.
LA STATISTICA DESCRITTIVA
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Statistica descrittiva
ESERCITAZIONE RIEPILOGO di Statistica Descrittiva
DALLA TABELLA DELLE OSSERVAZIONI ALLA TABELLA DELLE FREQUENZE
Elaborazione dei dati Indici di posizione centrale
Lezione 2 CARATTERI DEI DATI: approfondimento (Borra-Di Ciaccio, cap
Distribuzioni limite La distribuzione normale
Analisi dei Dati – Tabelle e Grafici
Valutazione dell’incertezza associata alla mappa acustica dinamica di Milano Giovanni Zambon; Roberto Benocci; Maura Smiraglia; H. Eduardo Roman.
Variabili casuali a più dimensioni
Corso di Analisi Statistica per le Imprese Cross tabulation e relazioni tra variabili Prof. L. Neri a.a
RISPOSTA ALL'ECCITAZIONE NON PERIODICA NEL DOMINIO DEL TEMPO
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Esercitazioni su testi d’esame
STATISTICA Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo.
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
L’analisi monovariata
Quantitative Market Research Set-up Protocol
Il concetto di derivata
PARTE TERZA OPERAZIONI CON LE PROPOSIZIONI
La statistica A cura di: Manuela Mangione.
APPUNTI DI STATISTICA INFERENZIALE
Accenni di analisi monovariata e bivariata
La Statistica si occupa dei modi
misure di eterogeneità
La Statistica Istituto Comprensivo “ M. G. Cutuli”
Numeri indice di prezzi e quantità
Appunti di analisi matematica: Integrale Definito
Statistica descrittiva bivariata
L’analisi monovariata
ANALISI DELLE DISTRIBUZIONI STATISTICHE
Indici di variabilità La variabilità è la ragione dell’esistenza della psicologia. Le persone hanno dei comportamenti diversi che non possono essere predetti.
Corso di Analisi Statistica per le Imprese Rappresentazione dei dati
Corso di Analisi Statistica per le Imprese 2
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Esercitazioni psicometria
L’indagine statistica
Statistica Scienza che studia i fenomeni collettivi.
Statistica.
Quantitative Market Research Set-up Protocol
Dott. Dallavalle Riccardo
32 = 9 x2 = 9 x = 3 32 = 9 √9 = 3 L’estrazione di radice
Statistica descrittiva bivariata
Statistica descrittiva bivariata
“Una delle più grandi scoperte che un uomo può fare, una delle sue più grandi sorprese, è scoprire che può fare ciò che aveva paura di non poter fare”.
Indipendenza tra due caratteri
STATISTICA Giovanni Barbaro.
Precorso di Statistica per le Lauree Magistrali
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Esercizio 1 Si vuole studiare la mobilità di voto degli elettori di una certa circoscrizione. Da un sondaggio telefonico risulta che: Si calcolino le distribuzioni.
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
Test per campioni indipendenti
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
Numeri indice di prezzi e quantità
Frequenza a) Compilare una tabella classificando i compagni di classe secondo lo sport che preferiscono b) Compilare una tabella classificando i compagni.
Gli Indici di Produttività di Divisia
Statistica descrittiva bivariata
EserciZI di Statistica
L’Analisi della Varianza ANOVA (ANalysis Of VAriance)
Transcript della presentazione:

Distribuzioni Bivariate Sulle unità statistiche del collettivo di 50 famiglie sulle quali abbiamo rilevato il carattere X = “n° Figli per Famiglia” rileviamo un secondo carattere Y = “Settore di Attività Economica del Capofamiglia”, le cui modalità sono: A= agricoltura; I= industria; S= servizi; elenco modalità rilevate: dal conteggio delle singole modalità diverse xi e dall’analogo conteggio delle singole modalità diverse yi si ottengono distribuzioni univariate di X e di Y: (3,A) (1,I) (2,S) (2,I) (0,A) (1,S) (5,A) (4,I) (2,A) (3,I) (1,A) (0,I) (4,A) (4,S) (3,S) (0,S) Prof. G. Latorre

Y=Settore Attità Economica X=N° figli Frequenze 5 1 12 2 19 3 9 4 Totale 50 Y=Settore Attità Economica Frequenze Agric. 13 Indus. 19 Serv. 18 Totale 50 Distribuzioni Univariate di Frequenze (o anche Distribuzioni Marginali) Conteggiando le coppie di modalità diverse (xi , yi) dei due caratteri (X,Y) avremo:  Distribuzione Bivariata di Frequenze X / Y 1 2 3 4 5 TOT. A 13 I 9 19 S 6 7 18 12 50 Prof. G. Latorre

Simbologia delle Distribuzioni Bivariate I valori nella tabella vengono chiamati: frequenze congiunte; mentre i totali parziali vengono chiamati: frequenze marginali. Simbologia delle Distribuzioni Bivariate Prof. G. Latorre

Frequenze Congiunte: fr(X=xi;Y=yj)=fr(xi;yj)=nij . X e Y sono i caratteri qualitativi e/o quantitativi che costituiscono la distribuzione doppia. Frequenze Congiunte: fr(X=xi;Y=yj)=fr(xi;yj)=nij . Frequenze Marginali fr(X=xi ) = fr(xi ) = fr(Y=yJ ) = fr(yJ) = Totale complessivo delle freq. Prof. G. Latorre

Freq. relative congiunte: f(xi,yj)=nij/n=fij (i=1,…,r;j=1,…,s) Frequenze Relative: Freq. relative congiunte: f(xi,yj)=nij/n=fij (i=1,…,r;j=1,…,s) Freq. relative marginali: f(xi)=ni./n=fi. (i=1,...,r) f(yj)=nj./n=f.j (j=1,..,s) Naturalmente: Prof. G. Latorre

Dalle 50 coppie di modalità ricaviamo la distribuzione di frequenze bivariata (X,Y) mediante il conteggio delle frequenze di ciascuna coppia di modalità diverse (in tutto 6x3=18) (xi , yi ): Nota: alle coppie di modalità (3,A) e (3,I) compete la stessa frequenza relativa: 0.08 (8% del totale delle 50 famiglie), ma il peso delle famiglie con 3 figli è molto diverso tra le famiglie “A” e quelle “I”. Per sapere se la % di famiglie con 3 figli è maggiore tra quelle “agricole” che tra quelle “operaie” dobbiamo calcolare le frequenze di X condizionate ad Y. Prof. G. Latorre

Per far risaltare questo diverso peso dovremmo calcolare le frequenze relative delle famiglie con 3 figli nei sotto–collettivi delle famiglie “A”, “I” ed “S”. In modo più completo calcoleremo tutte le frequenze relative nelle tre sotto – distribuzioni: X|Y=A 1 2 3 4 5 Totali fr. 13 fr. rel. 0.08 0.15 0.23 0.31 1.00 X|Y=I 1 2 3 4 5 Totali fr. 9 19 fr. rel. 0.05 0.21 0.48 0.00 1.00 X|Y=S 1 2 3 4 5 Totali fr. 6 7 18 fr. rel. 0.17 0.33 0.38 0.06 0.00 1.00 Prof. G. Latorre

Distribuzioni di X Condizionate ad Y Le tre distribuzioni univariate (che si aggiungono alle due distribuzioni marginali) appena illustrate si chiamano: Distribuzioni di X Condizionate ad Y che possiamo sintetizzare nella seguente tabella: X 1 2 3 4 5 Totali fr(X|Y=A) 0.08 0.15 0.23 0.31 1.00 fr(X|Y=I) 0.05 0.21 0.48 0.00 fr(X|Y=S) 0.17 0.33 0.38 0.06 Si noti ora che le famiglie con 3 figli sono 31% tra quelle agricole ed il 21% tra quelle operaie. In generale, quando su n unità statistiche vengono rilevati due caratteri, X e Y, si possono determinare le Distribuzioni Univariate dei caratteri X e Y considerati singolarmente, la Distribuzione Bivariariata (o Distribuzione Congiunta) dei caratteri X e Y considerati congiuntamente ed, infine, le Distribuzioni Condizionate. Prof. G. Latorre

In simboli le distribuzioni univariate di X, pertanto, sono: .. xi xr nr. Tot. n X f(X) x1 f(x1 ) = n1./n .. xi f(xi ) = ni./n xr f(xr ) = nr./n Tot. 1 X f( X | yj ) x1 f(x1|yj ) = n1j /n.j .. xi f(xi|yj ) = nij /n.j xr f(xr|yj ) = nrj /n.j Totali 1 L’ultima delle tre tabelle è la generica distribuzione di X condizionata a Y=yj , poiché (j=1,...,s) di distribuzioni condizionate di X ce ne sono proprio s. Prof. G. Latorre

Calcoliamo ora le distribuzioni di frequenze del carattere Y nei sotto-collettivi di famiglie che hanno, rispettivamente, “0”, “1”, “2”, “3”, “4”, “5”: Y|X=0 fr. fr. rel. A 1 0.20 I S 3 0.60 Totali 5 1.00 Y|X=1 fr. fr. rel. A 2 0.17 I 4 0.33 S 6 0.50 Totali 12 1.00 Y|X=2 fr. fr. rel. A 3 0.16 I 9 0.47 S 7 0.37 Totali 19 1.00 Y|X=3 fr. fr. rel. A 4 0.44 I S 1 0.12 Totali 9 1.00 Y|X=4 fr. fr. rel. A 2 0.50 I 1 0.25 S Totali 4 1.00 Y|X=5 fr. fr. rel. A 1 1.00 I 0.00 S Totali Prof. G. Latorre

Distribuzioni di Y Condizionate ad X che possiamo sintetizzare nella seguente tabella: Y fr(Y|X=0) fr(Y|X=1) fr(Y|X=2) fr(Y|X=3) fr(Y|X=4) fr(Y|X=5) A 0.20 0.17 0.16 0.44 0.50 1.00 I 0.33 0.47 0.25 0.00 S 0.60 0.37 0.12 Totali Prof. G. Latorre

In simboli le distribuzioni univariate di Y sono: n.j y1 n.1 .. yj yr n.s Tot.  n Y f(Y) y1 f(y1 )=n.1 /n .. yj f(yi )=n.j /n ys f(ys )=n.s /n Tot. 1 Y f(Y|xi ) y1 f(y1|xi )=ni1 /ni. .. yj f(yj|xi )=nij /ni. ys f(ys|xi )=nis /ni. Totali 1 L’ultima delle tre tabelle è la generica distribuzione di Y condizionata a X=xi , poiché (i=1,...,r) di distribuzioni condizionate di Y ce ne sono proprio r. Prof. G. Latorre

Centralità, dispersione e dipendenza per distribuzione bivariate Medie Marginali: Centro della distribuzione bivariata: [M(x), M(y)] Varianze Marginali: Prof. G. Latorre

Medie Condizionate per (j=1,…,s) per (i=1,…,r) Prof. G. Latorre

Varianze Condizionate: per (j=1,…,s) per (i=1,…,r) Prof. G. Latorre

Quantità di composto additivo (X) e resistenza alla torsione (Y) rilevate su 100 barre d’acciaio sperimentali: (1.71, 6.12) (2.77, 6.23) (2.34, 7.32) (1.42, 5.66) (0.48, 3.12) (2.10, 7.44) (2.18, 7.23) (2.93, 5.92) (1.76, 7.29) (0.95, 4.81) (0.92, 4.14) (0.96, 4.16) (0.58, 2.82) (2.45, 5.82) (2.96, 8.10) (1.60, 6.28) (1.07, 4.50) (2.49, 6.30) 4.84) (2.33, 6.08) (1.66, 4.32) (0.45, 3.90) (1.87, 5.94) (0.44, 3.99) (2.54, 5.32) (1.23, 4.20) (0.51, 3.74) (1.21, 4.63) 5.45) (0.64, 4.47) (1.12, 4.60) (2.53, 7.89) (2.13, 6.02) (0.89, 4.92) (1.20, 5.01) (2.90, 7.65) (1.97, 6.27) (1.56, 5.09) (1.19, 3.16) (0.06, 4.58) (2.89, 8.44) (2.07, 6.65) (0.73, 4.66) 4.59) (1.37, 6.85) (1.85, 6.10) (0.23, 3.81) 5.48) (2.57, 5.78) (1.33, 3.88) (1.46, 5.08) (0.17, 3.29) (0.10, 3.20) (0.18, 2.53) (2.95, 7.78) (0.49, 2.48) (1.06, 4.83) (2.74, 6.97) (2.76, 6.58) (2.83, 8.13) (0.26, 3.86) (2.87, 8.50) (0.65, 4.42) (2.63, 7.34) (2.11, 6.78) (0.75, 4.39) 6.68) (0.01, 3.01) 6.00) (2.16, 6.99) (1.89, 7.12) (2.38, (1.25, 4.64) (1.65, 4.17) (1.39, 5.50) (2.98, 6.70) (2.97, 6.86) (0.30, 3.54) (1.95, 7.47) (2.86, 7.11) (0.40, 4.03) (0.52, 4.68) (1.73, 6.39) (2.78, 6.16) (1.70, 3.45) (0.76, 3.02) (0.83, 4.25) (0.50, 3.41) (0.99, 5.38) (1.80, 3.64) (2.15, 6.42) (0.62, 3.32) (1.81, 4.62) (2.00, 5.83) 4.09) 6.14) 5.87) Prof. G. Latorre

Diagramma SCATTER: X=quantità di composto additivo; Y=resistenza alla torsione Prof. G. Latorre X

Distribuzione Bivariata (X,Y) Quantità di composto additivo (X) e resistenza alla torsione (Y) rilevate su 100 barre d’acciaio sperimentali: X/Y 2 - 4 4 - 5 5 - 6 6 - 7 7 - 9 Totali 0,00-0,75 15 6 21 0,75-1,50 4 13 1 24 1,50-2,25 2 5 7 35 2,25-3,00 9 20 25 23 16 100 Distribuzione Bivariata (X,Y) Domanda: a quali valori di X si associano, in prevalenza, i valori di Y? Prof. G. Latorre

Prof. G. Latorre

Distribuzioni di Y condizionate ad X (val. centr. X=0,375; 1,125; 1,875; 2,625) (val.centr. Y=3; 4,5; 5,5;6,5; 8) Y n1j f(Y| x1) yj f(Y| x1) 2 - 4 15 0,7143 2,1429 4 - 5 6 0,2857 1,2857 5 - 6 0,0000 6 - 7 7 - 9 Totali 21 1,0000 3,4286 Y n2j f(Y| x2) yj f(Y| x2) 2 - 4 4 0,1667 0,5000 4 - 5 13 0,5417 2,4375 5 - 6 6 0,2500 1,3750 6 - 7 1 0,0417 0,2708 7 - 9 0,0000 Totali 24 1,0000 4,5833 M(Y| X=x1=0,375)=3,43; M(Y| X=x2=1,125)=4,583; Prof. G. Latorre

Distribuzioni di Y condizionate ad X (val. centr. X=0,375; 1,125; 1,875; 2,625) (val.centr. Y=3; 4,5; 5,5;6,5; 8) Y n3j f(Y| x3) yj f(Y| x3) 2 - 4 2 0,0571 0,1714 4 - 5 6 0,7714 5 - 6 5 0,1429 0,7857 6 - 7 15 0,4286 2,7857 7 - 9 7 0,2000 1,6000 Totali 35 1,0000 6,1143 Y n4j f(Y| x4) yj f(Y| x4) 2 - 4 0,0000 4 - 5 5 - 6 4 0,2000 1,1000 6 - 7 7 0,3500 2,2750 7 - 9 9 0,4500 3,6000 Totali 20 1,0000 6,9750 M(Y| X=x3=1,875)=6,114; M(Y| X=x4=2,625)=6,975; Prof. G. Latorre

Andamento delle Medie di Y condizionate ad X Prof. G. Latorre

Distribuzione Bivariata   X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali ( Y , X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 … Y val.c. Y 2 - 4 3 11 6 2 21 4 - 5 4,5 5 1 25 5 - 6 5,5 4 15 6 - 7 6,5 10 7 23 7 - 9 8 9 16 13 18 14 17 20 100 Prof. G. Latorre

Distribuzioni Condizionate   X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali ( Y | X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 … Y val.c. Y 2 -4 3 0,8462 0,3333 0,1429 0,1111 0,0000 0,2100 4 - 5 4,5 0,1538 0,6111 0,4286 0,2778 0,0588 0,2500 5 - 6 5,5 0,0556 0,3571 0,1667 0,1176 0,2000 0,1500 6 - 7 6,5 0,0714 0,5882 0,3500 0,2300 7 - 9 8 0,2353 0,4500 0,1600 1,0000 Prof. G. Latorre

Medie Condizionate X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3   X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali ( Y | X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 … Y val.c. Y 2 -4 3 2,5385 1,0000 0,4286 0,3333 0,0000 0,6300 4 - 5 4,5 0,6923 2,7500 1,9286 1,2500 0,2647 1,1250 5 - 6 5,5 0,3056 1,9643 0,9167 0,6471 1,1000 0,8250 6 - 7 6,5 0,4643 1,8056 3,8235 2,2750 1,4950 7 - 9 8 1,3333 1,8824 3,6000 1,2800 3,2308 4,0556 4,7857 5,6389 6,6176 6,9750 5,3550 Prof. G. Latorre

Momenti II° Condizionati Varianze Condizionate ( Y | X )   X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali ( Y | X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 … Y val.c. Y 2 - 4 3 7,6154 3,0000 1,2857 1,0000 0,0000 1,8900 4 - 5 4,5 3,1154 12,3750 8,6786 5,6250 1,1912 5,0625 5 - 6 5,5 1,6806 10,8036 5,0417 3,5588 6,0500 4,5375 6 - 7 6,5 3,0179 11,7361 24,8529 14,7875 9,7175 7 - 9 8 10,6667 15,0588 28,8000 10,2400 10,7308 17,0556 23,7857 34,0694 44,6618 49,6375 31,4475 Varianze Condizionate ( Y | X ) 0,2929 0,6080 0,8827 2,2724 0,8685 0,9869 2,7715 Prof. G. Latorre

M(X|Y) X Prof. G. Latorre

Proprietà Associativa della Media Aritmetica 𝑴 𝒀 𝑥 𝑖 = 1 𝑛 𝑖. 𝑗=1 𝑠 𝑦 𝑗 𝑛 𝑖𝑗 𝑴 𝒀 = 1 𝑛 𝑗=1 𝑠 𝑦 𝑗 𝑛 .𝑗 ; 1 𝑛 𝑖=1 𝑟 𝑴 𝒀 𝑥 𝑖 ∙ 𝑛 𝑖. = 1 𝑛 𝑖=1 𝑟 1 𝑛 𝑖. 𝒋=1 𝒔 𝑦 𝑗 𝑛 𝑖𝑗 ∙ 𝑛 𝑖. = 1 𝑛 𝒋=1 𝒔 𝑦 𝑗 𝑖=1 𝑟 𝑛 𝑖𝑗 = 1 𝑛 𝒋=1 𝒔 𝑦 𝑗 𝑛 .𝑗 =𝑴(𝒀) In altre parole: la media (ponderata) di Y delle distribuzioni condizionate ad xi é uguale alla Media di Y marginale. Prof. G. Latorre

essere cosi enunciata: La proprietà associativa della Media Aritmetica è vera in generale e può essere cosi enunciata: Se un collettivo di n unità viene suddiviso in H gruppi ciascuno contenente ni unità (i=1, 2,…,H) allora la Media Aritmetica delle Medie, che indichiamo con Mi (i=1, 2,…,H), delle modalità di ciascun gruppo ponderata con le ni è pari alla Media Aritmetica M calcolata su tutte le modalità del collettivo, cioè: 𝑀= 1 𝑛 𝑖=1 𝐻 𝑀 𝑖 ∙ 𝑛 𝑖 Prof. G. Latorre