La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Le distribuzioni multiple Si definisce distribuzione statistica multipla la distribuzione ottenuta dalla rilevazione di più caratteri su unità appartenenti.

Presentazioni simili


Presentazione sul tema: "Le distribuzioni multiple Si definisce distribuzione statistica multipla la distribuzione ottenuta dalla rilevazione di più caratteri su unità appartenenti."— Transcript della presentazione:

1 Le distribuzioni multiple Si definisce distribuzione statistica multipla la distribuzione ottenuta dalla rilevazione di più caratteri su unità appartenenti ad una determinata popolazione. Se vengono rilevati due caratteri su ogni unità si definisce una distribuzione doppia. Se vengono rilevati tre caratteri su ogni unità si definisce una distribuzione tripla.

2 Le distribuzioni multiple Se vengono rilevati m caratteri su ogni unità si definisce una distribuzione m-pla e le singole variabili vengono definite variabili componenti. Si parla di mutabile multipla se tutti i caratteri componenti sono di natura qualitativa; Si parla di variabile multipla se tutti caratteri componenti sono di natura quantitativa.

3 Le distribuzioni multiple Se le N unità del collettivo non sono molto numerose, si può rappresentare la distribuzione multipla indicando per ciascuna unità le m modalità presenti in essa: UnitàX1X1 X2X2 …XmXm 1x 11 x 12...x1mx1m 2x 21 x 22...x2mx2m … NxN1xN1 xN2xN2 x Nm dove x 11 indica la modalità del carattere X 1 presente nella prima unità e così via. Questa è definita distribuzione doppia per unità - modalità.

4 Le distribuzioni multiple Consideriamo un collettivo di sei studenti sui quali sono stati rilevati letà e il voto allesame di statistica, la distribuzione unità - modalità è la seguente: Unità età voto

5 Le distribuzioni doppie Consideriamo ora una popolazione sulla quale sono stati rilevati due caratteri. Quando le unità del collettivo sono numerose, è preferibile rappresentare la distribuzione doppia tramite una tabella a doppia entrata (distribuzione doppia di frequenze) dove ad ogni modalità (x i,y j ) di (X,Y) corrisponde la frequenza assoluta n ij, con i=1,2,…,k e j=1,2,…,s. In altre parole si registra quante volte una coppia di modalità si presenta contemporaneamente per X e Y.

6 Le distribuzioni doppie dove: y1y1 …yjyj …yhyh x1x1 n 11 n1jn1j n 1h n 10 …………… xixi ni1ni1 …n ij …n ih ni0ni0 …………… xkxk nk1nk1 …n kj …n kh nk0nk0 n 01...n0jn0j n0hn0h N

7 Le distribuzioni doppie Le frequenze n i0, i=1,2,…,k sono definite frequenze marginali assolute della variabile X, mentre le frequenze n 0j j=1,2,…,h sono definite frequenze marginali assolute della variabile Y. Consideriamo ora le frequenze f ij, = n ij /N con i=1,2,…,k e j=1,2,…,s; in questo caso la tabella a doppia entrata può essere scritta come:

8 Le distribuzioni doppie y1y1 …yjyj …yhyh x1x1 f 11 f1jf1j f 1h f 10 …………… xixi fi1fi1 …f ij …f ih fi0fi0 …………… xkxk fk1fk1 …f kj …f kh fk0fk0 f 01...f0jf0j f0kf0k 1 dove:

9 Le distribuzioni doppie In questo caso, le frequenze f i0, i=1,2,…,k sono le frequenze marginali relative della variabile X mentre le frequenze f 0j, j=1,2,…,h sono le frequenze marginali relative della variabile Y. Le frequenze assolute marginali n i0 (le frequenze relative marginali f i0 ) esprimono i soggetti (la porzione di soggetti) che possiedono la modalità x i a prescindere da quello che avviene per il carattere Y.

10 Le distribuzioni condizionate Consideriamo una distribuzione doppia (X,Y) e fissiamo il valore x i per la variabile X, se studiamo la distribuzione di Y per i soli soggetti che possiedono quel valore x i della variabile X, si ottiene la distribuzione condizionata di Y dato x i. Tale distribuzione si indica con Y|(X=x i ) Valori di Y|(X=x i )y1y1 y2y2 …yhyh Tot. Freq.assoluten i1 n i2...n ih ni0ni0 Freq.relativeni1/ni0ni1/ni0 ni2/ni0ni2/ni0...n ih /n i0 1

11 Le distribuzioni condizionate Se fissiamo, invece, il valore y j per la variabile Y, se studiamo la distribuzione di X per i soli soggetti che possiedono quel valore y j della variabile Y, si ottiene la distribuzione condizionata di X dato y j. Tale distribuzione si indica con X|(Y=y j ) Valori di X|(Y=y j )x1x1 x2x2 …xkxk Tot. Freq.assoluten 1j n 2j...n kj n0jn0j Freq.relativen 1j /n 0j n 2j /n 0j...n kj /n 0j 1

12 Le distribuzioni condizionate Xx1x1 x2x2 …xkxk Freq.assoluten 10 n 20...nk0nk0 OSSERVAZIONE: Data una distribuzione doppia (X,Y) si possono definire 2+h+k distribuzioni semplici: 2 distribuzioni marginali: Yy1y1 y2y2 …yhyh Freq.assoluten 01 n 02...n0hn0h

13 Le distribuzioni condizionate h distribuzioni condizionate di X dato y j la cui distribuzione generica è: Valori di X|(Y=y j )x1x1 x2x2 …xkxk Tot Freq.relativen 1j /n 0j n 2j /n 0j...n kj /n 0j 1 corrispondente alla modalità y j di Y con j=1,2,…,h. k distribuzioni condizionate di Y dato x i la cui distribuzione generica è: y1y1 y2y2 …yhyh Tot Freq.relativeni1/ni0ni1/ni0 ni2/ni0ni2/ni0...n ih /n i0 1 corrispondente alla modalità x i di X con i=1,2,…,k.

14 Un esempio Consideriamo la seguente distribuzione doppia che descrive una popolazione di 100 individui sui quali sono stati rilevati il carattere grado di istruzione (X) e il carattere sesso (Y): XYTOT. MF Analfabeta145 Licenza elementare5510 Licenza media Licenza media superiore Laurea8412 TOTALE

15 Un esempio La distribuzione doppia di frequenze relative è la seguente: XYTOT. MF Analfabeta0,010,040,05 Licenza elementare0,05 0,10 Licenza media0,220,160,38 Licenza media superiore0,180,170,35 Laurea0,080,040,12 TOTALE0,540,461,00

16 Un esempio Da questa distribuzione doppia possono essere ricavate: 2 distribuzioni marginali di frequenze relative (a, b); 2 distribuzioni condizionate (parziali) di frequenze relative di X dato y j (c, d); 5 distribuzioni condizionate (parziali) di frequenze relative di Y dato x i (e, f, g, h, i)

17 Un esempio a)Distribuzione marginale di X X=grado di istruzionefi fi Analfabeta0,05 Licenza elementare0,10 Licenza media0,38 Licenza media superiore0,35 Laurea0,12 TOTALE1,00

18 Un esempio Y=sesso fi fi M0,54 F0,46 TOTALE1,00 b)Distribuzione marginale di Y c)Distribuzione condizionata (X|Y=F) XY=FY=F Analfabeta0,09 Licenza elementare0,11 Licenza media0,35 Licenza media superiore0,36 Laurea0,09 TOTALE1,00

19 Un esempio XY=MY=M Analfabeta0,02 Licenza elementare0,09 Licenza media0,41 Licenza media superiore0,33 Laurea0,15 TOTALE1,00 d)Distribuzione condizionata (X|Y=M) YX=analfabeta M0,20 F0,80 TOT.1,00 e)Distribuzione condizionata (Y|X=Analfabeta)

20 Un esempio YX=lic.elementare M0,50 F TOT.1,00 f)Distribuzione condizionata (Y|X=Licenza Elem.) g)Distribuzione condizionata (Y|X=Licenza Media) YX=lic. Media M0,58 F0,42 TOT.1,00

21 Un esempio YX=lic. media superiore M0,51 F0,49 TOT.1,00 h)Distribuzione condizionata (Y|X=Licenza media sup.) i)Distribuzione condizionata (Y|X=Laurea) YX=laurea M0,67 F0,33 TOT.1,00

22 Indici per una sola variabile Se il carattere è quantitativo è possibile calcolare dei valori di sintesi per ciascuno dei caratteri X e Y. In questo caso, la media aritmetica e la varianza di X sono le seguenti:

23 Le distribuzioni doppie dove: y1y1 …yjyj …yhyh x1x1 n 11 n1jn1j n 1h n 10 …………… xixi ni1ni1 …n ij …n ih ni0ni0 …………… xkxk nk1nk1 …n kj …n kh nk0nk0 n 01...n0jn0j n0hn0h N

24 Indici per una sola variabile La media aritmetica e la varianza di Y, invece, sono:

25 Un esempio Consideriamo la seguente distribuzione di 100 studenti secondo il voto riportato in Statistica (X) e Ragioneria (Y). XY

26 Un esempio Ora calcoliamo i valori di sintesi per X: Xn i0 x i n i0 (x i -μ) 2 (x i - μ) 2 n i ,34274, ,62236, ,90104, ,18106, ,4638, ,740, ,020, ,3023, ,589, ,860, ,14205, ,42290, ,70301, ,08

27 Un esempio Per il carattere Y i calcoli vengono eseguiti nello stesso modo.

28 La dipendenza Analizziamo ora alcune caratteristiche di una distribuzione doppia che non sono estensioni delle caratteristiche delle distribuzioni semplici. DEFINIZIONE: In matematica si dice che una variabile y, funzione di unaltra variabile x, è indipendente rispetto a x se, al variare di x, il valore di y resta costante.

29 La dipendenza x y Nel caso di una tabella a doppia entrata bisogna confrontare le distribuzioni condizionate (parziali).

30 La dipendenza Due distribuzioni semplici possono essere confrontate nei seguenti modi: Confrontando alcuni indici sintetici delle distribuzioni, per esempio due distribuzioni si dicono uguali rispetto alla media aritmetica se hanno la stessa media aritmetica; Confrontando direttamente tra loro le distribuzioni condizionate (parziali) di un carattere rispetto alle modalità dellaltro carattere.

31 La dipendenza Si possono presentare due situazioni limite: Caso di connessione nulla o indipendenza; Caso di perfetta dipendenza.

32 Indici di connessione Nelle situazioni intermedie tra il caso di dipendenza perfetta e il caso di indipendenza sorge il problema della misura del grado di connessione tra i due caratteri. Le misure del legame sono: Misure di dipendenza assoluta basate sul confronto fra le frequenze relative e le frequenze teoriche nel caso di indipendenza assoluta; Misure di dipendenza in media basate sul confronto delle medie delle distribuzioni condizionate (parziali).

33 Connessione nulla o indipendenza Consideriamo la seguente distribuzione doppia di frequenze: y1y1 …yjyj …yhyh x1x1 n 11 n1jn1j n 1h n 10 …………… xixi ni1ni1 …n ij …n ih ni0ni0 …………… xkxk nk1nk1 …n kj …n kh nk0nk0 n 01...n0jn0j n0hn0h N

34 Connessione nulla o indipendenza DEFINIZIONE: Data una distribuzione doppia, il carattere Y è indipendente o non connesso con il carattere X, se le distribuzioni parziali secondo il carattere Y corrispondenti alle modalità di X sono tutte simili fra loro, cioè se, per j=1,2,…,h si ha: Infatti due distribuzioni secondo uno stesso carattere sono simili se sono uguali le frequenze relative di ciascuna modalità nelle due distribuzioni.

35 Connessione nulla o indipendenza Consideriamo ora il termine generale della (1): Quindi nel caso di indipendenza assoluta si ha:

36 Connessione nulla o indipendenza In termini di frequenze relative la relazione precedente può essere scritta: Quindi, le frequenze assolute di una tabella a doppia entrata nella quale X e Y sono indipendenti sono indicate con:

37 Connessione nulla o indipendenza Per tali frequenze valgono le seguenti proprietà:

38 Connessione nulla o indipendenza 2) Lindipendenza o connessione nulla è bilaterale, in altre parole se Y è indipendente da X anche X lo è da Y. Infatti se Y è indipendente da X si ha: invertendo i medi si ha che: cioè X è indipendente da Y.

39 Connessione nulla o indipendenza 3) Le differenze tra sono definite contingenze cioè: Le contingenze esprimono la diversità tra le frequenze assolute osservate e le frequenze assolute nel caso di variabili indipendenti. vi è attrazione tra le modalità x i ed y j vi è repulsione tra le modalità x i ed y j

40 Connessione nulla o indipendenza 4) Per le contingenze si ha:

41 Perfetta dipendenza DEFINIZIONE: Il carattere Y dipende perfettamente da X se ad ogni modalità x i di X è associata una sola modalità y j di Y, in tal senso è possibile affermare che Y è completamente determinata dalle modalità di X. ESEMPIO : Consideriamo un carattere X che si presenta in quattro modalità ed un carattere Y che si presenta in tre modalità, se la distribuzione doppia è la seguente:

42 Perfetta dipendenza allora è possibile affermare che il carattere Y dipende perfettamente da X, in quanto ad ogni modalità x i di X è associata una sola modalità y j di Y e quindi che Y è completamente determinata dalle modalità di X. y1y1 y2y2 y3y3 x1x x2x x3x x4x

43 Perfetta dipendenza OSSERVAZIONE: La relazione di perfetta dipendenza non è simmetrica. Infatti in questo caso, ad ogni modalità y j di Y non è associata una sola modalità x i di X (ad esempio, si veda la modalità y 1 ). Pertanto, nellesempio precedente X non dipende perfettamente da Y.

44 Perfetta dipendenza DEFINIZIONE: La relazione è simmetrica, cioè Y e X sono mutuamente in dipendenza perfetta se ad ogni modalità y j di Y è associata una sola modalità x i di X e viceversa. Ciò si verifica se, nellipotesi che le frequenze marginali siano tutte diverse da 0, si ha che h = k, cioè se la tabella della distribuzione doppia è quadrata.

45 Perfetta dipendenza ESEMPIO : Consideriamo un carattere X che si presenta in tre modalità ed un carattere Y che si presenta in tre modalità, se la distribuzione doppia è la seguente: y1y1 y2y2 y3y3 x1x x2x x3x allora è possibile affermare che Y e X sono mutuamente in dipendenza perfetta cioè che ad ogni modalità y j di Y è associata una sola modalità x i di X e viceversa.

46 Indici di dipendenza assoluta Una importante misura di distanza fra distribuzioni di frequenza è la distanza del di K. Pearson introdotta nel 1900, la quale è data da:

47 Indici di dipendenza assoluta 1) Lindice del 2) Il assume valore 0 nel caso di indipendenza assoluta e tende ad assumere valori sempre più grandi in situazioni dove X e Y sono lontani dallipotesi di indipendenza; 3) Il può essere utilizzato nellanalisi sia di caratteri quantitativi sia nellanalisi di caratteri qualitativi; in quanto il calcolo non dipende dalle modalità dei caratteri in esame, ma solo dalle distribuzioni delle frequenze.

48 Un esempio La tabella seguente riporta la distribuzione delle 76 unità di un collettivo secondo le modalità congiunte di due caratteri qualitativi A e B: Carattere A Carattere B B1B1 B2B2 B3B3 A1A A2A Dopo aver verificato che non sussiste indipendenza assoluta tra i caratteri, determinare lindice di connessione

49 Un esempio Consideriamo, ad esempio, Per avere indipendenza assoluta è necessario che: Pertanto, è sufficiente che tale relazione non sia verificata per una sola frequenza assoluta della tabella a doppia entrata precedente per affermare che tra il carattere X e il carattere Y sussista un certo grado di dipendenza. quindi tra i due caratteri vi è un certo grado di dipendenza assoluta.

50 Un esempio Ora calcoliamo lindice: La tabella delle frequenze teoriche è la seguente:

51 Un esempio Carattere A Carattere B B1B1 B2B2 B3B3 A1A1 18,9910,717,30 A2A2 20,0111,297,70 mentre la tabella dei valori è la seguente:

52 Un esempio Carattere A Carattere B B1B1 B2B2 B3B3 A1A1 0,210,160,070,44 A2A2 0,200,150,060,41 0,85 Quindi lindice che mostra un basso grado di dipendenza tra i caratteri.

53 Altri indici di dipendenza Per eliminare la dipendenza dellindice da N si definisce la contingenza quadratica media come: Lindice si annulla nel caso di indipendenza e soddisfa le seguenti disuguaglianze:

54 Altri indici di dipendenza Luguaglianza =k-1 si verifica quando vi è dipendenza perfetta di X da Y, mentre luguaglianza =h-1 si verifica quando vi è dipendenza perfetta di Y da X. Quindi, possiamo definire il seguente indice medio di contingenza di H. Cramer come: con

55 Un esempio La tabella seguente riporta la distribuzione delle 20 regioni italiane per circoscrizione territoriale e per classe di produzione di frumento in milioni di quintali: Circoscrizioni territoriali Produzione di frumento 0-2,5 (bassa) 2,5-5,0 (media) 5,0-10,0 (alta) Nord4228 Centro0224 Sud Calcolare la contingenza quadratica media e lindice medio di contingenza

56 Un esempio Per calcolare lindice dobbiamo innanzitutto quantificare lindice La tabella delle frequenze teoriche è la seguente:

57 Un esempio Circoscrizioni territoriali Produzione di frumento 0-2,5 (bassa) 2,5-5,0 (media) 5,0-10,0 (alta) Nord3,602,002,40 Centro1,801,001,20 Sud3,602,002,40 mentre la tabella dei valori è la seguente:

58 Un esempio Circoscrizioni territoriali Produzione di frumento 0-2,5 (bassa) 2,5-5,0 (media) 5,0-10,0 (alta) Nord0,040,000,070,11 Centro1,801,000,533,33 Sud0,540,500,071,11 4,55 Pertanto gli indici ricercati sono:

59 La correlazione. KARL PEARSON ( ) Pearson raccolse le altezze di 1078 padri e dei loro figli in età matura:

60 La correlazione. Quando esiste una forte associazione fra X e Y conoscere il valore di una esse aiuta a prevedere il corrispondente dellaltra. Lintensità del legame tra la variabile X e Y è misurata tramite il coefficiente di correlazione.

61 La correlazione. Consideriamo due caratteri quantitativi X e Y. DEFINIZIONE: Dati due caratteri quantitativi X e Y, si ha concordanza tra di essi, se a valori più piccoli di X corrispondono valori più piccoli di Y e a valori più grandi di X corrispondono valori più grandi di Y. DEFINIZIONE: Dati due caratteri quantitativi X e Y, si ha discordanza tra di essi, se a valori più piccoli di X corrispondono valori più grandi di Y e a valori più grandi di X corrispondono valori più piccoli di Y.

62 La covarianza. Una importante misura della concordanza tra due caratteri è la covarianza definita come: La formula precedente nel caso di distribuzioni unitarie diventa:

63 La covarianza. mentre nel caso di distribuzioni di frequenze assolute si ha: Si può dimostrare che: Infatti:

64 La covarianza.

65 . Nel caso di una distribuzione di frequenze si ha: OSSERVAZIONI: Se X e Y sono concordi, allora la covarianza assume segno positivo; Se X e Y sono discordi, allora la covarianza assume segno negativo; Se la covarianza è nulla, X e Y sono indifferenti (incorrelati).

66 Proprietà della covarianza Siano X e Y due variabili e e due costanti, allora risulta: cioè la covarianza è invariante per cambiamenti di unità di misura di X e Y. Dim.: Infatti:

67 Proprietà della covarianza. Ma dato che:

68 Proprietà della covarianza. Siano X e Y due variabili e, due costanti, allora risulta: cioè la covarianza è invariante per traslazioni di X e Y. Dim.: Infatti:

69 Proprietà della covarianza. Ma dato che: allora:

70 Proprietà della covarianza. Combinando le due relazioni precedenti si ha:

71 Coefficiente di correlazione lineare Il coefficiente di correlazione lineare è definito come: Lindice ρ misura il legame lineare fra X e Y e varia tra - 1 e 1; cioè:

72 Coefficiente di correlazione lineare. Nel caso di distribuzioni unitarie ρ è definito come: Nel caso di distribuzioni di frequenza invece si ha:

73 Coefficiente di correlazione lineare. OSSERVAZIONI: Se ρ>0, X e Y sono concordi tra loro; Se ρ=1, X e Y sono legati da una perfetta dipendenza lineare diretta; Se ρ<0, X e Y sono discordi tra loro; Se ρ=-1, X e Y sono legati da una perfetta dipendenza lineare inversa; Se ρ=0, X e Y sono indifferenti (incorrelati) tra loro.

74 Un esempio Sia data la seguente distribuzione di 6 appezzamenti di terreno secondo la quantità di fertilizzante utilizzato ed il raccolto di grano: X Fertilizzante (Kg) Y Grano (qt) Calcolare il coefficiente di correlazione lineare.

75 Un esempio. Calcoliamo innanzitutto la Cov(X,Y) che nel caso di distribuzioni unitarie è pari a: Per il calcolo dellindice ci aiutiamo con la seguente tabella:

76 Un esempio. X Fertilizzante (Kg) Y Grano (qt) 124,3372,6711,56 102,3361,673,89 80,334-0,33-0,11 91,334-0,33-0,44 5-2,673-1,333,55 2-5,672-2,3313, ,67

77 Un esempio. Quindi si ha: Ora calcoliamo la Var(X) e la Var (Y):

78 Un esempio 4,3318,752,677,13 2,335,431,672,79 0,330,11-0,330,11 1,331,77-0,330,11 -2,677,13-1,331,77 -5,6732,15-2,335,43 65,3417,34.

79 Un esempio. Quindi: Pertanto il coefficiente di correlazione lineare è pari a: che mostra una elevata correlazione lineare diretta tra i due caratteri.

80 Un esempio. Sia data la seguente distribuzione di 10 squadre di calcio durante il campionato di calcio secondo i gol fatti (variabile X) e i gol subiti (variabile Y): SquadreGol Fatti XGol Subiti Y ROMA6833 JUVENTUS6027 LAZIO6536 PARMA5131 INTER47 MILAN5646 ATALANTA3935 BRESCIA4442 FIORENTINA5352 BOLOGNA4953

81 Un esempio. Determinare il coefficiente di correlazione lineare. Calcoliamo innanzitutto la Cov(X,Y) : XY 6814,833-7,2-106,56 606,827-13,2-89, ,836-4,2-49, ,231-9,220, ,2476,8-42,16 562,8465,816, ,235-5,273, ,2421,8-16, ,25211,8-2, ,25312,8-53, ,40

82 Un esempio. Quindi si ha: Ora calcoliamo la Var(X) e la Var (Y):

83 Un esempio 14,8219,04-7,251,84 6,846,24-13,2174,24 11,8139,24-4,217,64 -2,24,84-9,284,64 -6,238,446,846,24 2,87,845,833,64 -14,2201,64-5,227,04 -9,284,641,83,24 -0,20,0411,8139,24 -4,217,6412,8163,84 759,60741,60.

84 Un esempio. Quindi: Pertanto il coefficiente di correlazione lineare è pari a:

85 Un esempio. Sia data la seguente distribuzione di 20 famiglie secondo il numero di componenti (variabile X) e il numero di stanze dellappartamento dove si vive (variabile Y): X Y Calcolare il coefficiente di correlazione lineare.

86 Un esempio Calcoliamo innanzitutto la Cov(X,Y) che nel caso di distribuzioni di frequenza è pari a: La media aritmetica di X è pari a:

87 Un esempio La media aritmetica di Y è, invece, pari a:

88 Un esempio La covarianza è pari a:

89 Un esempio X ni0 ni0 (x i - x ) (x i - x ) 2 (x i - x ) 2 n i0 15-1,351,829, ,350,120,86 340,650,421,69 441,652,7210, ,55 Y n 0j (y j - y ) (y j - y ) 2 (y j - y ) 2 n 0j 15-1,251,56257, ,250,06250, ,750,56255, ,75 Per il calcolo delle varianze ci aiutiamo con le seguente tabelle:

90 Un esempio Quindi: Pertanto il coefficiente di correlazione lineare è pari a:

91 Alcune proprietà Lindipendenza assoluta tra X e Y implica una indifferenza tra i caratteri, cioè un ma una indifferenza tra i caratteri non implica una indipendenza assoluta, ma solamente una indipendenza di tipo lineare. Infatti se vi è indipendenza assoluta tra X e Y si ha che le frequenze assolute sono pari a: Pertanto si ha:

92 Alcune proprietà

93 in quanto sono somma di scarti dalla media aritmetica; pertanto tra il carattere X e il carattere Y vi è indifferenza ( =0).

94 Alcune proprietà Lindifferenza, invece, può presentarsi anche in caso di connessione non nulla; infatti la covarianza può annullarsi anche se fra le distribuzioni marginali cè massima dipendenza, ossia nel caso che ad ogni valore di X corrisponda uno ed un solo valore di Y. Ciò accade ad esempio per la seguente distribuzione: X Y Per la quale i valori della variabile Y sono legati alla variabile X dalla seguente relazione: In questo caso =0 ma vi è una dipendenza perfetta di Y da X.

95 Alcune proprietà Siano X e Y due variabili e,, e delle costanti. Allora si ha: Dim.:

96 Alcune proprietà ρ è quindi invariante per trasformazioni lineari che conservano il segno, cioè che mantengono invariata la direzione della relazione tra X e Y.

97 Alcune proprietà Dim.: Infatti:

98 Correlazione spuria Il coefficiente di correlazione lineare sintetizza con un valore unico il grado del legame lineare tra le variabili X e Y. Non sempre, però, ad un valore elevato di ρ corrisponde un effettivo legame tra i due caratteri considerati. Infatti, ad esempio, può esistere un legame tra X e Y solo perchè entrambe le variabili dipendono da una terza variabile Z.

99 Un esempio Il numero di bottiglie di birra bevute e il numero di condizionatori che vengono venduti in Italia presentano una alta correlazione lineare. Ma tutte e due le variabili dipendono da una terza variabile: la temperatura. Infatti, più la temperatura è alta, più birre vengono bevute e più condizionatori vengono venduti.

100 Un esempio

101

102 La regressione SIR FRANCIS GALTON ( ) Teoria del sangue blù Il talento ed il carattere sono ereditari In questo contesto nasce lanalisi della regressione lineare La statura dei figli può essere prevista sulla base di quella dei genitori? Se è così, laltezza è ereditaria …e lo è anche il talento e lonesta! Esiste il sangue blu!

103 La regressione Consideriamo ancora due caratteri quantitativi X e Y, ma ora presupponiamo lesistenza di una relazione di tipo funzionale tra essi, secondo cui è possibile stabilire quale sia la variabile indipendente e quale la dipendente. Ossia è possibile scrivere quanto segue: dove X è la variabile indipendente e Y la variabile dipendente.

104 La regressione Tale funzione matematica f(.) può assumere qualunque forma (quadratica, esponenziale, ecc.); noi ci limiteremo a trattare il caso della relazione lineare del tipo: dove β 0 rappresenta lintercetta, mentre β 1 è il coefficiente angolare, ossia ci dà la pendenza della retta.

105 La regressione

106 Un esempio Date le distribuzioni del prezzo del gas X e del suo consumo pro-capite Y di 20 famiglie: Prezzo (X) Consumo pro-capite (Y) I due caratteri possono essere rappresentati in uno scatter, che evidenzia una relazione decrescente, ossia allaumentare del prezzo il consumo diminuisce.

107 Un esempio La relazione può essere interpretata con una funzione di tipo lineare, come la retta riportata nel grafico.

108 La retta di regressione Per identificare univocamente la relazione matematica che spiega il fenomeno, sarà necessario stimare, attraverso il metodo dei minimi quadrati, cioè rendendo minime le distanze, al quadrato, tra i valori osservati e quelli teorici, il valore dei due parametri incogniti β 0 e β 1 In pratica è minimizzata la seguente funzione quadratica (somma dei quadrati degli scarti e i ):

109 La retta di regressione dove pertanto si ha: La minimizzazione della funzione g(.) richiede il calcolo delle derivate parziali rispetto ad 0 e 1, per poi porle uguali a zero. (1)

110 La retta di regressione Pertanto si ha:

111 La retta di regressione Equazioni normali Risolvendo rispetto ad 0 e 1 si ottengono le stime: che annullano le derivate parziali:

112 La retta di regressione Una volta stimati i coefficienti e sostituiti alla (1) è immediato disegnare la retta di regressione che è individuata dalla seguente equazione: Il termine prende il nome di coefficiente di regressione

113 Un esempio Riprendiamo i dati dellesempio precedente e calcoliamo la retta di regressione: Prezzo (X) Consumo pro-capite (Y)

114 Un esempio Prezzo (X) Consumo pro- capite (Y)

115 Un esempio Pertanto la retta di regressione è:

116 Un esempio Nella seguente tabella vengono riportati il numero delle pagine ed i prezzi (in euro) di dieci volumi di una stessa collana editoriale: n. pagine prezzo Utilizziamo la seguente tabella per svolgere i calcoli:

117 Un esempio ixixi yiyi x2ix2i y2iy2i xiyixiyi

118 Un esempio Pertanto la stima del coefficiente di regressione: mentre il valore dellintercetta è pari a:

119 Un esempio Pertanto la retta di regressione è: Graficamente si ha:

120 Ancora sulla retta di regressione Fino ad ora e stata considerata la seguente retta di regressione: cioè la retta di Y su X, ma può essere considerata anche la retta: cioè la retta di X su Y dove:

121 Ancora sulla retta di regressione Il segno di è uguale a quello di infatti il numeratore (covarianza) dei due coefficienti è identico e il denominatore sempre positivo.

122 Ancora sulla retta di regressione Le due rette di regressione si incontrano nel punto: Se le rette di regressione sono perpendicolari tra loro e parallele agli assi

123 Ancora sulla retta di regressione X Y

124 Il coefficiente di correlazione ρ e i coefficienti di regressione sono legati dalla seguente relazione: Infatti:

125 Ancora sulla retta di regressione Il coefficiente di correlazione ρ e i coefficienti di regressione sono legati anche dalla seguente relazione: Il coefficiente di regressione sono legati dalla seguente relazione:

126 Ancora sulla retta di regressione Le due rette di regressione coincidono soltanto quando vi è perfetta correlazione lineare cioè quando:

127 Il grado di accostamento Non necessariamente però il modello stimato, quello lineare, è il migliore al fine di interpretare la relazione tra i due caratteri. Per valutare la bontà di adattamento del modello ai dati osservati, facciamo ricorso allindice di determinazione R 2. Lindice R 2 si basa sulla scomposizione della devianza totale:

128 Il grado di accostamento

129 Si dimostra facilmente che: per la seconda delle equazioni normali. Pertanto si ha:

130 Il grado di accostamento Laccostamento sarà tanto migliore quanto minore sarà Dev(E). Allora lindice di determinazione R 2 è pari a: R 2 = Dev(R)/Dev(Y)=1-[Dev(E)/ Dev(Y)] R 2 indica quanta parte di Dev(Y) è spiegata dalla devianza di regressione. Ovviamente 0 R 2 1.

131 Il grado di accostamento In altre parole, R 2 indica quanta parte della devianza presente nei dati (Dev(Y)) è stata colta dal modello di regressione (Dev(R)).

132 Il grado di accostamento Esso varia tra 0 ed 1:

133 Il grado di accostamento

134 Un esempio Tornando allesempio precedente del gas e del consumo pro-capite, e calcoliamo il valore dellindice R 2. I calcoli sono riassunti nella seguente tabella: Prezzo (X) Consumo pro-capite (Y) ,4328,57816, ,337,6758, ,7038,301466, ,1816,82282, ,0813,92193, ,87-1,873, ,35-27,35748,02

135 Un esempio Prezzo (X) Consumo pro- capite (Y) ,93-35,931290, ,93-1,933, ,62-40,621649, ,52-9,5290, ,52-18,52342, ,31-14,31204, ,96-2,968, ,407,6057, ,29-1,291, ,98-0,980, ,4614,54211, ,1511,85140, ,9416,06257, ,11

136 Un esempio

137 Consideriamo le seguenti variabili X e Y: xixi yiyi 15 27, ,5 Applicando i minimi quadrati si trova: cioè:

138 Un esempio Il calcolo di R 2 è il seguente: xixi yiyi 154,6-5250,40,16 27,58,2-2,56,250,70, ,8240,20,04 415,515,45,530,250,10, ,500,70

139 Un esempio

140 Il grado di accostamento OSSERVAZIONE IMPORTANTE Si dimostra che R 2 =ρ 2.


Scaricare ppt "Le distribuzioni multiple Si definisce distribuzione statistica multipla la distribuzione ottenuta dalla rilevazione di più caratteri su unità appartenenti."

Presentazioni simili


Annunci Google