UN ESEMPIO DI ESPERIMENTO CASUALE Valori attesi di variabile casuale
Universo finito di N elementi Si consideri un universo formato da un numero N finito di elementi, e sia la frequenza di un certo carattere in tale universo. Si immagini un esperimento consistente nell'osservare n<N elementi dell'universo e nel contare quanti elementi presentino detto carattere. Si abbia, ad esempio, una confezione di N=8 capsule nella quale la frequenza di capsule difettose è =0.375, e di osservare un campione di n=3 capsule.
Campione finito di n=3 elementi Il campione osservato è solo uno dei possibili campioni di 3 elementi; ma quanti e quali sono gli eventi possibili dell'operazione di campionamento? In una situazione che implica piccoli numeri, è facile compilare l'elenco di tutti i possibili eventi. Per le regole del calcolo combinatorio, i possibili eventi sono tutte le k combinazioni N elementi in classe n : k = N!/[n!(N-n)!] = 8!/(3!5!) = 8765!/(325!) = 56 dove N! (detto N fattoriale) denota il prodotto dei primi N numeri naturali: N! = N (N-1) ... 1 , NB: se N=0, per definizione, N!=1.
un esempio di esperimento casuale Dette a1 a2 a3 le 3 capsule difettose, e ā1 ā 2 ā 3 ā 4 ā 5 le 5 capsule non difettose, universo ed eventi si possono così denotare: universo (I): {a1 a2 a3 ā1 ā 2 ā 3 ā 4 ā 5} un evento (e E): {a1 ā1 ā 5} I: a1 a2 a3 ā 1 ā 2 ā 3 ā 4 ā 5 ▼ e: L'insieme di tutti i possibili eventi prende nome di spazio «E» degli eventi o spazio campionario
ELENCO DI TUTTI I POSSIBILI EVENTI elementi Elementi e01 a1 a2 a3 e02 ā1 e07 e12 ā 1 e03 ā2 e08 e13 ā 2 e04 ā3 e09 e14 ā 3 e05 ā4 e10 e15 ā 4 e06 ā5 e11 ā 5 e16 e17 e27 e37 e18 e28 e38 ee19 e29 e39 e20 e30 e40 e21 e31 e41 elementi e22 a1 ā 2 ā 4 e32 a2 e42 a3 e23 ā 5 e33 e43 e24 ā 3 e34 e44 e25 e35 e45 e26 e36 e46 e47 ā 1 e48 e50 e49 e51 e52 e53 e54 e55 e56
COME ASSOCIARE LE PROBABILITÀ (1) Supponiamo di estrarre un campione di 3 capsule dalla confezione: l'operazione porterà sicuramente a uno dei 56 eventi possibili indicati in tabella: p {e E} = 1 (certezza) p {e E} = 0 (impossibilità) Rimane il problema di associare ad ogni evento una particolare probabilità; a tal fine, si assuma che la probabilità che ogni singolo elemento dell'universo ha di essere incluso nel campione non dipenda dalle caratteristiche dell'elemento. Ciò equivale ad affermare che i 56 campioni elencati in tabella hanno tutti la stessa probabilità di essere estratti, e si deduce che ad ogni campione è associata la probabilità p=1/56.
COME ASSOCIARE LE PROBABILITÀ (2) Perché le probabilità assegnate siano coerenti con la «legge empirica del caso» l'estrazione del campione va eseguita in modo conforme all'assunto. Possono non essere conformi i campioni formati dalle prime 3 capsule uscite al rovesciamento del contenitore: una capsula difettosa può avere probabilità minore di uscire per prima se è più leggera o di forma meno regolare, e diventa concettualmente impossibile assegnare le probabilità ai campioni.
CREAZIONE DI UNA VARIABILE CASUALE (1) Si consideri la variabile x=«numero di capsule difettose in un campione di 3 elementi». La probabilità p(xi), associata ad ogni valore xi che la variabile x può assumere, è la somma delle probabilità associate a tutti i campioni con xi capsule difettose, poiché gli eventi «estrazione di un particolare campione» sono incompatibili. La probabilità che x assuma valore 0, ad esempio, è la somma delle probabilità associate ai campioni che non includono capsule difettose (da e47 a e56). La funzione che assegna la probabilità p(xxi ) che x sia minore uguale ad xi si chiama «funzione di partizione o di distribuzione», e si denota come F(x).
CREAZIONE DI UNA VARIABILE CASUALE (2) Variabile x=«numero di capsule difettose in un campione di 3 elementi», e valori della probabilità [p(x)] e della funzione di partizione [F(x)] associati a ogni valore x che la variabile xi può assumere: valore n° di campioni probabilità p(x) Distribuzione xi tali che x=xi associata a x = xi F(xi) = p{x xi} x = 0 10 (da e47 a e56) 10/56=0.17857 x = 1 30 (da e17 a e46) 30/56=0.53571 40/56=0.71428 x = 2 15 (da e02 a e16) 15/56=0.26786 55/56=0.98214 x = 3 1 ( e01 ) 1/56=0.01786 56/56=1.00000
DEFINIZIONE DI VARIABILE CASUALE Quanto enunciato sinora è premessa sufficiente ad una definizione più generale di variabile casuale: Una variabile casuale è una variabile reale, per ogni intervallo di valori della quale è definita la probabilità di manifestarsi. La funzione F(x), che associa univocamente la probabilità a ciascuno degli intervalli (funzione di distribuzione o funzione di partizione), indica la probabilità che la variabile x assuma valori non superiori a una soglia (x*): F(x*) = p(x ≤x*) e deve soddisfare certi requisiti tra cui essere compresa tra 0 ed 1, ed essere mai decrescente: 0 ≤ F(x) ≤ 1 F(x1) ≤ F(x2) per x1 < x2 La probabilità che la variabile x assuma valori nell'intervallo (x1 , x2 ], è data dalla differenza tra i valori della funzione di partizione associati a x1 e x2 : p(x1 < x ≤x2 ) = F(x2) - F(x1)
VARIABILI CASUALI DISCRETE (1) Una variabile casuale è discreta se può assumere solo un numero finito o al più un'infinità numerabile di valori. Quale esempio di variabile casuale discreta infinita, si consideri un processo produttivo continuo in cui la proporzione di confezioni che, una dopo l'altra, cadono col marchio rivolto in basso (B) su un nastro trasportatore equivale a quella delle confezioni che cadono col marchio rivolto in alto (A): p(A) = p(B) = 0.5 Si definisca la variabile casuale x = «lunghezza della sequenza di confezioni che si osservano sino alla comparsa di una confezione con il marchio rivolto in basso» , Tale variabile è discreta poiché può assumere solo i valori 1, 2, ... n, ed infinita poiché non è possibile definire un valore massimo per x.
VARIABILI CASUALI DISCRETE (2) Le probabilità associate ai valori di x riportate nella seguente tabella si calcolano assai facilmente, poiché la probabilità dell'evento Bn=«comparsa di una confezione B dopo una sequenza di (n-1) confezioni A» equivale alla probabilità dell'evento B per il prodotto di (n-1) fattori pari alla probabilità dell'evento A, poiché A e B sono eventi indipendenti. x sequenza* p(xi) F(x)=p{x xi} 1 B1 0.51 = 0.500 1 - 0.5 = 0.500 2 A1 B2 0.52 = 0.250 1 - 0.52 = 0.750 3 A1 A2 B3 0.53 = 0.125 1 - 0.53 = 0.875 . n ... An-1 Bn 0.5x 1 - 0.5x *)A = marchio rivolto in alto; B = marchio rivolto in basso. Anche nel caso di variabili discrete ma infinite si può assegnare la probabilità ad ogni singolo evento. Si noti che la funzione F(x) è una funzione di partizione:
VARIABILI CASUALI DISCRETE (3) Rappresentazione grafica della distribuzione della variabile casuale x = «lunghezza della sequenza di confezioni che si osservano sino alla comparsa di una confezione con il marchio rivolto in basso». La variabile qui descritta prende il nome di variabile casuale geometrica.
DISTRIBUZIONE BINOMIALE (1) Si abbia un processo per la produzione di compresse tale che la probabilità di una compressa di essere difettosa sia = 0.01. Si vuole calcolare la probabilità di trovare 0, 1, 2, 3, 4 compresse difettose in un blister di 4 compresse, sotto l'assunto che la probabilità di una compressa di finire in un dato blister non dipenda dalle caratteristiche della compressa stessa. Si noti che il blister può essere considerato un campione tratto da un universo virtualmente infinito (la produzione di compresse).
DISTRIBUZIONE BINOMIALE (2) Per enumerazione dei casi possibili, si osserva che 4 compresse difettose (f) e no (s) si combinano, con probabilità ed (1- ) in 24 = 16 diversi modi. In analogia con ciò che si è già visto, la probabilità di osservare un blister con x compresse difettose è la somma delle probabilità associate ad ognuno dei diversi modi con cui il blister può includere x compresse difettose. Ad esempio, vi sono 4 modi con cui un blister può avere una sola compressa difettosa: essa può essere la prima, la seconda, la terza o la quarta.
compresse x 1 2 3 4 probabilità (1-π)(1-π)(1-π)(1-π) (1-π)4 = .994 .96059601 d s π (1-π)(1-π)(1-π) π(1-π)3 .011.993 .00970299 (1-π) π (1-π)(1-π) (1-π)(1-π) π (1-π) (1-π)(1-π)(1-π) π 4(1-π)3 4.011.993 .03881196 π π (1-π)(1-π) π2(1-π)2 .012.992 .00009801 π (1-π) (1-π) π π (1-π)(1-π) π (1-π) π π (1-π) (1-π) π (1-π) π D (1-π)(1-π) π π 6 π2(1-π)2 6.012.992 .00058806 π π π (1-π) π3(1-π) .013.991 .00000099 π π (1-π) π π (1-π) π π (1-π) π π π 4 π3(1-π) 4.013.991 .00000396 π π π π π4 .014 .00000001
DISTRIBUZIONE BINOMIALE (3) Detto n il numero delle occasioni (ad es., il numero di compresse nel blister) ed x il numero di eventi (ad es., il numero di compresse difettose nel blister) ognuno dei quali ha la stessa probabilità di verificarsi, si ha che: dove il termine nCx è detto coefficiente binomiale, e denota il numero di sequenze di lunghezza n che si possono formare con x elementi aventi il carattere d ed (n-x) elementi aventi il carattere s .
DISTRIBUZIONE BINOMIALE (4) Nell'esempio la probabilità d'osservare un blister con 2 compresse difettose può essere calcolata direttamente: La variabile le cui probabilità siano assegnate secondo tale legge è chiamata variabile casuale binomiale e si denota come x ~Bi(,n). Se è nota la funzione di probabilità, possiamo assegnare le probabilità agli eventi senza dover enumerare i casi possibili.
VALORE ATTESO DI UNA VARIABILE CASUALE: MEDIA E VARIANZA La media di una variabile casuale x, che è detta anche valore atteso di x e si denota come E(x), è un parametro tipico che indica la posizione dei valori di x. media: Nel caso di variabili discrete, può essere calcolata come media: La varianza σ2, o V(x), di una variabile casuale x è anch'essa parametro tipico di x ed indica la dispersione dei valori di x. Per definizione, essa è il valore atteso del quadrato degli scarti dalla media : Nel caso di variabili discrete, può essere calcolata come varianza:
Per la variabile casuale discreta finita x = «numero di capsule difettose in un campione di 3 elementi, estratto da una confezione dove vi sono 3 capsule difettose»: Per la variabile casuale discreta infinita x = «lunghezza della sequenza di confezioni che si osservano sino alla comparsa di una confezione con il marchio in basso (B) anziché in alto (A), per p(A)=p(B)=0.5»
COVARIANZA E CORRELAZIONE considerino due variabili casuali x e y tali che E(x)= μx; E(y)= μy ; V(x)= ; cioè x (x , ) cioè y ( y , ) V(y)= ; La covarianza xy di x e y è il valore atteso del prodotto (x- μx)(y- μy) e si denota come Cov(xy). Essa è un parametro tipico che indica l'associazione tra i valori di x e i valori di y. covarianza: Nel caso di variabili discrete, può essere calcolata come Il coefficiente di correlazione lineare xy è definito come rapporto tra la covarianza di x e y e la media geometrica delle varianze di x e y coefficiente di correlazione:
OPERATORI MEDIA E VARIANZA (1) Per gli operatori media [ E( ) ] e varianza [ V( ) ] valgono le seguenti regole: Il valore atteso di una costante k è la costante stessa: I II Data una variabile casuale x avente E(x)= μx e V(x)=σ2,per aggiunta di una costante k ad x si ottiene una nuova variabile casuale y, che ha media: III e varianza uguale a quella di x: IV
OPERATORI MEDIA E VARIANZA (1) Data una variabile casuale x avente E(x)= e V(x)=2 , il prodotto di x per una costante k dà una variabile casuale y, che ha media e varianza V VI Data la variabile casuale z = x ± y somma (o differenza) delle variabili casuali x (x , ) ed y ( y , ), si ha: VII VIII
VARIABILI INDIPENDENTI Definizione: Due variabili casuali x e y si dicono indipendenti, se indipendenti sono gli eventi «comparsa di un valore x=x0» e «comparsa di un valore y=y0». Se le variabili casuali x e y sono indipendenti si ha che il valore atteso del loro prodotto è uguale al prodotto dei loro valori attesi e che, quindi, la loro covarianza è nulla: Pertanto, la varianza della variabile z = x ± y somma (o differenza) delle variabili casuali indipendenti x~ (x , ) e y ( y , ) è uguale alla somma delle loro varianze: IX
OPERATORI MEDIA E VARIANZA (ESEMPIO) Si consideri la variabile casuale z = «difettosità della prima compressa in un blister di n compresse» Essa assume il valore 1 con probabilità , se la prima compressa è difettosa, e 0 con probabilità (1-), se la prima compressa è non-difettosa. Tale variabile è detta bernoulliana e ha media e varianza Si consideri ora che la variabile casuale binomiale x = «numero di compresse difettose in un blister di n compresse» può essere espressa come somma di n variabili casuali bernoulliane indipendenti: Per applicazione delle regole VII e IX, se ne deduce che:
MEDIA E VARIANZA DI VARIABILI CONTINUE Benché gli esempi di variabili casuali sinora illustrati siano stati riferiti a variabili discrete, il concetto di valore atteso vale anche per le variabili continue. Occorre tuttavia fornirne una definizione più generale, perché l'operatore sommatoria non si applica al caso di infinità non numerabile: Valore atteso di una variabile casuale continua x è l'integrale definito tra - e + del prodotto della variabile x per la funzione di densità di probabilità f(x) ad essa associata. distribuzione: media: varianza: NB: nel caso di variabili casuali discrete, l'operatore integrale corrisponde a quello di sommatoria, e f(x)dx=p(x), se x è un valore della variabile discreta, f(x)dx=0 in caso contrario.