Elementi di Teoria della Probabilità Terminologia Operazioni su insiemi di eventi unione intersezione Proprietà della probabilità ( 1 , 2 , 3 , 4 ) I° esperimento II° esperimento Eventi condizionati Proprietà Moltiplicativa della probabilità Teorema di Bayes
Terminologia esperimento un’attività che produce risultati diversi nelle successive prove in cui viene ripetuta (lanciare una moneta, estrarre un soggetto a caso da un elenco) spazio dei risultati (o degli eventi) tutti i possibili risultati dell’esperimento (testa o croce, somma di due dadi, maschio o femmina, età della persona) evento semplice Ei ogni elemento dello spazio dei risultati. Gli eventi semplici di un esperimento sono mutuamente esclusivi ( o incompatibili e collettivamente esaustivi evento composto un insieme di eventi semplici. Gli eventi composti non sono necessariamente mutuamente esclusivi .
Operazioni su Insiemi di Eventi unione di 2 eventi = l’uno o l’altro o tutti e due E1E2 probabilità(unione) = P(E1 o E2) = P(E1 E2) intersezione di 2 eventi = l’uno e l’altro E1E2 probabilità(intersezione) = P(E1 e E2) = P(E1E2) .OR. .AND.
proprietà delle probabilità: 0 P(Ei) 1 La probabilità di un evento Ei è sempre un numero compreso tra 0 e 1 2. i P(Ei) = 1 La somma delle probabilità di tutti gli eventi Ei spazio degli eventi è = 1 3. Regola della Somma della Probabilità: P(E1 E2) = P(E1) + P(E2) - P(E1 E2)
S Definizioni A B A B _ A A B S=spazio campionario (totalità degli eventi) _ A S=spazio campionario (totalità degli eventi) S A B A A B B
I° esperimento: lancio di due dadi risultato = somma del valore della faccia superiore dei due dadi X= 6+5 (nell’esempio)
x X= somma della faccia superiore dei due dadi {2, 3 , …, 12} combinazioni possibili 2 1,1 3 1,2 2,1 4 2,2 3,1 1,3 5 2,3 3,2 4,1 1,4 6 3,3 4,2 2,4 5,1 1,5 7 3,4 4,3 5,2 2,5 6,1 1,6 8 4,4 5,3 3,5 6,2 2,6 9 6,3 3,6 5,4 4,5 10 5,5 6,4 4,6 11 5,6 6,5 12 6,6 p(x) 1/36 2/36 3/36 4/36 5/36 6/36 x= somma dei 2 dadi
Regola della somma E1= [x pari] E2 = [x7]) P(E1 E2) = P(E1) + P(E2) - P(E1 E2) E1= [x pari] E2 = [x7]) P([x pari][x7]) = P(x pari) + P(x7) - P(x{8,10,12}) = 18/36 + 21/36 - 9/36 = 30/36
combinazioni possibili P([x pari][x7]) = P(x pari) + P(x7) - P(x{8,10,12}) = 18/36 + 21/36 - 9/36 = 30/36 x combinazioni possibili p(x) 2 1,1 1/36 3 1,2 2,1 2/36 4 2,2 3,1 1,3 3/36 5 2,3 3,2 4,1 1,4 4/36 6 3,3 4,2 2,4 5,1 1,5 5/36 7 3,4 4,3 5,2 2,5 6,1 1,6 6/36 8 4,4 5,3 3,5 6,2 2,6 9 6,3 3,6 5,4 4,5 10 5,5 6,4 4,6 11 5,6 6,5 12 6,6 x= somma dei 2 dadi
Se E1 ed E2 sono Mutuamente Esclusivi allora … 3. Proprietà Additiva della probabilità: Se E1 ed E2 sono Mutuamente Esclusivi allora … P(E1 E2) = P(E1) + P(E2) Esempio. P(somma= 2 3) = 1 + 2 = 3 . 36 36 36
II° esperimento= estrarre una coppia {genitore ; figlio} Estrarre una coppia dalla distribuzione congiunta delle variabili … {titolo di studio del genitore; titolo di studio del figlio }.
evento= una coppia di valori: uno per ciascuna variabile titolo di studio del genitore elementare media diploma totale titolo di studio del figlio 4 1 5 6 24 35 30 25 60 15 55 100 Probabilità condizionata Probabilità di eventi marginali : P(Gd) = P(titolo di studio del genitore = diploma) = 0,30 P(Fd) = P(titolo di studio del figlio = diploma) = 0,60 Probabilità dell’unione di eventi: P(GdFd)=P[(genitore=diploma) o (figlio=diploma)] = 0,30+0,60-0,25 = 0,65 P(GeFe)=P[(genitore=element.) o (figlio=element.)]= 0,05+0,15-0,04= 0,16 P(GdFe)=P[(genitore=diploma) o (figlio=element.)] = 0,30+0,05-0,00= 0,35
Probabilità Condizionata Evento E2 Evento E1 SI NO E1E2 E2 E1 1,0 Condizionare per “un evento” significa considerare quell’evento come il nuovo spazio degli eventi. Per pesto motivo si divide per la sua probabilità. E’ come dividere per il totale di riga o il totale di colonna quando nella tabella ci sono frequenze invece di probabilità. Cararrere docile (E1) Capelli rossi (E2) Si No 4 21 25 36 39 40 100
Probabilità Condizionata P(Fd | Ge)= P[(figlio=diploma) tra quelli con (genitore=elementari)] = 0,05/0,15 = 0,33 P(Fd | Gm)= P[(figlio=diploma) tra quelli con (genitore=medie)] = 0,30/0,55 = 0,54 P(Fd | Gd)= P[(figlio=diploma) tra quelli con (genitore=diploma)] = 0,25/0,30 = 0,83 Vai alla tabella EVENTI INDIPENDENTI Due eventi sono indipendenti quando la probabilità del primo condizionata al secondo è uguale alla probabilità del primo non condizionata (e viceversa) Se P(E1 |E2) = P(E1) ed P(E2|E1) = P(E2) allora E1 ed E2 sono indipendenti
Eventi Indipendenti? Esempio dei due dadi P(somma=10 | due dadi sono uguali) P(somma=10) 1/6 3/36 Falso P(somma=pari | due dadi sono diversi) P(somma = pari) 12/30 18/36 P(dadi uguali | primo dado pari) = P(dadi uguali) 3/18 = 6/36 Vero P(primo dado pari | dadi uguali) = P(primo dado pari) 3/6 = 18/36 Vero Esempio dei titoli di studio di genitori e figli P(figlio con diploma | genitore con diploma) P(figlio con diploma) 0,83 0,60 Falso P(figlio con medie | genitore con diploma) P(figlio con medie) 0,16 0,35
4. Proprietà Moltiplicativa della probabilità Dalla definizione di probabilità condizionata si deriva la proprietà P(E1E2)=P(E1|E2)xP(E2) Intuizione: Fingiamo per un attimo che E2 si verifichi con certezza, e calcoliamo P(E1|E2). Adesso, rilasciamo questo assunto; E2 ridiventa un evento incerto, quindi moltiplichiamo per la probabilità di P(E2). Il prodotto è la probabilità che E1 ed E2 si verifichino, cioè la probabilità dell’intersezione dei due eventi. Se E1 ed E2 sono indipendenti P(E1|E2)=P(E1) quindi P(E1E2) = P(E1) x P(E2)
Regola del prodotto P(E1E2) = P(E1) x P(E2) Questo è un caso particolare della proprietà moltiplicativa: La probabilità che due eventi indipendenti si verifichino entrambi è uguale al prodotto delle loro probabilità (esempio: probabilità di fare testa due volte di seguito = = probabilità testa 1° lancio x probabilità testa 2° lancio = 0,5 x 0,5 = 0,25) Note: 1) due eventi mutuamente esclusivi non sono mai indipendenti 2) due eventi indipendenti, non sono mai mutuamente esclusivi
Evento complementare: Unione di eventi: PROBABILITÀ: PROSPETTO RIASSUNTIVO Dato l'insieme I : {A1 , A2 , ... An I} Evento certo: p(A1 A2 ... An ) = p(I) = 1 Evento impossibile: p(B | [B I]) = 0 Evento complementare: Unione di eventi: p(AiAj)=p(Ai) + p(Aj) - p(AiAj) Evento condizionato: p(Ai | Aj ) = p(Ai Aj ) /p(Aj ) Intersezione di eventi: p(Ai Aj ) = p(Aj ) p(Ai | Aj ) Eventi incompatibili: p(Ai Aj ) = 0 regola della somma : p(Ai Aj ) = p(Ai ) + p(Aj ) Eventi indipendenti: p(Ai | Aj ) = p(Ai ) regola del prodotto : p(Ai Aj ) = p(Ai ) p(Aj )
Un qualunque esito per uno dei due dadi può manifestarsi in concomitanza con un qualunque esito per l'altro dado. Se entrambi i dadi sono ben bilanciati, tutte le facce hanno la medesima probabilità di comparire. L'esito del lancio di uno qualunque dei due dadi è ininfluente sull'esito del lancio dell'altro dado. dado B 1 2 3 4 5 6 A 7 8 9 10 11 12 punti
Punteggi ottenibili con due dadi da gioco a 6 facce Note: Punteggi ottenibili con due dadi da gioco a 6 facce dado B 1 2 3 4 5 6 A 7 8 9 10 11 12 punti
= + + + = PROBABILITÀ DI UN EVENTO Evento: E = punteggio minore di 6 p(E) = p(2) + p(3) + p(4) + p(5) = = + + + = dado B 1 2 3 4 5 6 A 7 8 9 10 11 12 punti
UNIONE DI EVENTI(1) Evento:E (punteggio< 6) (punteggio 8) p(E)= p(<6)+p(8) = + = p(E)= 1 - [ p(6)+p(7)] = 1 - = dado B 1 2 3 4 5 6 A 7 8 9 10 11 12 punti = +
UNIONE DI EVENTI (2) Evento:E(punteggio PARI)(punteggio<6) p(E) = p(PARI) + p(<6) - p([PARI][<6] = = + - = dado B 1 2 3 4 5 6 A 7 8 9 10 11 12 punti
INTERSEZIONE DI EVENTI (1) Evento:E (punteggio PARI)(punteggio<6) p(E) = p(PARI) p(<6|PARI) = = = dado B 1 2 3 4 5 6 A 7 8 9 10 11 12 punti
nb: (A=1) e (punteggio=7) sono eventi indipendenti P(7) = p(7|A=1) = INTERSEZIONE DI EVENTI (2) Evento:E= (A=1)(punteggio=7) p(E)= p(A=1) p(7|A=1) = = = dado B 1 2 3 4 5 6 dado A 7 8 9 10 11 12 punti nb: (A=1) e (punteggio=7) sono eventi indipendenti P(7) = p(7|A=1) =
p[A1A2A3]=p[A1]+p[A2]+p[A3]-p[A1A2]-p[A1A3]-p[A2A3]-p[A1A2A3] Esercizio Una ditta acquista fiale da tre diversi fornitori: il 65% dal fornitore B1, con difettosità del 5% il 25% dal fornitore B2, con difettosità del 10% il 10% dal fornitore B3, con difettosità del 25% Qual è la probabilità di ricevere una fiala difettosa? Soluzione P[B1]+P[B2]+P[B3]=1 B1 B2 Bn p[A/B1] p[A/B2] p[A/Bn] A A1 A2 A3 S S=B1B2B3 p[A1A2A3]=p[A1]+p[A2]+p[A3]-p[A1A2]-p[A1A3]-p[A2A3]-p[A1A2A3] di conseguenza, usando la stessa formula, p[B1/A]=0,394 p[B3/A]=0,303
Esempio : calcolo dei “valori attesi” In uno studio sui fattori di rischio per le patologie cardiache, è stata esaminata la relazione tra ipertensione (ia) e patologie coronariche (CHD) in soggetti di due diverse fasce di età 35 ‑ 49 anni > 65 anni CHD Si No Totale IA 552 212 746 1102 87 1189 941 495 1436 1018 106 1124 1493 707 2200 2120 193 2313 In ciascuna fascia di età, le probabilità di essere affetti da patologie corona-riche sono maggiori o minor nei soggetti ipertesi ? E appropriato combinare le informazioni di queste due tabelle ? Perche si ? _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ Perche no? _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
Esempio : calcolo dei “valori attesi” In uno studio sui fattori di rischio per le patologie cardiache è stata esaminata la relazione tra: patologie coronariche ~ ipertensione arteriosa ed età 35 ‑ 49 anni > 65 anni CHD IA Si No Totale 552 212 746 1102 87 1189 941 495 1436 1018 106 1124 1493 707 2200 2120 193 2313 Sembra che patologie coronariche dipendano dall ‘età … ma … (N)*P(E1E2) = (N)*P(E1) x P(E2) N*p( iachd | 35‑49 anni)= (2200) ( 746/2200) (1493/2200) = 506.26 N*p( iachd | > 65 anni)= (2313) (1189/2313) (2120/2313) =1089.79 che relazione esiste tra ipertensione ed età ?
Esempio : calcolo dei “valori attesi” Prima di rispondere osserviamo anche come siano distribuiti fattori di rischio nelle due fasce di età: 35 ‑ 49 anni > 65 anni CHD Si No Totale IA 36.97 29.99 33.91 51.98 45.08 51.41 63.03 70.01 65.27 48.02 54.92 48.59 100.00 p(ia)=33.91 p(ia)=51.41
ed osserviamo anche come è distribuita la patologia nelle due fasce di età 35 ‑ 49 anni > 65 anni CHD IA Si No Totale 72.25 27.75 100.0 92.68 7.32 65.53 34.47 90.57 9.43 67.86 32.14 91.66 8.34 P(chd)=67.86 P(chd)=91.66
Nelle due fasce di età la relazione (ia~chd) è in accordo con la regola dell’indipendenza Tabella % 35 ‑ 49 anni > 65 anni CHD ia Si No Totale 25.09 9.64 33.91 47.64 3.76 51.41 42.77 22.50 65.27 44.01 4.58 48.59 67.86 32.14 100.00 91.66 8.34 Osservati ~ Attesi 0,2509~0.3391*0.6786=0.2391 Osservati ~ Attesi 0.4764~0.5141*0.9166=0.4712
I fattori di rischio possono combinarsi in modo moltiplicativo oppure in modo additivo Quali effetti potremmo osservare ?
Avendo tre fattori a,b,c per c=0 | col row | 0 1 | Total -----+--------------+------- 0 | 50 135 | 185 1 | 369 505 | 874 Total| 419 640 | 1,059 c=0 a b=0 b=1 tot a=0 p(a=0|b=0)×p(b=0) p(a=0|b=1)*p(b=1) p(a=0) a=1 p(a=1|b=0)*p(b=0) p(a=1|b=1)*p(b=1) p(a=1) p(b=0) p(b=1) 1.0 505 osservati 528.2 attesi | col row | 0 1 | Total -----+-----------------+------- 0 | 27.03 72.97 | 100.00 1 | 42.22 57.78 | 100.00 Total| 39.57 60.43 | 100.00 | col row | 0 1 | Total -----+-----------------+------- 0 | 11.93 21.09 | 17.47 1 | 88.07 78.91 | 82.53 Total| 100.00 100.00 | 100.00 Percentuali per riga Percentuali per colonna E lo stesso schema si ripete per c=1
Valori attesi per un’ipotesi ETA35 Ignorando l’età CHD IP 552 212 746 1654 299 1935 941 495 1436 1959 601 2560 1493 707 2200 3613 900 4513 CHI2 ATTESI OR RR 10.58 506.26 1.37 1.23 46.71 1.70 1.38 ETA65 Valori attesi per un’ipotesi di indipendenza 1102 87 1189 1549.11 385.89 1018 106 1124 2063.89 496.11 2120 193 2313 3.37 1089.79 1.32 1.15 0.96 0.993 RR= rischio relativo OR= odds ratio
Se avessi un effetto additivo 605=235+370 | col row | 1 2 | Total ------+----------------------+---------- 1 | 50 235 | 285 | 17.54 82.46 | 100.00 | 11.90 27.98 | 22.62 -----+----------------------+---------- 2 | 370 605 | 975 | 37.95 62.05 | 100.00 | 88.10 72.02 | 77.38 Total | 420 840 | 1,260 | 33.33 66.67 | 100.00 | 100.00 100.00 | 100.00