Sistemi di Supporto alle Decisioni I Lezione 6 Chiara Mocenni Corso di laurea L1 in Ingegneria Gestionale e L2 in Ingegneria Informatica III ciclo Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Probabilità condizionate Le probabilità in gioco non sempre sono indipendenti da specifici eventi Quando ciò non è più vero, si hanno probabilità condizionate P(A|B) probabilità che si verifichi A supponendo che si verifichi B Prima occorre richiamare – anche qui, rinunciando a molti aspetti teorici – alcuni concetti basilari della teoria della probabilità. Nella definizione riportata, è importante ricordare che gli eventi A e B non sono necessariamente in successione temporale. Ad esempio, l’evento A può essere il fatto che una persona abbia una certa malattia supponendo che (evento B) un esame abbia dato esito positivo. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Esempio: ecografia Si considerino i seguenti eventi relativi alla nascita di un bambino: M il nascituro è maschio F il nascituro è femmina EM l’ecografia prevede “maschio” EF l’ecografia prevede “femmina” Per chiarire meglio il concetto, consideriamo l’esempio dell’ecografia. I futuri genitori sanno che la probabilità che il nascituro sia maschio è del 50% (per fissare le idee, assumiamo sia così: in realtà gli studi demografici dimostrano che nascono circa 105 maschi per ogni 100 femmine…). Tramite l’esame ecografico, acquisiscono un’informazione ulteriore, che chiaramente li porterà a rivedere tale probabilità. D’altra parte, l’ecografia non è infallibile, ed esiste dunque una percentuale di casi in cui sbaglia. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Esempio: ecografia Si consideri dapprima la probabilità che due eventi si verifichino entrambi (probabilità congiunta): P(M,EM) Si noti la differenza tra P(M,EM) (probabilità che l’ecografia dica “maschio” e che il nascituro sia maschio) e P(M|EM) (probabilità che il nascituro sia maschio quando l’ecografia dice “maschio”). Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Esempio: ecografia Valgono le seguenti espressioni: P(M,EM) = P(M|EM) P(EM) P(M,EM) = P(EM|M) P(M) Con che probabilità si verificano entrambi gli eventi M e EM? Una possibile risposta è: con la probabilità con cui l’ecografia dice “maschio”, moltiplicata per quella con cui il nascituro è poi effettivamente maschio, condizionata all’evento EM. Ma altrettanto valida è la risposta: con la probabilità con cui il nascituro è maschio, moltiplicata per quella con cui l’ecografia dice “maschio” allorché il nascituro è proprio maschio. Vale la pena soffermarsi su una quantità-chiave, P(EM|M). Questa rappresenta appunto la probabilità con cui l’ecografia non sbaglia nel caso in cui il nascituro sia maschio. Si noti che questa probabilità, insieme all’altra, P(EF|F), caratterizza l’attendibilità dell’informazione dello strumento ecografico. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Teorema di Bayes Quindi: P(M|EM) P(EM) = P(EM|M) P(M) ossia La formula in basso esprime il notissimo e fondamentale Teorema di Bayes. Tutto quanto diremo è una conseguenza di questo teorema, e per questo motivo il tipo di analisi che conduciamo prende anche il nome di analisi bayesiana. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Esempio: ecografia Supponiamo P(M) = 0.5 P(F) = 0.5 P(EM|M) = 0.9 P(EM|F) = 0.05 e di conseguenza P(EF|M) = 0.1 P(EF|F) = 0.95 Si noti che non c’è motivo per cui P(EM|M) e P(EM|F) debbano essere complementari. Questo indica che l’attendibilità della risposta dell’ecografia è diversa a seconda che la risposta sia “maschio” o “femmina”. Si noti invece che, ovviamente, P(EF|M)=1-P(EM|M), in quanto a parità di evento condizionante (M), i casi possibili sono solo due: EM e EF, e dunque la somma delle loro probabilità deve dare 1. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Esempio: ecografia Possiamo ora calcolare P(EM) = P(EM|M) P(M) + P(EM|F) P(F) = 0.9 0.5 + 0.05 0.5 = 0.475 P(EF) = 1- P(EM) = 0.525 Possiamo ora applicare la formula di Bayes Qui stiamo invece applicando il teorema della probabilità totale: la probabilità di un evento si ottiene considerando tutti i possibili eventi condizionanti, e facendo la somma delle probabilità condizionate, pesate con le probabilità dei vari eventi condizionanti. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Esempio: ecografia P(EM|M) P(M) P(M|EM) = P(EM) 0.9 0.5 = 0.947 = Questa è l’informazione che cercavamo: i futuri genitori sanno che, se l’ecografia dice “maschio”, con probabilità del 94.7% loro figlio sarà maschio. 0.475 Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Esempio: ecografia P(F|EF) = P(EF|F) P(F) P(EF) 0.95 0.5 = 0.904 = Invece, nel caso la risposta sia “femmina”, il margine di incertezza è leggermente superiore. 0.525 Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Teorema di Bayes In generale, dati due eventi A e B: P(B|A) P(A) P(A|B) = P(B|A) P(A) P(B) Questa è l’espressione generale del Teorema di Bayes relativo a due eventi. Le probabilità A e B prendono il nome di probabilità a priori, in quanto sono anteriori all’acquisizione dell’informazione. P(A|B) è invece la probabilità a posteriori, quella che vogliamo stimare. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Teorema di Bayes Probabilità a-priori Probabilità condizionate P(A|B) = P(B|A) P(A) P(B) Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Teorema di Bayes È uno strumento per integrare in modo quantitativo le informazioni disponibili (prob. a-priori) con quelle rilevabili o misurabili (prob. condizionate) Le probabilità a priori discendono da informazioni di cui siamo già in possesso. Il problema che il Teorema di Bayes consente di affrontare è quello di integrare nel modo corretto le informazioni già disponibili con nuove informazioni, di cui siamo in grado di caratterizzare l’attendibilità. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Esempio: il concerto Supponiamo ora che sia disponibile ulteriore informazione sul tempo di domani Questa informazione non è perfetta Come determinare il valore di questa informazione? Riprendiamo l’esempio del concerto per illustrare meglio questi ultimi concetti. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Attendibilità dell’informazione Caratterizziamo l’attendibilità della nuova informazione in termini di probabilità condizionata: P(“Sereno”|Sereno) = 0.8 P(“Pioggia”|Pioggia) = 0.8 Questa nuova informazione (proveniente da un barometro, o da un altro bollettino…) può essere caratterizzata attraverso una misura della sua attendibilità. Si noti che le due probabilità indicate possono essere in qualche modo ricavate da dati oggettivi, andando ad esempio a vedere quante volte, in presenza di tempo sereno, la fonte di informazione aveva effettivamente previsto “tempo sereno”, e lo stesso con tempo piovoso. Si noti ancora che non c’è motivo per cui le due probabilità indicate debbano essere uguali. In questo caso supponiamo lo siano, ossia supponiamo che la fonte di informazione dica il vero con la stessa frequenza sia quando il tempo è sereno, sia quando piove. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Attendibilità dell’informazione L’informazione a-priori in questo caso è data da: P(Ser) = 0.4 P(Piog) = 0.6 Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Attendibilità dell’informazione La probabilità che la nuova informazione indichi “sereno”sarà: P(“Ser”) = P(“Ser”|Ser) P(Ser) + P(“Ser”|Piog) P(Piog) = 0.8 0.4 + 0.2 0.6 = 0.44 P(“Piog”) = 1- 0.44 = 0.56 Si è applicato qui il teorema della probabilità totale. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Attendibilità dell’informazione Con Bayes possiamo calcolare = 0.8 0.4 / 0.44 = 0.727 P(Piog|”Ser”) = 1- P(Ser|”Ser”) = 0.273 P(“Ser”|Ser) P(Ser) P(Ser|”Ser”) = P(”Ser”) A questo punto otteniamo le probabilità che cercavamo. Dunque se l’oracolo (stavolta non infallibile) dice “sereno”, il tempo sarà effettivamente sereno con probabilità 72%. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Attendibilità dell’informazione E analogamente = 0.8 0.6 / 0.56 = 0.857 P(Ser|”Piog”) = 1- P(Piog|”Piog”) = 0.143 P(“Piog”|Piog) P(Piog) P(Piog|”Piog”) = P(”Piog”) L’oracolo è leggermente più attendibile quando dice che pioverà. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Valore dell’informazione imperfetta Per molti decisori il valore dell’informazione si determina ancora come differenza tra equivalente certo della decisione con informazione gratuita e equivalente certo della decisione in assenza di informazione Attenzione: ora le probabilità in gioco sono probabilità condizionate A questo punto, e con gli stessi distinguo visti nel caso dell’informazione perfetta (proprietà delta), possiamo ancora calcolare il valore dell’informazione nello stesso modo di prima, solo che occorre tenere conto del fatto che le probabilità dei vari eventi in gioco sono probabilità condizionate. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Informazione gratuita (Avi) sereno (0.727) aperto 1 pioggia (0.273) 0.727 sereno (0.727) L’oracolo prevede “sereno” (0.44) chiuso 0.57 pioggia (0.273) 0.597 0.67 sereno (0.727) 0.778 0.778 0.95 portico pioggia (0.273) 0.32 0.709 sereno (0.143) 0.655 1 aperto pioggia (0.857) 0.143 sereno (0.143) La struttura dell’albero di decisione è evidentemente la stessa di prima; quello che cambia sono le probabilità dei vari eventi. Si noti che nel nodo radice c’è il responso dell’oracolo, e dunque le probabilità da usare nelle lotterie successive sono le probabilità a posteriori associate ai diversi responsi dell’oracolo. Usando la funzione di utilità di Avi, vediamo che l’imperfezione dell’informazione ha una prima conseguenza. Mentre nel caso in cui l’oracolo preveda pioggia, Avi si convince ancora di più a tenere il concerto al chiuso (com’è ovvio), nel caso in cui preveda tempo sereno Avi non decide di dare il concerto all’aperto, bensì opera la più prudente scelta del portico. 0.57 L’oracolo prevede “pioggia” (0.56) chiuso pioggia (0.857) 0.655 0.67 sereno (0.143) 0.178 0.95 portico pioggia (0.857) 0.32 € 5,470 Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Il valore dell’informazione (Avi) Quindi il valore dell’informazione imperfetta per Avi è: equivalente certo della decisione con informazione gratuita: € 5,470 - equivalente certo della decisione in assenza di informazione: € 4,600 = € 870 Si noti che l’equivalente certo della decisione in assenza di informazione è sempre lo stesso di prima, quello che cambia è l’equivalente certo con informazione gratuita, che ha ovviamente un valore inferiore al precedente (in cui l’informazione era perfetta). Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Informazione e decisioni Il valore dell’informazione perfetta per Avi era di € 2,000 L’imperfezione nell’informazione determina un cambiamento di decisione (Portico anziché Aperto nel caso in cui l’oracolo preveda tempo sereno) Si noti che, come c’era da aspettarsi, il fatto che l’informazione sia imperfetta determina anche una diminuzione del suo valore. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Informazione gratuita (Inat) sereno (0.727) aperto 1 pioggia (0.273) 0.727 sereno (0.727) L’oracolo prevede “sereno” (0.44) chiuso 0.4 pioggia (0.273) 0.427 0.5 sereno (0.727) 0.709 0.727 0.9 portico pioggia (0.273) 0.2 0.59 sereno (0.143) 0.485 1 aperto pioggia (0.857) 0.143 sereno (0.143) Effettuiamo ora lo stesso calcolo per Inat, indifferente al rischio. 0.4 L’oracolo prevede “pioggia” (0.56) chiuso pioggia (0.857) 0.485 0.5 sereno (0.143) 0.3 0.9 portico pioggia (0.857) 0.2 € 5,900 Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Il valore dell’informazione (Inat) Quindi il valore dell’informazione imperfetta per Inat è: equivalente certo della decisione con informazione gratuita: € 5,900 - equivalente certo della decisione in assenza di informazione: € 4,800 = € 1,110 Osserviamo che per Inat il valore dell’informazione è maggiore che per Avi. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Confronto tra decisori: Avi Senza informazione: Chiuso Con informazione imperfetta: se l’oracolo prevede sereno, allora Portico, altrimenti Chiuso Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Confronto tra decisori: Inat Senza informazione: Portico Con informazione imperfetta: se l’oracolo prevede sereno, allora Aperto, altrimenti Chiuso Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Confronto tra decisori Il valore dell’informazione imperfetta per Inat è di € 1,110, per Avi è di € 870 Il motivo per cui Inat, pur essendo più propensa al rischio rispetto a Avi, sia disposta a pagare di più è che ancora, in assenza di informazione, le scelte sono diverse Ancora una volta, Inat e Avi partono da basi diverse, nel senso che in assenza di informazione farebbero scelte diverse. Questo è alla base di tale differenza. Si noti che questo fenomeno sussiste anche in un caso, come questo, in cui i decisori reagiscono diversamente alla stessa informazione (a differenza di quanto accadeva invece nel caso dell’informazione perfetta). Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Analisi di sensibilità rivista Una volta introdotti il concetto di probabilità soggettiva e il teorema di Bayes, possiamo estendere l’analisi di sensibilità effettuata per la determinazione della funzione di utilità anche alla assegnazione delle probabilità soggettive. Riprendiamo perciò l’esempio della tavola di decisione. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Stati di natura < -3 [-3,+2] Decisioni > +2 110 110 110 a1 a2 100 105 115 a3 90 120 100 probabilità 0.2 0.4 0.4 Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
I valori di utilita’ degli eventi elemetari erano: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Osserviamo nuovamente che P(2) = P(3). Supponiamo che il decisore abbia espresso qualche dubbio sul fatto che effettivamente queste due probabilità fossero uguali. Poniamo allora P(2) = p P(3) = q Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 P(1) = 1 - p - q Inoltre U[a1] = 0.8, U[a2] = 0.7, U[a3] = 0.56. Ne consegue che U[a1] > U[a2] 0.8 > (1-p-q)*0.40 + p*0.60 + q*0.95 8 > 4p+11q Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Analogamente U[a1] > U[a3] 0.8 > (1-p-q)*0.0 + p*0.40 + q*1 4 > 2p + 5q U[a2] > U[a3] (1-p-q)*0.40 + p*0.60 + q*0.95 > (1-p-q)* 0.0 + p*0.4 + q*1 8 > 4p+9q Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 q 1.0 D 4p + 9q = 8 C 2p + 5q = 4 B 0.5 4p + 11q = 8 A (0.4,0.4) p + q = 1 0.5 1.0 p Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Nella regione A si ha U[a1] > U[a2] > U[a3] Nella regione B si ha U[a2] > U[a1] > U[a3] Nella regione C si ha U[a2] > U[a3] > U[a1] Nella regione D si ha U[a3] > U[a2] > U[a1] Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Il punto (0.4,0.4) si trova all’interno della regione A. Quindi l’investimento a1 sembra essere il più conveniente, coerentemente con quanto visto in precedenza. Quello che dobbiamo verificare, e che in questo caso è evidente, è che per piccole variazioni di p e q il punto stimato (0.4,0.4) rimanga all’interno della regione A. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008
Quiz! (problema decisionale) Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008