Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1 in Ingegneria Gestionale e L2 in Ingegneria Informatica III ciclo
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Reti Bayesiane
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Le reti Bayesiane sono modelli grafici della conoscenza in un dominio incerto. Basandosi sulla regola di Bayes, esprimono relazioni di dipendenza condizionale (archi) tra le variabili in gioco (nodi). Il vantaggio principale del ragionamento probabilistico rispetto a quello logico sta nella possibilità di giungere a descrizioni razionali anche quando non vi è abbastanza informazione di tipo deterministico sul funzionamento del sistema.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Le reti bayesiane possono essere utilizzate in ogni settore in cui sia necessario modellare la realtà in situazioni di incertezza, cioè in cui siano coinvolte delle probabilità.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa La regola di Bayes Spesso, nei ragionamenti probabilistici, capita che si debba valutare una probabilità avendo già delle informazioni su quanto è già accaduto in precedenza. Dati due eventi A e B, se questi sono in qualche modo correlati, è ragionevole pensare che il sapere che uno dei due è già avvenuto possa migliorare la conoscenza della probabilità dell'altro.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Dato uno spazio di probabilità (,A, P[. ]), dove : spazio campionario (insieme di tutti i possibili risultati dell'esperimento) A: spazio degli eventi (contenente ) P[. ]: funzione di probabilità con Dominio in A e Codominio in [0,1] dati due eventi A e B appartenenti ad A, indichiamo con P[A|B] la probabilità che si verifichi A sapendo che si è già verificato B, cioè la probabilità di A condizionata a B.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Regola di Bayes P[A|B] = P[A,B] / P[B] (per P[B]0), dove P[A,B]=P[B|A] P[A] Forma completa: dato lo spazio di probabilità (, A, P[.]), siano B 1,B 2,...B n appartenenti ad A; per ogni i P[B i ]>0; ii B i B j =0; =U i B i ; allora per ogni A appartenente ad A P[B k |A] = P[A|B k ] P[B k ] / ( i P[A|B i ] P[B i ] )
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Supponiamo che viviate a Londra e che abbiate notato che in inverno piove (P) il 50% (p(P)) delle volte ed è nuvoloso (N) l80% (p(N)) delle volte (talvolta è nuvoloso ma non piove). Daltra parte, il 100% delle volte in cui piove è anche nuvoloso (p(N|P)). Qual è la probabilità che oggi piova essendo nuvoloso (p(P|N))? La regola di Bayes ci può aiutare in questo, infatti p(P|N) = p(P)p(N|P)/p(N) = 0.5 x 1.0 / 0.8 = = 5/8. Quindi 5/8 delle volte a Londra, quando è nuvoloso, piove.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Le reti Bayesiane Si usa una struttura di dati chiamata rete bayesiana (o rete di credenze) per rappresentare la dipendenza fra le variabili e per dare una specifica concisa della distribuzione di probabilità congiunta.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Una rete Bayesiana è un grafo in cui valgono le seguenti proprietà: 1) Un insieme di variabili casuali costituiscono i nodi della rete; 2) Un insieme di archi con verso connette le coppie di nodi (Il significato intuitivo di una freccia dal nodo X al nodo Y è che X ha uninfluenza diretta su Y);
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa ) Ogni nodo ha una tabella delle probabilità condizionate che quantifica gli effetti che i genitori hanno sul nodo, dove per genitori si intendono tutti quei nodi che hanno frecce che puntano al nodo; 4) Il grafo non ha cicli diretti;
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Un nodo che non ha genitori diretti (cioè non ha frecce che puntano verso di lui) contiene una tabella di probabilità marginali. Se il nodo è discreto contiene una distribuzione di probabilità sugli stati della variabile che rappresenta. Se il nodo è continuo contiene una funzione gaussiana di densità (definita da media e varianza) della variabile casuale che rappresenta.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Se un nodo ha parenti (cioè uno o più frecce che puntano verso di lui) allora il nodo contiene una tabella di probabilità condizionate. Se il nodo è discreto la funzione di probabilità condizionata contiene la probabilità condizionata del nodo data una configurazione dei suoi parenti. Se il nodo è continuo, la funzione di probabilità condizionata contiene media e varianza di ogni configurazione degli stati dei suoi nodi parenti.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Esempio 1: Gestione del traffico Un Comune può decidere se bloccare o no le auto per una giornata nel caso in cui si verifichi uno dei seguenti casi: viene raggiunto il livello massimo di inquinamento, si verifica una congestione delle strade. A seconda della situazione i cittadini dovranno decidere se spostarsi con i mezzi pubblici o prendere la macchina.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa
Una volta che la topologia della rete è specificata dobbiamo solo specificare le probabilità condizionate per i nodi che partecipano nelle dipendenze dirette, usando queste per il calcolo di qualunque altro valore di probabilità. Ogni nodo è caratterizzato da una tabella delle probabilità condizionate. Ogni riga della tabella contiene la probabilità condizionata del valore di ogni nodo per un caso condizionante.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Esempio 2: Lalbero di Jack Un giorno Jack si accorge che il suo albero di mele perde le foglie. Jack sa che se lalbero è secco allora è normale che perda le foglie. Ma Jack sa anche che la perdita delle foglie può essere sintomo di malattia per il suo albero.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa La rete per lalbero di Jack La rete consiste di 3 nodi: Malato, Secco, e Perde le foglie Malato può essere malato" o "no" Secco può essere secco" o "no" Perde le foglie può essere si" o "no". malato secco perde le foglie
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa La dipendenza casuale è tra Malato e Perde le foglie e Secco e Perde le foglie. Ad ogni nodo è associata una tabella di probabilità, che possono essere a priori o condizionate. Ad esempio: P(Malato=malato)=0.1 P(Malato="no)=0.9 P(Secco=secco)=0.1 P(Secco="no)=0.9
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Secco=seccoSecco=No Perde=si Perde=no Malato= Malato Malato= No Malato= Malato Malato= No P(Perde le foglie | Malato, Secco)
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Esempio 3: Diagnosi di un paziente che arriva in clinica Supponiamo di avere di fronte un nuovo paziente, di cui non sappiamo niente. Una volta che avremo acquisito informazione specifica su di lui la nostra rete bayesiana riguardante il suo stato di salute potrà essere aggiornato, fornendo risultati più attendibili.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Diagnosi di una malattia polmonare
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa I dati Statisticamente, in un campione rappresentativo di popolazione si conoscono i seguenti dati. Il 50% dei pazienti fuma. Il 1% ha la tubercolosi. Il 5.5% ha un cancro al polmone ( ). Il 45% ha una qualche forma di bronchite.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Come si procede Si costruisce la rete bayesiana e si analizzano i sintomi mostrati dal paziente. Ad esempio, supponiamo che: Il paziente lamenta dispnea. Il paziente è stato recentemente in Asia. Il paziente è un fumatore.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Inoltre Si effettua una radiografia da cui si vede che: 1. Risultato negativo Sembra che la diagnosi migliore sia che il paziente ha una semplice bronchite. 2. Risultato positivo La probabilità di un cancro o della tubercolosi sono aumentate enormemente. E comunque necessario effettuare nuovi esami.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Reti Bayesiane Statiche
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Reti Bayesiane Dinamiche
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Esempio 4: Il pozzo di petrolio Un agente deve decidere se perforare o non perforare per trovare un pozzo di petrolio. E incerto se il punto in cui vuole perforare sia secco (dry), umido (wet) o pieno (soaking). Lagente puo effettuare una ricerca geologica che puo aiutarlo a determinare la struttura geologica del sito. La risposta dellindagine puo essere: molto petrolio (closed), poco petrolio (open) o vuoto (diffuse).
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Le decisioni sono 2: 1. Fare il test geologico (costo: 10 K$); 2. Perforare (costo: 70 K$). Lutilita della perforazione e determinata dal risultato: dry, wet o soaking.