Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1 in Ingegneria Gestionale e L2 in Ingegneria Informatica III ciclo
Reti Bayesiane
Le reti Bayesiane sono modelli grafici della conoscenza in un dominio incerto. Basandosi sulla regola di Bayes, esprimono relazioni di dipendenza condizionale (archi) tra le variabili in gioco (nodi). Il vantaggio principale del ragionamento probabilistico rispetto a quello logico sta nella possibilità di giungere a descrizioni razionali anche quando non vi è abbastanza informazione di tipo deterministico sul funzionamento del sistema.
Le reti bayesiane possono essere utilizzate in ogni settore in cui sia necessario modellare la realtà in situazioni di incertezza, cioè in cui siano coinvolte delle probabilità.
La regola di Bayes Spesso, nei ragionamenti probabilistici, capita che si debba valutare una probabilità avendo già delle informazioni su quanto è già accaduto in precedenza. Dati due eventi A e B, se questi sono in qualche modo correlati, è ragionevole pensare che il sapere che uno dei due è già avvenuto possa migliorare la conoscenza della probabilità dell'altro.
Dato uno spazio di probabilità (W,A, P[.]), dove W : spazio campionario (insieme di tutti i possibili risultati dell'esperimento) A: spazio degli eventi (contenente W) P[.]: funzione di probabilità con Dominio in A e Codominio in [0,1] dati due eventi A e B appartenenti ad A, indichiamo con P[A|B] la probabilità che si verifichi A sapendo che si è già verificato B, cioè la probabilità di A condizionata a B.
Regola di Bayes P[A|B] = P[A,B] / P[B] (per P[B]≠0), dove P[A,B]=P[B|A] P[A] Forma completa: dato lo spazio di probabilità ( W, A, P[.]), siano B1,B2,...Bn appartenenti ad A; per ogni i P[Bi]>0; i≠i BiBj=0; W=UiBi; allora per ogni A appartenente ad A P[Bk|A] = P[A|Bk] P[Bk] / (S i P[A|Bi] P[Bi] )
Supponiamo che viviate a Londra e che abbiate notato che in inverno piove (P) il 50% (p(P)) delle volte ed è nuvoloso (N) l’80% (p(N)) delle volte (talvolta è nuvoloso ma non piove). D’altra parte, il 100% delle volte in cui piove è anche nuvoloso (p(N|P)). Qual è la probabilità che oggi piova essendo nuvoloso (p(P|N))? La regola di Bayes ci può aiutare in questo, infatti p(P|N) = p(P)p(N|P)/p(N) = 0.5 x 1.0 / 0.8 = 0.625 = 5/8. Quindi 5/8 delle volte a Londra, quando è nuvoloso, piove.
Le reti Bayesiane Si usa una struttura di dati chiamata rete bayesiana (o rete di credenze) per rappresentare la dipendenza fra le variabili e per dare una specifica concisa della distribuzione di probabilità congiunta.
Una rete Bayesiana è un grafo in cui valgono le seguenti proprietà: 1) Un insieme di variabili casuali costituiscono i nodi della rete; 2) Un insieme di archi con verso connette le coppie di nodi (Il significato intuitivo di una freccia dal nodo X al nodo Y è che X ha un’influenza diretta su Y);
3) Ogni nodo ha una tabella delle probabilità condizionate che quantifica gli effetti che i “genitori” hanno sul nodo, dove per “genitori” si intendono tutti quei nodi che hanno frecce che puntano al nodo; 4) Il grafo non ha cicli diretti;
Un nodo che non ha genitori diretti (cioè non ha frecce che puntano verso di lui) contiene una tabella di probabilità marginali. Se il nodo è discreto contiene una distribuzione di probabilità sugli stati della variabile che rappresenta. Se il nodo è continuo contiene una funzione gaussiana di densità (definita da media e varianza) della variabile casuale che rappresenta.
Se un nodo ha parenti (cioè uno o più frecce che puntano verso di lui) allora il nodo contiene una tabella di probabilità condizionate. Se il nodo è discreto la funzione di probabilità condizionata contiene la probabilità condizionata del nodo data una configurazione dei suoi parenti. Se il nodo è continuo, la funzione di probabilità condizionata contiene media e varianza di ogni configurazione degli stati dei suoi nodi parenti.
Esempio 1: Gestione del traffico Un Comune può decidere se bloccare o no le auto per una giornata nel caso in cui si verifichi uno dei seguenti casi: viene raggiunto il livello massimo di inquinamento, si verifica una congestione delle strade. A seconda della situazione i cittadini dovranno decidere se spostarsi con i mezzi pubblici o prendere la macchina.
Una volta che la topologia della rete è specificata dobbiamo solo specificare le probabilità condizionate per i nodi che partecipano nelle dipendenze dirette, usando queste per il calcolo di qualunque altro valore di probabilità. Ogni nodo è caratterizzato da una tabella delle probabilità condizionate. Ogni riga della tabella contiene la probabilità condizionata del valore di ogni nodo per un caso condizionante.
Esempio 2: L’albero di Jack Un giorno Jack si accorge che il suo albero di mele perde le foglie. Jack sa che se l’albero è secco allora è normale che perda le foglie. Ma Jack sa anche che la perdita delle foglie può essere sintomo di malattia per il suo albero.
La rete per l’albero di Jack secco malato perde le foglie La rete consiste di 3 nodi: Malato, Secco, e Perde le foglie Malato può essere “malato" o "no" Secco può essere “secco" o "no" Perde le foglie può essere “si" o "no".
La dipendenza casuale è tra Malato e Perde le foglie e Secco e Perde le foglie. Ad ogni nodo è associata una tabella di probabilità, che possono essere a priori o condizionate. Ad esempio: P(Malato=“malato“)=0.1 P(Malato="no“)=0.9 P(Secco=“secco“)=0.1 P(Secco="no“)=0.9
Secco=“secco” Secco=“No” Perde=“si” Perde=“no” Malato= “Malato” “No” Malato= “Malato” “No” 0.95 0.85 0.90 0.02 0.05 0.15 0.10 0.98 P(Perde le foglie | Malato, Secco)
Esempio 3: Diagnosi di un paziente che arriva in clinica Supponiamo di avere di fronte un nuovo paziente, di cui non sappiamo niente. Una volta che avremo acquisito informazione specifica su di lui la nostra rete bayesiana riguardante il suo stato di salute potrà essere aggiornato, fornendo risultati più attendibili.
Diagnosi di una malattia polmonare
I dati Statisticamente, in un campione rappresentativo di popolazione si conoscono i seguenti dati. Il 50% dei pazienti fuma. Il 1% ha la tubercolosi. Il 5.5% ha un cancro al polmone (). Il 45% ha una qualche forma di bronchite.
Come si procede Si costruisce la rete bayesiana e si analizzano i sintomi mostrati dal paziente. Ad esempio, supponiamo che: Il paziente lamenta dispnea. Il paziente è stato recentemente in Asia. Il paziente è un fumatore.
Inoltre Si effettua una radiografia da cui si vede che: 1. Risultato negativo Sembra che la diagnosi migliore sia che il paziente ha una semplice bronchite. 2. Risultato positivo La probabilità di un cancro o della tubercolosi sono aumentate enormemente. E’ comunque necessario effettuare nuovi esami.
Reti Bayesiane Statiche
Reti Bayesiane Dinamiche
Esempio 4: Il pozzo di petrolio Un agente deve decidere se perforare o non perforare per trovare un pozzo di petrolio. E’ incerto se il punto in cui vuole perforare sia secco (dry), umido (wet) o pieno (soaking). L’agente puo’ effettuare una ricerca geologica che puo’ aiutarlo a determinare la struttura geologica del sito. La risposta dell’indagine puo’ essere: molto petrolio (closed), poco petrolio (open) o vuoto (diffuse).
Le decisioni sono 2: 1. Fare il test geologico (costo: 10 K$); 2. Perforare (costo: 70 K$). L’utilita’ della perforazione e’ determinata dal risultato: dry, wet o soaking.