Ricerca euristica Maria Simi a.a. 2013/2014 Ricerca euristica  La ricerca esaustiva non è praticabile in problemi di complessità esponenziale  Noi.

Slides:



Advertisements
Presentazioni simili
Strutture dati per insiemi disgiunti
Advertisements

Politecnico di Torino Tesi di Laurea
Algoritmi e Strutture Dati (Mod. B)
Problemi di soddisfacimento di vincoli Maria Simi a.a. 2005/2006.
Ricerca euristica Maria Simi a.a. 2006/ /03/2017
Algoritmi e Strutture Dati
Breath-first search Visita in ampiezza di un grafo Algoritmo Esempio
Alberi binari di ricerca
Breath-first search Visita in ampiezza di un grafo Algoritmo Esempio
Teoria e Implementazione
Il problema del cammino minimo tra 2 nodi in un grafo con archi privati.
Università degli Studi di Roma Tor Vergata
Capitolo 3 Strutture dati elementari Algoritmi e Strutture Dati.
Sistemi basati su conoscenza Metodi di ricerca informata Prof. M.T. PAZIENZA a.a
Algoritmi e Strutture Dati
Intelligenza Artificiale 1 Gestione della conoscenza lezione 5 Prof. M.T. PAZIENZA a.a
Scenario Archi di un grafo controllati da agenti egoistici
U V U V (a) |cfc|=2 prima e dopo (b) |cfc|=2 prima e |cfc|=1 dopo
Algoritmo di Ford-Fulkerson
Algoritmi e Strutture Dati
Capitolo 4 Ordinamento Algoritmi e Strutture Dati.
Algoritmi e Strutture Dati (Mod. B)
Algoritmi e Strutture Dati (Mod. B)
Trovare il percorso minimo da b ad ogni altro vertice
Algoritmi e Strutture Dati (Mod. B)
Heap binari e HeapSort.
QuickSort Quick-Sort(A,s,d) IF s < d THEN q = Partiziona(A,s,d) Quick-Sort(A,s,q-1) Quick-Sort(A,q + 1,d)
Ingegneria della conoscenza e sistemi esperti Dario Bianchi, 1999 Risoluzione di problemi e ricerca.
Intelligenza Artificiale Risoluzione di Problemi
Intelligenza Artificiale
Elementi di Informatica di base
Esercizio 10.* Un cassiere vuole dare un resto di n centesimi di euro usando il minimo numero di monete. a) Descrivere un algoritmo goloso per fare ciò.
Strutture dati per insiemi disgiunti
Algoritmi e Strutture Dati
Lezioni di Ricerca Operativa Corso di Laurea in Informatica
Algoritmi e Strutture Dati
Euristiche: algoritmi costruttivi e di ricerca locale
Cammini minimi da un sorgente
Algoritmi online Maria Simi, a.a. 2007/08 Problemi di esplorazione  Gli agenti per il problem-solving assumono:  ambienti deterministici e osservabili.
Ricerca euristica Maria Simi a.a. 2008/2009 Ricerca euristica  La ricerca esaustiva non è praticabile in problemi di complessità esponenziale  Noi.
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Copyright © The McGraw - Hill Companies, srl 1 Strutture dati per.
Oltre la ricerca classica Cap 4 – Ricerca locale, ricerca online Maria Simi a.a. 2014/2015.
Capitolo 13 Cammini minimi: Algoritmo di Floyd e Warshall Algoritmi e Strutture Dati.
Problemi di soddisfacimento di vincoli Maria Simi a.a. 2008/2009.
1 Ordinamento (Sorting) INPUT: Sequenza di n numeri OUTPUT: Permutazione π = tale che a 1 ’  a 2 ’  … …  a n ’ Continuiamo a discutere il problema dell’ordinamento:
Sistemi basati su conoscenza Metodi di ricerca informata Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Metodi di ricerca informata Prof. M.T. PAZIENZA a.a
Dipartimento di Ingegneria dell’Informazione Università degli Studi di Parma Intelligenza Artificiale Risoluzione dei Problemi (parte 2) Agostino Poggi.
Ricerca locale M. Simi, Algoritmi di ricerca locale  Efficienti in occupazione di memoria: tengono traccia solo dello stato corrente (non.
Intelligenza Artificiale Risoluzione di Problemi
Dipartimento di Ingegneria dell’Informazione Università degli Studi di Parma Intelligenza Artificiale Risoluzione dei Problemi Agostino Poggi Stefano Cagnoni.
1 Ordinamento (Sorting) Input: Sequenza di n numeri Output: Permutazione π = tale che: a i 1  a i 2  ……  a i n Continuiamo a discutere il problema dell’ordinamento:
Gli agenti per il problem solving Maria Simi a.a 2007/2008.
Ricerca locale M. Simi, Algoritmi di ricerca locale  Efficienti in occupazione di memoria  tengono traccia solo dello stato corrente (non.
Ricerca euristica Maria Simi a.a. 2005/2006 Ricerca euristica  La ricerca esaustiva non è praticabile in problemi di complessità esponenziale  Noi.
Master Bioinformatica 2002: Visite di Grafi Algoritmi di visita Scopo: visitare tutti i vertici di un grafo per scoprirne proprietà di vario tipo. Alcune.
I giochi con avversario Maria Simi a.a. 2008/2009.
Algoritmi e Strutture Dati
Università degli Studi di Cagliari FACOLTA’ DI INGEGNERIA
Ricerca locale Maria Simi Assunzioni sui problemi  Gli algoritmi visti esplorano gli spazi di ricerca alla ricerca di un goal e restituiscono.
Algoritmi e Strutture Dati HeapSort. Select Sort: intuizioni L’algoritmo Select-Sort  scandisce tutti gli elementi dell’array a partire dall’ultimo elemento.
Problemi di soddisfacimento di vincoli Maria Simi a.a. 2011/2012.
Agenti risolutori di problemi Risolvere i problemi mediante ricerca Maria Simi a.a 2013/2014.
Ricerca online Maria Simi a.a. 2011/2012 Ambienti più realistici  Gli agenti risolutori di problemi “classici” assumono:  Ambienti completamente osservabili.
Algoritmi e Strutture Dati Luciano Gualà
Problemi di soddisfacimento di vincoli Maria Simi a.a. 2013/2014.
ASD a.a.2010/2011- Lezione 12 Algoritmi e Strutture dati a.a.2010/2011 Prof.ssa Rossella Petreschi Backtracking/ Branch and Bound Lezione n°12.
Lezioni di Ricerca Operativa Corso di Laurea in Informatica
Prof.ssa Rossella Petreschi Lezione del 17 /10/2014 del Corso di Algoritmica Lezione n°5.
Ricerca euristica Maria Simi a.a. 2010/ /07/2019
Transcript della presentazione:

Ricerca euristica Maria Simi a.a. 2013/2014

Ricerca euristica  La ricerca esaustiva non è praticabile in problemi di complessità esponenziale  Noi usiamo conoscenza del problema ed esperienza per riconoscere i cammini più promettenti.  La conoscenza euristica (dal greco “eureka”) aiuta a fare scelte “oculate”  non evita la ricerca ma la riduce  consente in genere di trovare una buona soluzione in tempi accettabili.  sotto certe condizioni garantisce completezza e ottimalità

Funzioni di valutazione euristica Conoscenza del problema data tramite una funzione di valutazione dello stato, detta funzione di valutazione euristica: f : n  R La funzione si applica al nodo ma dipende solo dallo stato (n.Stato)

Esempi di euristica  La città più vicina (o la città più vicina alla mèta in linea d’aria) nel problema dell’itinerario  Il numero delle caselle fuori posto nel gioco dell'otto  Il vantaggio in pezzi nella dama o negli scacchi

Algoritmo di ricerca Best-First  Ad ogni passo si sceglie il nodo sulla frontiera per cui il valore della f è migliore (il nodo più promettente).  Migliore significa 'minore' in caso di un’euristica che stima la distanza della soluzione  Implementata da una coda con priorità che ordina in base al valore della funzione di valutazione euristica.

Strategia best-first: esempio La Best First non è in generale completa, né ottimale Passo 1 A 3 Passo 2 BD 5 1 C Passo 3 D EF 4 6 Passo 4 B GH 6 5 Passo 5 E GI 2 1 Passo 6 I Passo 7 G

Ricerca greedy best-first  Si usa come euristica una stima della distanza della soluzione, da ora in poi h(n) [h≥0]  Esempio: ricerca greedy per l’itinerario h(n) = distanza in linea d’aria tra lo stato di n e la destinazione In generale l’algoritmo non è completo

Ricerca greedy: esempio

Itinerario con Greedy Best-First

Ricerca greedy: esempio Da Arad a Bucarest … Greedy: Arad, Sibiu, Fagaras, Bucharest (450) Ottimo: Arad, Sibiu, Rimnicu, Pitesti, Bucarest (418) Da Iasi a Fagaras: … falsa partenza … o cicla

Algoritmo A: definizione  Si può dire qualcosa di f per avere garanzie di completezza e ottimalità?  Un algoritmo A è un algoritmo Best First con una funzione di valutazione dello stato del tipo: f(n) = g(n) + h(n), con h(n)  0 e h(goal)=0  g(n) è il costo del cammino percorso per raggiungere n  h(n) una stima del costo per raggiungere da n un nodo goal Casi particolari dell’algoritmo A:  Se h(n) = 0 [f(n) = g(n)] si ha Ricerca Uniforme  Se g(n) = 0 [f(n) = h(n)] si ha Greedy Best First

Algoritmo A: esempio Esempio nel gioco dell’otto f(n) = #mosse fatte + #caselle-fuori-posto f(Start) = 0 + 7Dopo , , ,  f = 4 + 7

L’ algoritmo A è completo Teorema: L’algoritmo A con la condizione g(n)  d(n) ·  (   0 costo minimo arco) è completo. Nota: la condizione ci garantisce che non si verifichino situazioni strane del tipo e che il costo lungo un cammino non cresca “abbastanza”.

Completezza di A: dimostrazione  Sia [n 0 n 1 n 2 … n’… n k =goal] un cammino soluzione.  Sia n’ un nodo della frontiera su un cammino soluzione: n’ prima o poi sarà espanso.  Infatti esistono solo un numero finito di nodi x che possono essere aggiunti alla frontiera con f(x)  f(n’);  Quindi, se non si trova una soluzione prima, n’ verrà espanso e i suoi successori aggiunti alla frontiera. Tra questi anche il suo successore sul cammino soluzione.  Il ragionamento si può ripetere fino a dimostrare che anche il nodo goal sarà selezionato per l’espansione

Algoritmo A*: la stima ideale Funzione di valutazione ideale (oracolo): f*(n) = g*(n) + h*(n) g*(n) costo del cammino minimo da radice a n h*(n) costo del cammino minimo da n a goal f*(n) costo del cammino minimo da radice a goal, attraverso n Normalmente: g(n)  g*(n) eh(n) è una stima di h*(n)

Algoritmo A*: definizione Definizione: euristica ammissibile  n. h(n)  h*(n)h è una sottostima Es. l’euristica della distanza in linea d’aria Definizione: Algoritmo A* Un algoritmo A in cui h è una funzione euristica ammissibile. Teorema: gli algoritmi A* sono ottimali. Corollario: BF e UC sono ottimali (h(n)=0)

Itinerario con A*

Osservazioni su A* 1. Una sottostima può farci compiere del lavoro inutile, però non ci fa perdere il cammino migliore 2. La componente g fa sì che si abbandonino cammini che vanno troppo in profondità 3. Una funzione che qualche volta sovrastima può farci perdere la soluzione ottimale

Ottimalità di A*  Nel caso di ricerca su albero l’uso di un’euristica ammissibile è sufficiente a garantire l’ammissibilità.  Nel caso di ricerca su grafo serve una proprietà più forte: la consistenza (detta anche monotonicità)

Euristica consistente o monotòna  Definizione: euristica consistente  [ h(goal) = 0 ]   n. h(n)  c(n, a, n’) + h(n’) dove n’=succ(n)  Ne segue che f(n)  f(n’)  Nota: se h è consistente la f non decresce mai lungo i cammini, da cui il termine monotòna (v. dopo) n n' h(n)h(n) h(n’)h(n’) c(n, n’)

Euristiche monotòne: proprietà  Teorema: Un’euristica monotona è ammissibile  Esistono euristiche ammissibili che non sono monotone, ma sono rare.  Le euristiche monotone garantiscono che la soluzione meno costosa venga trovata per prima e quindi sono ottimali anche nel caso di ricerca su grafo.

Ottimalità di A* 1. Se h(n) è consistente i valori di f(n) lungo un cammino sono non decrescenti Se h(n)  c(n, a, n’) + h(n’) def. consistenza g(n) + h(n)  g(n) + c(n, a, n’) + h(n’) sommando g(n) ma siccome g(n) + c(n, a, n’) = g(n’) allora f(n)  f(n’) 2. Ogni volta che A* seleziona un nodo per l’espansione, il cammino ottimo a tale nodo è stato trovato se così non fosse ci sarebbe un altro nodo n’ della frontiera sul cammino ottimo con f(n’) minore; ma ciò non è possibile perché tale nodo sarebbe già stato espanso

I contorni nella ricerca A*

Bilancio su A*  A* è completo: discende dalla completezza di A (A* è un algoritmo A particolare)  A* con euristica monotona è ottimale  A* è ottimamente efficiente: a parità di euristica nessun altro algoritmo espande meno nodi (senza rinunciare a ottimalità)  Qual è il problema? ... ancora l'occupazione di memoria (O(b d+1 ))

Migliorare l ’ occupazione di memoria  Beam search  A* con approfondimento iterativo (IDA*)  Ricerca best-first ricorsiva (RBFS)  A* con memoria limitata (MA*) in versione semplice (SMA*)

Beam search  Nel Best First viene tenuta tutta la frontiera; se l’occupazione di memoria è eccessiva si può ricorrere ad una variante: la Beam search.  La Beam Search tiene ad ogni passo solo i k nodi più promettenti, dove k è detto l’ampiezza del raggio (beam).  La Beam Search non è completa.

IDA* A* con approfondimento iterativo  IDA* combina A* con ID: ad ogni iterazione si ricerca in profondità con un limite dato dal valore della funzione f (e non dalla profondità)  il limite f-limit viene aumentato ad ogni iterazione, fino a trovare la soluzione.  Punto critico: di quanto viene aumentato f-limit

Esempio Iteraz. 1f=(0+2)f-limit=1 Iteraz. 2(0+2)f-limit=2 (1+1)(1+2) (2+1) Iteraz. 3(0+2)f-limit=3 (1+1)(1+2)(2+1)(3+1) Iteraz. 4(0+2)f-limit=4 (1+1)(1+2)(2+1)(3+1) (4+1)(4+0) soluzione!

Quale incremento?  Cruciale la scelta dell'incremento per garantire l’ottimalità  Nel caso di costo delle azioni fisso è chiaro: il limite viene incrementato del costo delle azioni.  Nel caso che i costi delle azioni siano variabili?  costo minimo  si potrebbe ad ogni passo fissare il limite successivo al valore minimo delle f scartate (in quanto superavano il limite) all’iterazione precedente.

Analisi IDA*  IDA* completo e ottimale  Se le azioni hanno costo costante k (caso tipico 1) e f-limit viene incrementato di k  Se le azioni hanno costo variabile e l'incremento di f-limit è   (minimo costo degli archi)  Se il nuovo f-limit = min. valore f dei nodi generati ed esclusi all'iterazione precedente  Occupazione di memoria O(bd)

Best-first ricorsivo  Simile a DF ricorsivo: cerca di usare meno memoria, facendo del lavoro in più  Tiene traccia ad ogni livello del migliore percorso alternativo  Invece di fare backtracking in caso di fallimento interrompe l’esplorazione quando trova un nodo meno promettente (secondo f)  Nel tornare indietro si ricorda il miglior nodo che ha trovato nel sottoalbero esplorato, per poterci eventualmente tornare

Best first ricorsivo: esempio

Best First ricorsivo: algoritmo function Ricerca-Best-First-Ricorsiva( problema) returns soluzione oppure fallimento return RBFS(problema, CreaNodo( problema.Stato-iniziale), ∞) // all’inizio f-limite è un valore molto grande function RBFS ( problema, nodo, f-limite) returns soluzione oppure fallimento e un nuovo limite all’ f-costo // restituisce due valori if problema.TestObiettivo( nodo.Stato) then return Soluzione( nodo ) successori = [ ] for each azione in problema.Azioni(nodo.Stato) do aggiungi Nodo-Figlio( problema, nodo, azione ) a successori // genera i successori if successori è vuoto then return fallimento, ∞ for each s in successori do // valuta i successori s.f = max( s.g + s.h, nodo.f )// un modo per rendere monotona f loop do migliore = il nodo con f minimo tra i successori if migliore.f > f_limite then return fallimento, migliore.f alternativa = il secondo nodo con f minimo tra i successori risultato, migliore.f = RBFS( problema, migliore, min( f_limite, alternativa )) if risultato ≠ fallimento then return risultato

A* con memoria limitata Versione semplice  L'idea è quella di utilizzare al meglio la memoria disponibile  SMA* procede come A* fino ad esaurimento della memoria disponibile  A questo punto “dimentica” il nodo peggiore, dopo avere aggiornato il valore del padre.  A parità di f si sceglie il nodo migliore più recente e si dimentica il nodo peggiore più vecchio.  Ottimale se il cammino soluzione sta in memoria.

Considerazioni  In algoritmi a memoria limitata (IDA* e SMA*) le limitazioni della memoria possono portare a compiere molto lavoro inutile  Difficile stimare la complessità temporale effettiva  Le limitazioni di memoria possono rendere un problema intrattabile dal punto di vista computazionale

Valutazione di funzioni euristiche A parità di ammissibilità, una euristica può essere più efficiente di un’altra nel trovare il cammino soluzione migliore (visitare meno nodi) Questo dipende da quanto informata è l’euristica (dal grado di informazione posseduto) h(n)=0 minimo di informazione (BF o UF) h*(n) massimo di informazione (oracolo) In generale, per le euristiche ammissibili: 0  h(n)  h*(n)

Più informata, più efficiente Teorema: Se h 1  h 2, i nodi espansi da A* con h 2 sono un sottoinsieme di quelli espansi da A* con h 1. Se h 1  h 2, A* con h 2 è almeno efficiente quanto A* con h 1  Un’euristica più informata riduce lo spazio di ricerca (è più efficiente), ma è tipicamente più costosa da calcolare

Confronto di euristiche ammissibili  Due euristiche ammissibili per il gioco dell’8 h 1 :conta il numero di caselle fuori posto h 2 : somma delle distanze Manhattan delle caselle fuori posto dalla posizione finale  h 2 è più informata di h 1 infatti  n. h 1 (n)  h 2 (n) h1 = 7 h2= = 18

Costo ricerca vs costo euristica [figura da Nilsson 1980]

Misura del potere euristico Come valutare gli algoritmi di ricerca euristica... Fattore di diramazione effettivo b* N: numero di nodi generati d: profondità della soluzione b* è il fattore di diramazione di un albero uniforme con N+1 nodi; soluzione dell’equazione N + 1=b*+(b*) 2 + … + (b*) d Sperimentalmente una buona euristica ha un b* abbastanza vicino a 1 (  1.5) Esempio: d=5; N= 52 b*= 1.92

Esempio: dal gioco dell’otto dIDSA*(h1)A*(h2) … 10 (2,43) 112 (2,87) 680 (2,73) 6384 (2,80) (2,79) (2,78) - 6 (1,79) 13 (1,48) 20 (1,34) 39 (1,33) 93 (1,38) 227 (1,42) 539 (1,44)... 6 (1,79) 12 (1,45) 18 (1,30) 25 (1,24) 39 (1,22) 73 (1,24) 113 (1,23)... I dati sono mediati, per ogni d, su 100 istanze del problema [AIMA] Nodi generati e fattore di diramazione effettivo

Capacità di esplorazione Con b=2 d=6 N=100 d=12N= ma con b=1.5 d=12N=100 d=24 N= … migliorando di poco l’euristica si riesce, a parità di nodi espansi, a raggiungere una profondità doppia!

Quindi … 1. Tutti i problemi dell’IA (o quasi) sono di complessità esponenziale … ma c’è esponenziale e esponenziale! 2. L’euristica può migliorare di molto la capacità di esplorazione dello spazio degli stati rispetto alla ricerca cieca 3. Migliorando anche di poco l’euristica si riesce ad esplorare uno spazio molto più grande.

Come si inventa un’euristica?  Alcune strategie per ottenere euristiche ammissibili:  Rilassamento del problema  Massimizzazione di euristiche  Database di pattern disgiunti  Combinazione lineare  Apprendere dall’esperienza

Rilassamento del problema  Nel gioco dell’8 mossa da A a B possibile se B adiacente a A 2. B libera  h 1 e h 2 sono calcoli della distanza esatta della soluzione in versioni semplificate del puzzle:  h 1 (nessuna restrizione): sono sempre ammessi scambi a piacimento tra caselle  # caselle fuori posto  h 2 (solo restrizione 1): sono ammessi spostamenti anche su caselle occupate, purché adiacenti  somma delle distanze Manhattan

Massimizzazione di euristiche  Se si hanno una serie di euristiche ammissibili h 1, h 2, … h k senza che nessuna “domini” un’ altra allora conviene prendere il massimo dei loro valori: h(n)=max(h 1 (n), h 2 (n), …, h k (n))  Se le h i sono ammissibili anche la h lo è  La h domina tutte le altre.

Eurstiche da sottoproblemi  Costo della soluzione ottima al sottoproblema (di sistemare 1,2,3,4) è una sottostima del costo per il problema nel suo complesso  Database di pattern: memorizzare ogni istanza del sottoproblema con relativo costo  Usare questo database per calcolare h DB

Sottoproblemi multipli  Potremmo poi fare la stessa cosa per altri sottoproblemi: , … ottenendo altre euristiche ammissibili  Poi prendere il valore massimo: ancora una euristica ammissibile  Ma potremmo sommarle e ottenere un’euristica ancora più accurata?

Pattern disgiunti  In generale no perchè le soluzioni ai sottoproblemi interferiscono e la somma delle euristiche in generale non è ammissibile  Si deve eliminare il costo delle mosse che contribuiscono all’altro sottoproblema  Database di pattern disgiunti consentono di sommare i costi (euristiche additive)  Sono molto efficaci: gioco del 15 in pochi ms

Apprendere dall’esperienza  Far girare il programma, raccogliere dati: coppie  Usare i dati per apprendere a predire la h con algoritmi di apprendimento induttivo  Gli algoritmi di apprendimento si concentrano su caratteristiche salienti dello stato (feature)

Combinazione di euristiche  Quando diverse caratteristiche influenzano la bontà di uno stato, si può usare una combinazione lineare h(n)= c 1 h 1 (n) + c 2 h 2 (n) + … + c k h k (n) Gioco dell’8: h(n)= c 1 #fuori-posto + c 2 #coppie-scambiate Scacchi: h(n)= c 1 vant-pezzi + c 2 pezzi-attacc. + c3 regina + …  Il peso dei coefficienti può essere aggiustato con l’esperienza, anche automaticamente

Conclusione  Attività necessarie:  La formulazione del problema  Scelta dell’algoritmo di ricerca adeguato  Identificazione della funzione di valutazione euristica più efficace