Dott. Mario Pavone mpavone@dmi.unict.it www.dmi.unict.it/mpavone Un Algoritmo Immunologico Ibrido con Information Gain per il Problema della Colorazione.

Slides:



Advertisements
Presentazioni simili
TSP Traveling Salesman’s Problem Università di Camerino
Advertisements

Prof. Salvatore Di Gregorio Dr. William Spataro Dr. Donato D’Ambrosio
Master Bioinformatica 2002: Grafi Problema: cammini minimi da tutti i vertici a tutti i vertici Dato un grafo pesato G =(V,E,w), trovare un cammino minimo.
2. Introduzione alla probabilità
Laboratorio Processi Stocastici
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Protocolli.
Cinematica diretta Un manipolatore è costituito da un insieme di corpi rigidi (bracci) connessi in cascata tramite coppie cinematiche (giunti). Si assume.
6. Catene di Markov a tempo continuo (CMTC)
Introduzione alle misure strumentali
Un Algoritmo Immunologico per il Riconoscimento di Caratteri
Sistemi Immunitari Artificiali: Metafora ed Applicazioni Dr. Mario Pavone Dr. Mario Pavone
6. Catene di Markov a tempo continuo (CMTC)
Capitolo 4 Ordinamento Algoritmi e Strutture Dati.
Università degli Studi di Roma Tor Vergata
Sistemi basati su conoscenza (agenti intelligenti) Prof. M.T. PAZIENZA a.a
Algoritmi e Strutture Dati Capitolo 2 Modelli di calcolo e metodologie di analisi.
Algoritmi e Strutture Dati
Apprendimento Non Supervisionato
Valutazione delle ipotesi
Algoritmi Paralleli e Distribuiti a.a. 2008/09
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Algoritmi e Strutture Dati Capitolo 2 Modelli di calcolo e metodologie.
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Algoritmi e Strutture Dati Capitolo 2 Modelli di calcolo e metodologie.
Algoritmi e Strutture Dati
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Algoritmi e Strutture Dati Capitolo 2 Modelli di calcolo e metodologie.
1 Corso di Laurea in Biotecnologie Informatica (Programmazione) Problemi e algoritmi Anno Accademico 2009/2010.
Alberi di Ricorrenza Gli alberi di ricorrenza rappresentano un modo conveniente per visualizzare i passi di sostitu- zione necessari per risolvere una.
PROPRIETA’ PERIODICHE
Ottimizzazione Combinatoria
CONTROLLO DI SUPPLY CHAIN MEDIANTE TECNICHE H-INFINITO E NEGOZIAZIONE
Algoritmi Genetici Prof. Salvatore Di Gregorio Dr. William Spataro Dr. Donato DAmbrosio Modelli Computazionali per Sistemi Complessi A.A. 2003/2004 Università
Analisi dei gruppi – Cluster Analisys
Notazioni Asintotiche e Ordini di Grandezza delle funzioni
Intelligenza Artificiale Algoritmi Genetici
Intelligenza Artificiale
CALCOLO EVOLUZIONISTICO. In ogni popolazione si verificano delle mutazioni. Le mutazioni possono generare individui che meglio si adattano allambiente.
Rappresentazione di numeri relativi (interi con segno)
Apprendimento Automatico Calcolo Evoluzionistico Stefano Cagnoni.
Intelligenza Artificiale
Algoritmi Genetici Alessandro Bollini
Strutture periodiche discrete: introduzione del vincolo di periodicità e studio della ricostruzione da due proiezioni. A. Del Lungo, A. Frosini, M.Nivat,
Main tools of the probabilistic method with applications in graph theory Attività formativa - Yuri Faenza Supervisore: Prof. B. Scoppola CdLS in Ingegneria.
Elementi di Informatica di base
Lezioni di Ricerca Operativa Corso di Laurea in Informatica
Euristiche: algoritmi costruttivi e di ricerca locale
MUTAZIONE: cambio di un bit Viene effettuata con bassa frequenza, ad es. 1bit ogni 1000 Ha la funzione di recupero di eventuali perdite di informazione.
Laurea Ing EO/IN/BIO;TLC D.U. Ing EO 10 PROBABILITA’ E VARIABILI ALEATORIE.
Didattica e Fondamenti degli Algoritmi e della Calcolabilità Terza giornata: principali classi di complessità computazionale dei problemi Guido Proietti.
Capitolo 13 Cammini minimi: Algoritmo di Floyd e Warshall Algoritmi e Strutture Dati.
Laurea Ing. EO/IN/BIO;TLC D.U. Ing EO 3
Università degli Studi di Roma Tor Vergata
1 Ordinamento (Sorting) INPUT: Sequenza di n numeri OUTPUT: Permutazione π = tale che a 1 ’  a 2 ’  … …  a n ’ Continuiamo a discutere il problema dell’ordinamento:
Gli algoritmi genetici (GA)1 Si ispirano al meccanismo dell’evoluzione Viene creata una popolazione di individui che si riproduce ed evolve, di generazione.
Claudio Arbib Università dell’Aquila Ricerca Operativa Metodo del simplesso per problemi di distribuzione single-commodity.
Sistemi basati su conoscenza (agenti intelligenti) Prof. M.T. PAZIENZA a.a
Intelligenza Artificiale Risoluzione di Problemi
AOT Lab Dipartimento di Ingegneria dell’Informazione Università degli Studi di Parma Intelligenza Artificiale Rappresentazione della Conoscenza e Ragionamento.
Il simulated annealing (SA)
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Algoritmi e Strutture Dati Capitolo 2 Modelli di calcolo e metodologie.
1 Il simulated annealing (SA) Analogia con il processo di solidificazione di un metallo fuso A partire dal metallo fuso, la temperatura viene abbassata.
Rappresentazione dell'informazione
1 Ordinamento (Sorting) Input: Sequenza di n numeri Output: Permutazione π = tale che: a i 1  a i 2  ……  a i n Continuiamo a discutere il problema dell’ordinamento:
Conversione binario-ottale/esadecimale
Ricerca locale M. Simi, Algoritmi di ricerca locale  Efficienti in occupazione di memoria  tengono traccia solo dello stato corrente (non.
DATA MINING PER IL MARKETING Andrea Cerioli Sito web del corso GLI ALBERI DI CLASSIFICAZIONE Introduzione alla metodologia Zani-Cerioli,
Computazione Naturale AA
Ricerca locale Maria Simi Assunzioni sui problemi  Gli algoritmi visti esplorano gli spazi di ricerca alla ricerca di un goal e restituiscono.
ASD a.a.2010/2011- Lezione 12 Algoritmi e Strutture dati a.a.2010/2011 Prof.ssa Rossella Petreschi Backtracking/ Branch and Bound Lezione n°12.
Lezione n° 8 - Matrice di base. - Soluzioni di base ammissibili. - Relazione tra vertici di un poliedro e soluzioni basiche. - Teorema fondamentale della.
Lezioni di Ricerca Operativa Corso di Laurea in Informatica
Se A e B sono variabili random statisticamente indipendenti P (2) (B,A)=P(B)P(A) P(A)=probabilità che la variabile stocastica A assuma un certo valore.
Transcript della presentazione:

dott. Mario Pavone mpavone@dmi.unict.it www.dmi.unict.it/mpavone Un Algoritmo Immunologico Ibrido con Information Gain per il Problema della Colorazione dei Grafi. dott. Mario Pavone mpavone@dmi.unict.it www.dmi.unict.it/mpavone

Overview Artificial Immune System; Graph Coloring Problem; A Hybrid Immune Algorithm with Information Gain for the Graph Coloring Problem; Results; Conclusions.

Introduzione I Sistemi Immunitari Naturali rappresentano un’eccellente strategia intelligente “Bottom Up”, dove l’adattamento delle cellule e delle molecole avviene localmente, invece un utile comportamento emerge a livello globale (risposta immunitaria). Immune System: sistemi di apprendimento Ag: problema da risolvere Ab: soluzione generata

Graph Coloring Problem (GCP) Migliori risultati per il GCP vengono spesso ottenuti con Hybrid EAs. L’operatore di Crossover, nei SGA, ottiene scarse prestazioni in problemi di ottimizzazione combinatoria. In generale, deve essere progettato ad hoc. Lo sviluppo di un Operatore di Crossover è cruciale per le prestazioni globali di un EAs. IA non fa uso ne di un operatore di Crossover ne di alcuna specifica conoscenza del problema.

Definizione del GCP Dato un Grafo non diretto G=(V, E), una colorazione dei vertici di G è una funzione c: V  |V|, tale che c(u)  c(v),  (u, v)  E {1,…,|V|} è detto insieme dei colori. Il più piccolo intero k, tale che G è k-colorabile è detto numero cromatico di G ((G)). GCP è NP-Complete (Garey e Johnson:79)

Proprietà del GCP Dalla definizione di (G) seguono le seguenti proprietà (Bollobas: 98, Diestel: 97): Poiché max{H  G}{(H)}  (G), dove  indica il grado minimo e  il grado massimo, segue un upper bound per il GCP: (G) (G) Il problema della colorazione è strettamente collegato con la definizione di clique (sottografo completo). Ne segue un lower bound per il GCP: (G)  (G)

Approcci per la Colorazione Assegnazione dei colori (come in definizione); Classi di Colori: Una configurazione è considerata come un partizionamento dei vertici, dove ciascuna partizione rappresenta un Independent Set (due vertici adiacenti appartengono a partizioni diverse). Quindi, una k-colorazione di G equivale a partizionare V in k sottoinsiemi.

Algoritmo Immunologico Utilizzo di due entità: Ag (problema) e B cells (soluzione candidata di lunghezza =|V|). P(t) = popolazione di d individui, i quali rappresentano un sottoinsieme dello spazio delle soluzioni (S )di lunghezza  ottenute al time step t.

Interazione In tale fase viene valutata la popolazione P(t). f(x)=m indica il valore della funzione fitness del recettore della B cells x. Nel caso del GCP, la funzione fitness indica che esiste una colorazione di G con m colori, cioè: V = S1  S2  …  Sm tale che Si  V è un Independent Set, i.

Espansione Clonale La fase di Espansione Clonale è composta da due passi: cloning e hypermutation. Potenziale di Clonazione: V(f(x)) = e –k(-f(x)) Numero di Mutazione: M(f(x)) = 1- (/f(x)) L’operatore di mutazione sceglie M(f(x)) volte due vertici i e j in x e li scambia. Le rispettive popolazioni vengono indicate con P(clo) e P(hyp).

Pdie(B) = (1 - e (– ln(2) / B )) Aging Dopo aver valutato la nuova popolazione P(hyp) al time step t, l’operatore di Aging elimina le B cells vecchie, attraverso un processo stocastico. La Probabilità di rimuovere una B cells è determinato da una legge esponenziale negativa con parametro B: Pdie(B) = (1 - e (– ln(2) / B )) dove B rappresenta il tempo di vita media previsto per le cellule B. Non utilizziamo l’operatore della Birth poiché produce un alto numero di valutazioni della fitness.

Assegnazione dei colori L’assegnazione dei vertici avviene seguendo uno schema deterministico, basato sull’ordine di visita dei vertici del grafo. Facciamo uso di una semplice procedura di colorazione poiché vogliamo investigare la capacità di apprendimento e di risoluzione del nostro IA.

Criterio di Arresto mediante Information Gain Information Gain (Kullback Information) è una funzione entropica associata alla quantità di informazione che il sistema scopre durante la fase di apprendimento. Funzione di distribuzione: Information Gain:

L’Information Gain cresce monotonicamente fino a raggiungere uno stato finale costante. Maximum Information Gain principle: dK/dt  0. Quando l’apprendimento del sistema finisce avremo dK/dt = 0. Può quindi essere utilizzato tale rapporto come condizione di arresto per IA.

Ricerca Locale Gli algoritmi di ricerca locale per problemi di ottimizzazione combinatoria si basano sulla definizione di intorno. In tale approccio i vicini vengono generati scambiando i valori dei vertici. Scambiare tutte le coppie dei vertici risulta essere computazionalmente costoso. Utilizziamo l’idea del “vicino più vicino”. A tal proposito definiamo unvicinato con raggio R.

Ricerca Locale (cont.) La procedura di ricerca locale ha come vantaggio quello di incrementare il success rate e come svantaggio quello di incrementare il numero di valutazioni della funzione fitness. Se omettiamo tale procedura IA necessita di un numero maggiore di generazioni e quindi più calcoli della fitness per ottenere lo stesso risultato, ma con un SR più piccolo.

| avgfitness(Phyp) – avgfitness(P(t+1)) | = Popdiv Ricerca Locale (cont.) È possibile utilizzare la differenza fra Phyp e P(t+1), come una misura standard della diversità della popolazione: | avgfitness(Phyp) – avgfitness(P(t+1)) | = Popdiv Quando Popdiv decresce rapidamente ci troviamo di fronte ad una prematura convergenza.

Istanza DSCJ250. 5. col con |V|=250, |E|=15668 Istanza DSCJ250.5.col con |V|=250, |E|=15668. Parametri utilizzati: d=500, dup=5, B=10 ed R=5. Best Known 28.

Istanza flat_300_20_0. col con |V|=300, |E|=21375 Istanza flat_300_20_0.col con |V|=300, |E|=21375. Parametri utilizzati: d=1000, dup=10, B=10 ed R=5. Best Known 20.

Settaggio dei Parametri mediante Information Gain Per capire come settare i parametri dell’algoritmo eseguiamo alcuni esperimenti sull’istanza del GCP QUEEN6_6.col. Fissiamo i seguenti parametri: d=100, dup=2, R=2 e gen=100. Per ciascun esperimento eseguiamo 100 runs indipendenti.

Vita Media delle B cellule, B

Vita Media delle B cellule, B

Parametro di Duplicazione dup Fissato B=25.0, facciamo variare dup. Da risultati sperimentali si ottiene che IA a ciascuna generazione ottiene una maggiore informazione (Information Gain) per dup=10, mentre raggiunge più velocemente il miglior valore della fitness per dup=5.

dup e B Abbiamo quindi ottenuto che per dup=2 il miglior valore di B è 25.0, mentre le performance migliori si ottengono per dup=5. Settiamo allora dup=5 e facciamo variare B .

dup e B Information Gain per B{15, 10, 25, 50}.

dup e B Fitness media della popolazione Phyp e della popolazione P(t) per B{15, 10, 25, 50}.

Raggio dell’intorno R, d e dup Numero medio di valutazioni per determinare la soluzione (AES) al variare del raggio del vicinato.

Raggio dell’intorno R, d e dup Grafico 3D dei valori d e dup rispetto SR.

Risultati I risultati sperimentali sono stati ottenuti sui classici benchmark: MYCIELSKI, QUEEN, DSJC e LEIGHTON. Parametri utilizzati: d=1000, dup=15, R=30 e B=20.0. È stato utilizzato l’operatore Elitist Aging. I migliori valori ottenuti da IA sono sempre ottenuti per SR=100.

Conclusioni Abbiamo sviluppato un nuovo IA che incorpora una semplice procedura di ricerca locale al fine di migliorare le performance globali; IA utilizza la funzione di Information Gain per settare correttamente i quattro parametri; Scegliamo i parametri che massimizzano l’informazione scoperta e che incrementano in maniera monotona l’Information Gain. A nostra conoscenza questa è la prima volta che Ias, e in generale EAs, vengono caratterizzati in termini di Information Gain.