La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Problemi di scheduling multi-agente Alessandro Agnetis, Università di Siena Gianluca De Pascale, Università di Siena Pitu B. Mirchandani, University of.

Presentazioni simili


Presentazione sul tema: "Problemi di scheduling multi-agente Alessandro Agnetis, Università di Siena Gianluca De Pascale, Università di Siena Pitu B. Mirchandani, University of."— Transcript della presentazione:

1 Problemi di scheduling multi-agente Alessandro Agnetis, Università di Siena Gianluca De Pascale, Università di Siena Pitu B. Mirchandani, University of Arizona Dario Pacciarelli, Università di Roma Tre Andrea Pacifici, Università di Roma Tor Vergata Marco Pranzo, Università di Siena Alessandria, 16 marzo 2007

2 Problemi multi-agente Diversi agenti competono per lutilizzo di un insieme limitato di risorse produttive o logistiche Per raggiungere un accordo, gli agenti possono negoziare lutilizzo della risorsa Un eventuale soggetto centrale può avere parte attiva nel problema o essere solo un coordinatore

3 Treni in competizione per lutilizzo di binari [Brewer e Plott 1996]

4 Job di diversi ordini che competono per luso di slot temporali su una macchina --- agenti autonomi [Kutanoglu e Wu 1999, Wellman et al. 2001] AGV in competizione su una rete [Huang e Hallam 1995] Tipi diversi di segnali (dati, voce) che competono per le stesse risorse radio [Arbib et al. 2002]

5 Problemi di scheduling con due agenti Due agenti, A e B, possiedono ciascuno un set di job che richiedono determinate risorse di processamento Gli agenti possiedono ciascuno una funzione di costo f A ( ) and f B ( ) rispettivamente Ogni funzione di costo dipende soltanto dai job del rispettivo agente

6 Problemi multi-agente: aspetti Situazione iniziale Possibilità e modalità di scambio delle informazioni tra agenti Possibilità di compensazioni/scambi di utilità tra agenti

7 Situazione iniziale: scenari Esiste una allocazione iniziale rispetto alla quale solo un insieme limitato di riallocazioni è possibile (es. orario ferroviario) Non esiste alcuna situazione iniziale, tutti gli agenti si presentano contemporaneamente e hanno uguale priorità

8 Scambi di informazione: scenari Tutti gli agenti possono comunicare direttamente tra loro informazioni complete riguardanti i propri job e le proprie utilità Esiste un protocollo di comunicazione e offerta (e.g. aste) Ciascun agente comunica solo con un sottoinsieme di agenti o con un coordinatore

9 Trasferimenti di utilità: scenari Lutilità degli agenti e i rapporti relativi sono tali da consentire una redistribuzione dellutilità (e.g. in termini monetari) Lutilità degli agenti è espressa in termini che non ne consentono una redistribuzione immediata (e.g. diverse funzioni obiettivo)

10 Modelli multi-agente Giochi cooperativi: sequencing games Aste: –Wellman et al. (asta ascendente parallela) –Kutanoglu-Wu (asta combinatoria) Bargaining problems: estensione dei concetti di soluzioni di Nash e Kalai Smorodinski

11 Sequencing games Sono particolari giochi cooperativi ad utilità trasferibile Si studiano situazioni di sequenziamento in cui, a partire da uno schedule iniziale 0, i giocatori possono formare coalizioni per rischedulare i loro job in modo proficuo senza danneggiare gli altri giocatori In molti casi, il nucleo è non vuoto [Curiel, Pederzoli and Tijs 1989, Slikker 2003]

12 2. MARKET ORIENTED PROGRAMMING

13 Aste - Market Oriented Programming La situazione è rappresentata da un modello di tipo economico [Wellman, Walsh, Wurman, Mc-Kie Mason 2002] Gli agenti si muovono in un mercato i cui beni sono i periodi di utilizzo delle risorse La comunicazione è limitata alle offerte che ciascun agente formula per le risorse

14 Market Oriented Programming - II Gli agenti formulano le proprie offerte sulla base di valutazioni individuali Le uniche informazioni scambiate sono nel formato di prezzi e avvengono tra agenti e un coordinatore (automatico) Lanalisi studia le relazioni tra equilibrio e ottimalità

15 Modello di scheduling Un insieme G di n time slot Un insieme A di agenti compreso lagente venditore F 0 Un vettore [p 1, p 2,…, p n ] di prezzi per i vari time slot Per ogni X G, un valore v j (X) che lagente j attribuisce a X I job sono interrompibili

16 Modello di scheduling Ciascuna risorsa i ha un reserve price q i, che rappresenta il valore della risorsa per il sistema se non viene allocata Il valore globale di unallocazione è

17 Allocazione ottima Una allocazione f è ottima se il suo valore globale è massimo Lottimalità di una soluzione dipende soltanto dallallocazione f e dai valori w j, non dai prezzi a cui le risorse possono essere acquisite

18 Prezzi e agenti Dato un vettore p di prezzi, la quantità H j (p) misura il massimo guadagno che lagente j può conseguire

19 Equilibrio Unallocazione f è in equilibrio per un vettore p di prezzi se: 1) (ossia, ogni agente consegue il massimo guadagno)

20 Equilibrio 2) p i q i per ogni slot i allocato p i = q i per ogni slot i non allocato (ossia, anche lagente venditore ha un vantaggio)

21 Esempio w 1 =16 d 1 =3 L 1 = w 2 =10 d 2 =4 L 2 =2 w 3 =6 d 3 =2 L 3 =1 w 4 =14,5 d 4 =8 L 4 =4 6,25 pipi q i = 3 6,25 3,25

22 Esempio w 1 =16 d 1 =3 L 1 = w 2 =10 d 2 =4 L 2 =2 w 3 =6 d 3 =2 L 3 =1 w 4 =14,5 d 4 =8 L 4 =4 w 1 =16 d 1 =3 L 1 =2 w 2 =10 d 2 =4 L 2 =2 w 4 =14,5 d 4 =8 L 4 =4 pipi 6,25 3,25 q i = 3

23 Equilibrio e ottimalità Teorema [Bikhchandani e Mamer 1997, Gul e Stacchetti 1999, Wellman et al. 2001]: Se esiste un sistema di prezzi p per cui f è in equilibrio, allora f è ottima Il viceversa in generale non è vero

24 Esempio w 1 =3 d 1 =2 L 1 =2 012 w 2 =2 d 2 =2 L 2 =1 q i = 0

25 Allocazione ottima w 1 =3 d 1 =2 L 1 =2 012 w 2 =2 d 2 =2 L 2 =1 q i = 0 w 1 =3 d 1 =2 L 1 =2 p1p1 p2p2

26 Equilibrio e ottimalità Perché f sia in equilibrio, per lagente 2 deve essere conveniente non comprare nulla Questo si ha solo se p 1 2 e p 2 2 Ma allora non può essere in equilibrio per lagente 1 !

27 Equilibrio e ottimalità Le due condizioni sono equivalenti nel caso più particolare di job unitari Anche nel caso multiple-deadline

28 Analisi dei protocolli di asta Come si può raggiungere una soluzione di equilibrio da parte di agenti distribuiti? Meccanismi di asta Esempio: lasta ascendente

29 Asta ascendente Gli agenti formulano in modo asincrono offerte per ciascuno slot i Se lofferta corrente è i, lofferta successiva deve essere pari ad almeno i = i + (ask price) Quando non ci sono più offerte, la risorsa è allocata al miglior offerente

30 Comportamento degli agenti Ciascun agente offre il valore i per alcune risorse, in modo da massimizzare il proprio surplus Lasta ascendente raggiunge un equilibrio?

31 Esempio w 1 = 20 d 1 =2 L 1 =2 012 w 2 = 8 d 2 =3 L 2 =2 q i = 0, = 1 3 w 3 = 2,5 d 3 =3 L 3 =1 Prezzo corr

32 Offerta agente 2 w 1 = 20 d 1 =2 L 1 =2 012 w 2 = 8 d 2 =3 L 2 =2 q i = 0, = 1 3 Prezzo corr Prezzo corr w 2 = 2,5 d 2 =3 L 2 =1 w 2 = 8 d 2 =3 L 2 =2

33 Prezzo corr Prezzo corr Offerta agente 1 w 1 = 20 d 1 =2 L 1 =2 012 w 2 = 8 d 2 =3 L 2 =2 q i = 0, = 1 3 w 2 = 2,5 d 2 =3 L 2 =1 w 2 = 8 d 2 =3 L 2 =2

34 Prezzo corr Prezzo corr Offerta agente 3 w 1 = 20 d 1 =2 L 1 =2 012 w 2 = 8 d 2 =3 L 2 =2 q i = 0, = 1 3 w 2 = 2,5 d 2 =3 L 2 =1 w 2 = 8 d 2 =3 L 2 =2

35 Prezzo corr Prezzo corr Offerta agente 2 w 1 = 20 d 1 =2 L 1 =2 012 w 2 = 8 d 2 =3 L 2 =2 q i = 0, = 1 3 w 2 = 2,5 d 2 =3 L 2 =1 w 2 = 8 d 2 =3 L 2 =2 Prezzo corr

36 Lagente 3 esce di scena Perché un sistema di prezzi sia in equilibrio, devessere p 3 2 Ad esempio: p 1 = 8 p 2 = 8 p 3 = 1

37 Equilibrio w 1 = 20 d 1 =2 L 1 =2 012 w 2 = 8 d 2 =3 L 2 =2 q i = 0, = 1 3 w 2 = 2,5 d 2 =3 L 2 =1 w 2 = 8 d 2 =3 L 2 =2 Prezzo 8 8 1

38 Convergenza di unasta Lasta ascendente può non raggiungere un equilibrio, anche se esiste Può raggiungere unallocazione arbitrariamente lontana dallottimo Nel caso di job unitari, la distanza tra il valore di unallocazione ottima e quella generata dallasta è limitata (k +1)

39 3. KUTANOGLU - WU

40 Aste – modello di Kutanoglu-Wu Il sistema è un job shop Un insieme di agenti, ognuno dei quali possiede un job, che richiede lutilizzo di alcune macchine per alcuni time slot I job sono non interrompibili Un coordinatore centrale gestisce lasta combinatoria

41 Kutanoglu-Wu (II) A ogni iterazione, ogni slot su ogni macchina ha un prezzo In base ai prezzi di ogni slot/macchina (k,t), e in base alla propria funzione di utilità, ogni agente, risolvendo un problema di ottimizzazione, formula la propria migliore offerta

42 Kutanoglu-Wu (III) Il banditore raccoglie dunque tutte le offerte, le elabora e annuncia i nuovi prezzi delle risorse Lo scopo del banditore è di convergere verso uno schedule ammissibile, per cui i prezzi delle risorse più contese vengono aumentati in misura del livello di conflitto:

43 Kutanoglu-Wu (III) Ad esempio, laggiornamento dei prezzi può realizzarsi attraverso un semplice meccanismo di proporzionalità, ossia kt r+1 = kt r + s D kt

44 Kutanoglu-Wu (IV) Il procedimento va avanti fino a raggiungere un criterio di arresto Lo schedule risultante può non essere ammissibile Obiettivo globale non monotono Il comportamento può variare molto a seconda del pricing scheme e del protocollo usato (regola usata per aggiornare i prezzi)

45 4. BARGAINING

46 Bargaining problems Due giocatori, A e B, devono scegliere uno di un insieme X di possibili agreements I giocatori possono comunicare, ma non possono trasferirsi utilità Questi giochi modellano le situazioni di negoziazione

47 Bargaining problems (II) La soluzione di un bargaining problem è un agreement che soddisfa certe proprietà (assiomatiche) che ne fanno un particolare candidato a essere il risultato del processo di negoziazione

48 Bargaining problems (III) A e B sono razionali, i.e., hanno funzioni di utilità (o anche value functions) u A (x), u B (x) definite su X che soddisfano gli assiomi di von Neumann-Morgenstern D è il disagreement point (dominato da tutti gli altri punti di X)

49 Bargaining problems (IV) La teoria della negoziazione studia in che modo il risultato finale della negoziazione dipende dai parametri del problema e/o dal comportamento dei giocatori In particolare, la soluzione di Nash tiene conto dellutilità dei giocatori e dunque del loro atteggiamento rispetto al rischio

50 Soluzione di Nash La soluzione di Nash può caratterizzarsi in termini delle preferenze dei giocatori sullinsieme delle lotterie aventi come premi gli elementi di X La soluzione di Nash x* è unalternativa rispetto alla quale nessuno dei due giocatori ha abbastanza incentivi a deviare

51 Soluzione di Nash È un agreement x* tale che, se esiste un agreement x e una probabilità p tale che il giocatore A preferisce L = a x*, allora il giocatore B preferisce L = a x

52 Soluzione di Nash Date le funzioni di utilità dei due giocatori, la soluzione di Nash x* è tale che u A (x*) u B (x*) u A (x) u B (x) per ogni x X La soluzione di Nash è unica se X è compatto e convesso

53 Soluzione di Nash Se X non è compatto e convesso (e.g. un insieme discreto), il concetto di soluzione di Nash può ancora definirsi come soluzione che massimizza il prodotto delle utilità, ma può non essere unica

54 d * (d A,d B ) * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * Non appartiene necessariamente alla frontiera efficiente S Soluzione di Nash - dominio discreto

55 Altri concetti di soluzione La soluzione di Nash fa riferimento a una caratterizzazione dei decisori basata sul loro atteggiamento rispetto al rischio (value function) Consideriamo il caso di decisori indifferenti al rischio (relativamente al valore dellindice di costo)

56 Equità e vantaggio globale Un punto di vista diverso confronta la situazione migliore e quella peggiore in assoluto per i due decisori (tipicamente la migliore per A è la peggiore per B e viceversa) Siano z A *, z B *,z A 0, z B 0, i valori ottimi e quelli peggiori per i due giocatori

57 Equità e vantaggio globale Data una qualsiasi soluzione di valore z A e z B per i due agenti, si può osservare come si situa rispetto agli estremi:

58 Equità e vantaggio globale I due valori r A e r B indicano a quanto ciascun giocatore sta rinunciando rispetto alla situazione in cui è da solo Dunque, si vuole che r A e r B siano piccoli (qualità globale) ma anche che siano il più possibile vicini (equità)

59 Equità e vantaggio globale Siamo interessati a trovare i due schedule A e B tali che:

60 Equità e vantaggio globale La soluzione di Kalai Smorodinski (nel discreto) è definita come quello schedule KS tale che r( KS ) = min {r A (, r B ( }

61 (d A,d B ) * 1 1 (d A,d B ) * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * Soluzione di Kalai-Smorodinsky - dominio discreto Non appartiene necessariamente alla frontiera efficiente

62 Scheduling bargaining problems Problemi: –Quanto è grande linsieme di tutti gli schedule Pareto-ottimi? –Quanto è complesso trovarne ognuno? –Quanto è complesso determinare la soluzione di Nash e quella di KS?

63 Modello di ottimizzazione vincolato 1 | f B Q | f A è il problema di trovare lo schedule * che minimizza f A ( ) tra quelli tali che f B ( ) Q

64 Modello bicriterio Un altro approccio minimizza una combinazione convessa delle funzioni obiettivo dei due agenti f A + ( 1- ) f B

65 I due approcci Il modello vincolato può essere iterativamente utilizzato per trovare tutte le soluzioni Pareto-ottime Il modello bicriterio può essere più semplice da risolvere ma consente di trovare solo le soluzioni estreme o efficienti

66 Soluzioni Pareto-ottime che sono anche soluzioni del modello bicriterio f A f B

67 1| C i B Q | T max A - Esempio Agente A f A = T max A J i p i d i Agente B f B = i C i B Q = 43 J i p i

68 Schedule i C i B = = 43 T max A = J1J1 J2J2 J3J3 J1J1 J2J2 J3J3

69 Schedule i C i B = = 39 T max A = J1J1 J2J2 J3J3 J1J1 J2J2 J3J3

70 Agent A f A = i w i A C i A J i A p i A w i A Agent B f B = C max B J i B p i B 110 Q = 20 1| C max B Q | w i A C i A - Esempio

71 Soluzione ottima * i w i A C i A ( ) = 9*6+5*10+7*25+4*28 C max B ( *)= J1BJ1B J2AJ2A J3AJ3A J4AJ4A J1AJ1A J i A p i A w i A

72 Constr.model Size of P Bicriteria f max A f max B O(n 2 ) O(n A n B ) O(n 4 ) w j A C j A C max B NP-hard pseudopol. O(n log n) w j A C j A T max B NP-hard pseudopol. NP-hard C j A f max B O(n log n) O(n A n B ) O(n 3 log n) U j A f max B O(n log n) O(n A ) O(n 2 log n) U j A U j B O(n 3 ) O(n A ) O(n 4 ) C j A U j B O(n B ) w j A C j A U j B NP-hard O(n B ) NP-hard C j A C j B NP-hard pseudopol. O(n log n)

73 Constr.model Nash/KS Bicriteria f max A f max B O(n 2 ) O(n A n B ) O(n 4 ) w j A C j A C max B NP-hard O(n log n) w j A C j A T max B NP-hard NP-hard C j A f max B O(n log n) O(n 3 log n) O(n 3 log n) U j A f max B O(n log n) O(n 2 log n) O(n 2 log n) U j A U j B O(n 3 ) O(n 4 ) O(n 4 ) C j A U j B w j A C j A U j B NP-hard NP-hard C j A C j B NP-hard NP-hard O(n log n)

74 Per velocizzare lintero processo: 1. Generiamo i triangoli, ognuno corrispondente ad una coppia di soluzioni estreme. 2. Identifichiamo un triangolo critico nel quale cercare la soluzione desiderata. Ricerca dei triangoli critici (per WC/WC)

75 Questa è la soluzione di Nash La soluzione di Nash è qui (da qualche parte) (a), (b) e (c) sono mutuamente esclusive Triangolo critico di Nash

76 E sufficiente identificare i due schedule(successivi), tali che: Triangolo critico di Kalai-Smorodinsky

77 Ricerca in corso Algoritmi esatti (branch and bound) per trovare soluzioni Pareto-ottime nei casi difficili Studio di protocolli di negoziazione per giungere ad allocazioni buone senza bisogno di rivelare tutta linformazione Connessione con altri modelli di negoziazione, come aste etc


Scaricare ppt "Problemi di scheduling multi-agente Alessandro Agnetis, Università di Siena Gianluca De Pascale, Università di Siena Pitu B. Mirchandani, University of."

Presentazioni simili


Annunci Google