Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
1
EQUILIBRI DI NASH E ROUTING EGOISTICO
Marinelli Claudia
2
Introduzione alla TEORIA DEI GIOCHI
Definizione (Gioco strategico) Un gioco strategico è un modello di interazione tra soggetti che devono decidere quali azioni compiere per raggiungere un determinato obiettivo. Definizione (Teoria dei giochi) E’ la scienza che studia i giochi strategici.
3
Introduzione alla TEORIA DEI GIOCHI
Un gioco strategico consiste di: un insieme di giocatori; per ogni giocatore, un insieme di azioni; per ogni giocatore, preferenze sull’insieme di profili. aggiungere assunzioni sulle strategie pure
4
Introduzione alla TEORIA DEI GIOCHI
Funzione di payoff E’ possibile rappresentare le preferenze attraverso una funzione di guadagno(payoff), che associa un numero ad ogni profilo in modo tale che i profili con numeri più alti sono preferiti rispetto a quelli con numeri più bassi. Più precisamente, la funzione di payoff rappresenta le preferenze di un soggetto se per ogni coppia di profili , risulta: se e solo se il soggetto preferisce il profilo al profilo .
5
Introduzione alla TEORIA DEI GIOCHI
Problema: Quali azioni saranno scelte dai giocatori? Ogni giocatore cerca di massimizzare il proprio guadagno. In generale, l’azione migliore per un giocatore dipende dall’azione degli altri partecipanti. Il giocatore deve formulare una teoria sulle azioni degli altri giocatori.
6
Definizione (EQULIBRIO DI NASH)
Equilibri di Nash EQULIBRI DI NASH Definizione (EQULIBRIO DI NASH) Un equilibrio di Nash è un profilo di azione con la proprietà che nessun giocatore può fare meglio scegliendo un’azione differente da , assumendo che ogni altro giocatore aderisce a Nello stato idealizzato in cui i giocatori di ogni partita del game sono scelti in maniera casuale da una collezione di popolazioni, un equilibrio di Nash corrisponde ad uno stato stabile. Se, ogni volta che viene fatta una partita, il profilo delle azioni è quello dell’equilibrio di Nash , allora nessun giocatore ha qualche ragione per scegliere un’azione differente dalla propria componente di .
7
Equilibri di Nash Questa definizione non implica nè che ogni gioco strategico ha un equilibrio di Nash nè che ce ne sia al più uno per ogni gioco strategico. Uno dei giochi strategici più noti è il “Dilemma Del Prigioniero”. Il suo nome viene da una storia che coinvolgeva due sospetti in un crimine; la sua importanza viene dalla grande varietà di situazioni in cui i partecipanti hanno a che fare con decisioni simili a quelle messe di fronte ai due sospetti della storia.
8
Equilibri di Nash – “Il Dilemma del prigioniero”
Esempio : “ Il Dilemma del Prigioniero” Due sospetti in un grave crimine sono messi in due celle separate. Ci sono abbastanza prove da incolpare ognuno dei due di un crimine minore, ma non abbastanza prove da incolpare uno dei due del crimine maggiore, a meno che uno dei due non agisca da informatore contro l’altro (Quiet). Se entrambi stanno zitti (Fink), ognuno dei due sarà accusato del crimine minore e saranno condannati ad un anno di prigione. Se uno e solo uno dei due confessa, egli sarà liberato e sarà usato come testimone contro l’altro, che sarà condannato a quattro anni di prigione. Se entrambi confessano, saranno condannati entrambi a tre anni di prigione.
9
Equilibri di Nash – “Il Dilemma del prigioniero”
Modello Giocatori : I due sospetti. Azioni {Quiet,Fink} Preferenze L’ordine dei profili di azione dal migliore al peggiore: primo sospetto (Fink,Quiet) lui viene liberato (Quiet,Quiet) lui viene condannato ad un anno di prigione (Fink,Fink) lui viene condannato a tre anni di prigione (Quiet,Fink) lui viene condannato a quattro anni di prigione
10
Equilibri di Nash – “Il Dilemma del prigioniero”
secondo sospetto Per gli stessi motivi, l’ordine dei profili di azione del secondo sospetto è: (Quiet,Fink) (Quiet,Quiet) (Fink,Fink) (Fink,Quiet). Possiamo rappresentare il gioco in maniera compatta in una tavola. Per prima cosa scegliamo le funzioni di payoff che rappresentano gli ordinamenti delle preferenze dei due sospetti.
11
Equilibri di Nash – “Il Dilemma del prigioniero”
Per il primo sospetto abbiamo bisogno di una funzione per la quale Una semplice specifica sarebbe Allo stesso modo, per il secondo sospetto potremmo scegliere la funzione per la quale .
12
Equilibri di Nash – “Il Dilemma del prigioniero”
Usando queste rappresentazioni, il gioco è illustrato nella seguente figura . sospetto 2 Quiet Fink Quiet sospetto 1 Fink 2,2 0,3 3,0 1,1 Esaminando le quattro possibili coppie di azioni possiamo vedere che la coppia (Fink,Fink) è l’unico equilibrio di Nash *
13
Equilibri di Nash – “Il Dilemma del prigioniero”
La coppia (Fink,Fink) è un equilibrio di Nash perché: Se fissiamo che il secondo giocatore sceglie Fink, per il primo giocatore è meglio scegliere Fink piuttosto che Quiet, dato che nel primo caso avrebbe un guadagno di 1 maggiore del guadagno di 0 che avrebbe nel secondo caso. Analogamente, se fissiamo che il primo giocatore sceglie Fink, per il secondo giocatore è meglio scegliere Fink piuttosto che Quiet, dato che nel primo caso avrebbe un guadagno di 1 maggiore del guadagno di 0 che avrebbe nel secondo caso.
14
Equilibri di Nash – “Il Dilemma del prigioniero”
Pertanto, se uno dei due giocatori si sposta unilateralmente da Fink a Quiet passerebbe da un guadagno positivo ad un guadagno nullo. Nessun altro profilo è un equilibrio di Nash: (Quiet,Quiet) non è un equilibrio di Nash perché sia al primo che al secondo giocatore conviene cambiare unilaterlamente la propria azione dato che, in tal caso, passerebbe da un guadagno di 2 ad un guadagno di 3. (Fink,Quiet) non è un equilibrio di Nash perché al secondo giocatore conviene cambiare unilateralmente la propria azione dato che, in tal caso, passerebbe da un guadagno di 0 ad un guadagno di 1.
15
Equilibri di Nash – “Il Dilemma del prigioniero”
(Quiet,Fink) non è un equilibrio di Nash perché al primo giocatore conviene cambiare unilateralmente la propria azione dato che, in tal caso, passerebbe da un guadagno di 0 ad un guadagno di 1. Nel dilemma del prigioniero, il problema principale è se i giocatori devono cooperare o no. Nel seguente gioco, i giocatori sono daccordo nel cooperare, ma sono in disaccordo sulla migliore soluzione.
16
Due persone vogliono uscire insieme.
Equilibri di Nash – “Bach o Stravinsky?” Esempio: “Bach o Stravinsky?” Due persone vogliono uscire insieme. Ci sono due concerti disponibili: uno di musica di Bach ed uno di musica di Stravinsky. Una persona preferisce Bach e l’altra preferisce Stravinsky. Se essi vanno a concerti differenti, entrambi saranno scontenti allo stesso modo.
17
Bach Stravinsky Equilibri di Nash – “Bach o Stravinsky?” 2,1 0,0 1,2
(Bach,Bach): Se il giocatore 1 si sposta da Bach a Stravinsky, il proprio payoff decresce da 2 a 0; se il giocatore 2 passa da Bach a Stravinsky il suo payoff decresce da 1 a 0. Pertanto questo è un equilibrio di Nash.
18
Equilibri di Nash – “Bach o Stravinsky?”
(Bach,Stravinsky): Se il giocatore 1 si sposta da Bach a Stravinsky, il suo payoff cresce da 0 a 1, quindi questo non può essere un equilibrio di Nash. (Stravinsky,Stravinsky): Se il giocatore 1 si sposta da Stravinsky a Bach, il proprio payoff decresce da 1 a 0; se il giocatore 2 passa da Stravinsky a Bach il suo payoff decresce da 2 a 0. Pertanto questo è un equilibrio di Nash.
19
Equilibri di Nash – “Bach o Stravinsky?” 2,1 0,0
Bach Stravinsky Bach Stravinsky (Stravinsky,Bach): Se il giocatore 2 si sposta da Bach a Stravinsky, il suo payoff cresce da 0 a 2, quindi questo non può essere un equilibrio di Nash. 2,1 0,0 1,2
20
Equilibri di Nash – “Bach o Stravinsky?”
Concludiamo, quindi, che il gioco ha due equilibri di Nash, che corrispondono agli stati in cui entrambi i giocatori scelgono la stessa azione. Come il dilemma del prigioniero, questo esempio modella una grande varietà di situazioni. Vediamo ora un caso di gioco puramente conflittuale.
21
Equilibri di Nash – “Matching Pennies”
Esempio: “Matching Pennies” Due persone, ognuna delle quali ha una moneta, devono simultaneamente mostrare un lato (Testa o Croce) delle loro monete. Se entrambi mostrano lo stesso lato, la seconda persona paga un euro alla prima persona; se mostrano lati differenti, la prima persona paga un euro alla seconda persona. Ogni persona è attenta solo alla quantità di soldi che riceve e, ovviamente, preferisce ricevere piuttosto che dare.
22
Equilibri di Nash – “Matching Pennies”
Un gioco strategico che modella questa situazione è mostrato nella figura Testa Croce Testa Croce In questo gioco, gli interessi dei giocatori sono diametralmente opposti (un gioco del genere è detto “strettamente competitivo”): il giocatore 1 preferirebbe fare la stessa azione del giocatore 2, mentre quest’ultimo preferirebbe fare un’azione diversa da quella del giocatore 1. 1,-1 -1,1
23
Equilibri di Nash – “Matching Pennies”
Controllando ognuna delle quattro possibili coppie di azioni possiamo immediatamente vedere che questo gioco non ha un equilibrio di Nash. Infatti: (Testa,Testa) non può essere un equilibrio di Nash perché all’agente 2 conviene passare da Testa a Croce portando, così, il suo guadagno da -1 a +1. (Croce,Croce) non può essere un equilibrio di Nash perché all’agente 2 conviene passare da Croce a Testa portando, così, il suo guadagno da -1 a +1
24
Equilibri di Nash – “Matching Pennies”
(Testa,Croce) non può essere un equilibrio di Nash perché all’agente 1 conviene passare da Testa a Croce portando, così, il suo guadagno da -1 a +1. (Croce,Testa) non può essere un equilibrio di Nash perché all’agente 2 conviene passare da Croce a Testa portando, così, il suo guadagno da -1 a +1.
25
Equilibri di Nash – Prezzo dell’anarchia Prezzo dell’anarchia
Koutsoupias, Papadimitriou Definizione Dati un gioco e una funzione sociale (somma delle funzioni di payoff di tutti i giocatori) ,sia l’insieme di tutti gli equilibri di Nash e lo stato di che ottimizza . Il prezzo dell’anarchia del gioco rispetto a è definito come: Misura la perdita di ottimalità di un sistema non regolato a causa della mancanza di cooperazione tra i giocatori e di coordinazione centrale.
26
Equilibri di Nash – Prezzo dell’anarchia
Per spiegare come definire e misurare la qualità di uno stato stabile, riprendiamo l’esempio del “Dilemma del prigioniero”, in cui il problema principale è se i giocatori devono cooperare o no. Se i due sospetti potessero cooperare, si accorderebbero sullo stato (Quiet,Quiet) = OPT. Ne consegue che il prezzo dell’anarchia risulta essere: verificare calcolo del prezzo dell’anarchia
27
Equilibri di Nash – Prezzo dell’anarchia
Subottimalità degli Equilibri di Nash In generale, un comportamento egoistico di agenti che popolano un sistema non cooperativo può risultare in uno stato stabile, il cui valore sociale può essere lontano dall’ottimo sociale.
28
ROUTING EGOISTICO: INTERNET
Routing egoistico della rete ROUTING EGOISTICO: INTERNET Un problema fondamentale nella gestione di traffico a larga scala e nelle reti di comunicazione è quello del routing del traffico per ottimizzare le prestazioni della rete. Problema Data una quantità di traffico tra ogni coppia di nodi della rete, trovare i percorsi che minimizzano la somma dei tempi di attesa (latenza totale).
29
Routing egoistico della rete
Risulta spesso difficile (quasi impossibile) imporre strategie di routing ottimali o quasi-ottimali sul traffico di una rete. Una delle prime strategie proposte è la valutazione di un costo marginale, anche noto come congestione. Si considera che su ogni arco ogni utente deve pagare un costo (tempo) aggiuntivo, pari al ritardo dovuto alla presenza di altri utenti su tale arco. Molti decenni dopo, alcuni ricercatori, utilizzando tale strategia, sono riusciti a scoprire che, sotto alcune assunzioni, è possibile far fronte all’inefficienza del routing, scegliendo appropriatamente gli archi della rete.
30
Routing egoistico della rete
Caratteristiche di Internet Le reti sono formate da nodi dislocati in modo eterogeneo nel mondo e sono caratterizzate da un’architettura aperta che gli permette una continua e incontrollata crescita; gli utenti della rete si comportano,generalmente, in maniera “egoistica” (selfish agents); il tempo di attesa per un collegamento è dipendente dal carico del link (congestione della rete);
31
Routing egoistico della rete
Modellizzazione del problema E’ chiaro che un sistema del genere può essere ben modellato utilizzando la teoria dei giochi. giocatori utenti della rete azioni possibili percorsi attraverso cui gli utenti possono trasmettere il proprio traffico Assunzioni: tutti gli utenti agiscono in modo del tutto egoistico; il traffico di un utente è inoltrato tutto su di uno stesso percorso e contemporaneamente; ogni utente controlla una frazione trascurabile dell’intero flusso.
32
Routing egoistico della rete-Modello Modello di una rete
Un grafo diretto G = (V,E); k coppie origine-destinazione ; ammontare del traffico da , i = 1,2, ...,k; un insieme di cammini da ; un insieme ; per ogni arco con traffico , una funzione di latenza ;
33
Routing egoistico della rete-Modello
è non negativa, differenziabile e non decrescente; un vettore di flusso = quantità di traffico del tratto in ; per ogni arco il flusso ; un flusso si dice ammissibile se per ogni i: chiamiamo la tripla un’ istanza. ammissibile o possibile?
34
Routing egoistico della rete-Modello
La latenza di un cammino risulta essere: il costo di tutti i flussi = latenza totale, risulta: Flussi e Teoria dei giochi flusso la moltitudine di agenti non cooperativi latenza totale funzione (o benessere) sociale
35
Routing egoistico della rete-Modello
Esempio: Una unità di traffico deve andare da s a t il ritardo dipende dalla congestione 1/2 s t 1/2 nessun effetto di congestione Ognuno dei due cammini porta metà del traffico complessivo.
36
Routing egoistico-”Paradosso di Braess"
Esempio: “Paradosso di Braess”(1968) Sia s un quartiere, t una stazione ferroviaria. Due conducenti vogliono andare e tornare da s a t. Per il momento, assumiamo che ci siano due rotte che non interferiscono tra loro, ognuna comprendente una strada lunga e larga, e una corta e stretta. Per simmetria, ci aspettiamo che ognuno dei due cammini porti metà del traffico complessivo, cosicché tutti i conducenti impiegano 90 minuti (1,5) per viaggiare da s a t.
37
Routing egoistico-”Paradosso di Braess"
v 1 x Latenza= =1.5 1/2 s t 1/2 1 x w Supponiamo ora, con l’obiettivo di diminuire i tempi, di poter introdurre una strada molto corta e molto larga che collega direttamente i punti intermedi delle due strade, con funzione di latenza nulla(indipendente dalla congestione della strada).
38
Routing egoistico-”Paradosso di Braess"
Come reagiscono i conducenti? Ogni conducente può risparmiare 30 minuti di viaggio (assumendo che gli altri utenti non cambino rotta), seguendo il cammino s → v → w → t. Supponiamo che tutti i conducenti, volendo usare la nuova strada, devino i loro cammini precedenti, per seguire il cammino s → v → w → t. v x 1 Latenza = 1+1 =2 s t 1 x w
39
Routing egoistico-”Paradosso di Braess"
A causa della forte congestione sui tratti (s, v) e (w, t), tutti i conducenti impiegano 2 ore per andare e tornare da s a t. Inoltre questa congestione implica che nessuno dei due cammini precedenti risulti essere migliore, in questo modo nessuno dei conducenti è incentivato a cambiare strada. Ancora peggio, ogni altro modello di traffico è instabile: tutti i conducenti sarebbero incentivati a cambiare cammino. E’ quindi ragionevole aspettarsi che tutti i conducenti seguano il cammino s → v → w → t e che quindi impieghino 30 minuti in più(0.5) del modello originale. Ne segue:
40
Flussi di Nash Routing egoistico della rete-Flussi di Nash Definizione
Un flusso ammissibile per l’istanza è a Equilibrio di Nash se per ogni e , , dove se altrimenti
41
Routing egoistico della rete-Flussi di Nash
Principio di Wardrop Lemma Un flusso ammissibile per l’istanza è a Equilibrio di Nash se e solo se per ogni e , con , vale In particolare, tutti i cammini a cui la assegna quantità positiva di flusso hanno la stessa latenza, si indica con
42
Routing egoistico della rete-Flussi di Nash Proposizione
Se è un flusso a Equilibrio di Nash per l’istanza , allora
43
Routing egoistico della rete-Flussi ottimali
Un flusso ottimale è un flusso che minimizza la latenza totale. Programmazione Convessa s.a. dove
44
Routing egoistico della rete-Flussi ottimali
Soluzione (flusso ottimale) La funzione obiettivo è convessa, ottimo locale = ottimo globale; Siano Lemma 1 Un flusso è ottimale per un programma convesso della forma(NPL) se e solo se per ogni e ,con vale def di funzione convessa(da “thesis”
45
Routing egoistico della rete-Flussi ottimali
Interpretazione di Beckmann Corollario Sia un’istanza con funzione convessa per ogni arco , con costo marginale . Allora un flusso ammissibile per è ottimale se e solo se è un flusso di Nash per l’istanza
46
Routing egoistico della rete-Equilibri di Nash
Esistenza di Equilibri di Nash Lemma Un’ istanza , con funzione di latenza continua, non decrescente, ammette un flusso ammissibile di Nash. Inoltre, se sono flussi di Nash, allora
47
Il prezzo dell’ anarchia nella rete
Routing egoistico della rete-Prezzo dell’anarchia Il prezzo dell’ anarchia nella rete Definizione Per un’ istanza con un flusso ottimale e un flusso di Nash , il prezzo dell’anarchia limite superiore buono ma non ottimo Corollario: se , con , allora
48
Routing egoistico della rete-Prezzo dell’anarchia
Corollario: se con intero positivo e reali non negativi, allora Es. Osservazione In particolare, questo corollario afferma che in un’istanza con funzione di latenza lineare (cioè ogni funzione di latenza ha la forma con ), il costo di un flusso di Nash è al più il doppio del costo del flusso di minima latenza.
49
Routing egoistico della rete-Prezzo dell’anarchia
Risultati Bicriteri Teorema Se è un flusso di Nash per e è ammissibile per , allora Se è un flusso di Nash per e è ammissibile per , allora
50
Altri risultati per funzioni di latenza lineari
Routing egoistico della rete-Prezzo dell’anarchia Per ogni arco * denotiamo la funzione del costo marginale Altri risultati per funzioni di latenza lineari Lemma Sia un’istanza con funzioni di latenza per ogni Allora un flusso è di Nash in se e solo se per ogni coppia i sorgente-destinazione e con ,
51
un flusso è ottimale in se e solo se per ogni
Routing egoistico della rete-Prezzo dell’anarchia un flusso è ottimale in se e solo se per ogni coppia i sorgente-destinazione e con Corollario Sia una rete in cui la funzione di latenza di ogni arco è della forma , allora per ogni vettore di costo , un flusso ammissibile per è ottimale se e solo se è un flusso di Nash.
52
* Routing egoistico della rete-Prezzo dell’anarchia Lemma 2
Supponiamo che abbia funzioni di latenza linerari e che sia un flusso di Nash, allora il flusso è ottimale per , il costo di crescita marginale del flusso sul cammimo rispetto a equivale alla latenza di con flusso Lemma 3 Supponiamo che abbia funzioni di latenza linerari e che sia un flusso ottimale. Sia il costo marginale di crescita del flusso su un cammino rispetto a . Allora per ogni un flusso ammissibile in ha almeno costo * with resperct? controllare…
53
Sia un’istanza e , allora
Routing egoistico della rete-Prezzo dell’anarchia Teorema Se ha funzione di latenza lineare, allora dim Altri risultati per funzioni di latenza generiche Sia un’istanza e , allora
54
Routing egoistico della rete-Prezzo dell’anarchia
Conclusione Attualmente, non ci sono ulteriori risultati per istanze con generiche funzioni di latenza, ma le buone prestazioni di Internet, che osserviamo quotidianamente, possono essere una prova che esiste una modellizzazione per tali casi con un “ragionevole” prezzo dell’anarchia .
55
Dimostrazione lemma3 * lemma2 (parte b)
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.