Teoria dei giochi Teoria che analizza in modo formale linterazione strategica di soggetti razionali che agiscono in modo strategico Situazione strategica Dieci persone si recano insieme al ristorante a) Si paga alla romana semplice problema di scelta (Max U s.t. VdB) Ciascuno è in grado di controllare autonomamente il risultato delle sue scelte b) Si paga dividendo il conto per 10 problema strategico Non riesco a controllare la mia spesa Il risultato delle mie azioni dipende anche dalle scelte degli altri
Gioco insieme astratto di regole che vincolano il comportamento dei giocatori definiscono i risultati sulla base delle azioni che essi intraprendono Il gioco è le regole
In un gioco vi sono tre elementi caratteristici 1)I giocatori (A,B,C…) 2)Le strategie a loro disposizione Per ogni giocatore le regole stabiliscono un insieme di strategie (S A,S B,S C ….) Le mosse che le regole rendono possibili (s i S i ) 3) I Payoffs associati agli esiti finali del gioco i ( s A,s B,s C ….)
Rappresentazione di un gioco Forma normale: matrice delle vincite Forma estesa: albero del gioco
Forma Normale Uso di matrice a doppia entrata Le righe rappresentano le mosse che può compiere il giocatore di riga Le colonne rappresentano le mosse che può compiere il giocatore di colonna In ogni cella sono rappresentate le vincite che i due giocatori (di riga e di colonna) ottengono attuando le mosse raffigurate nelle corrispondenti righe e colonne
Esempio Giocatori B A SinistraDestra Alto1, 20, 1 Basso2, 11, 0 Strategie BStrategie AUno dei 4 esiti del giocoPayoff APayoff B
Forma estesa Albero del gioco: descrive le regole e i possibili premi di un gioco Nodo: punto decisionale dovè indicata lidentità del giocatore cui spetta la mossa Rami: rappresentano le scelte fatte nei nodi
A B B Dx Non Sx Dx Sx 2, 31, 2 2, 0 0, 1 Forma estesa RamiNodi Uno dei 4 esiti del gioco Payoff A Payoff B
Ipotesi sul comportamento dei giocatori Razionalità - Sono interessati a massimizzare il payoff materiale individuale - Sono calcolatori perfetti - Tutti conoscono la razionalità degli altri e si aspettano che gli altri si comportino in modo razionale
Classificazione dei giochi Cooperativi i giocatori possono assumere degli impegni che hanno valore VINCOLANTE NON Cooperativi i giocatori NON possono assumere degli impegni che hanno valore VINCOLANTE Informazione completa Informazione incompleta Tutte le informazioni del gioco sono note a tutti i giocatori NON tutte le informazioni del gioco sono note a tutti i giocatori
Soluzione dei giochi Equilibrio per un gioco: situazione in cui nessun giocatore desidera modificare il suo comportamento unilateralmente dato il comportamento degli altri giocatori
Equilibrio di Nash Lequilibrio di Nash si definisce strategicamente stabile o autovincolante perché nessun giocatore, singolarmente preso, desidera deviare dalla propria strategia di equilibrio ferme restando le strategie adottate dagli altri giocatori Un insieme di strategie, una per ogni giocatore, tale che la strategia di ogni giocatore sia la migliore per lui, quando anche gli altri giocatori giochino la loro strategia di equilibrio
Equilibrio di Nash Diremo che un vettore n dimensionale (n è il numero dei giocatori) È un equilibrio di Nash se e solo se E questo sia vero per ogni i (per ogni giocatore) e per ogni Payoff che ottiene il giocatore i-esimo quando sceglie di deviare dalla strategia di Nash giocando una strategia diversa e tutti gli altri continuino a giocare la strategia di Nash Payoff che ottiene il giocatore i-esimo quando egli gioca la strategia di Nash e quando tutti gli altri giocano la strategia di Nash
Equilibrio di Nash Il giocatore i-esimo, cosi come tutti gli altri, non può ottenere un payoff superiore giocando una strategia diversa se gli altri continuano a giocare la strategia di Nash Nessun giocatore ha lincentivo a cambiare le sue scelte se gli altri non lo fanno
Equilibrio di Nash è la soluzione del problema Può essere vista come la ottima risposta del giocatore i-esimo alle mosse degli altri giocatori Possiamo definire una risposta ottima per ogni strategia degli altri giocatori costruendo una funzione di risposta ottima BRF funzione di risposta ottima Lequilibrio di Nash sarà caratterizzato dal fatto che per tutti i giocatori è una risposta ottima alle scelte degli altri
Come si trova lequilibrio di Nash strategia che risulta migliore (garantisce più alti payoffs) per un giocatore indipendentemente dalle strategie adottate dagli altri giocatori Strategia DOMINANTE Strategia DOMINATA strategia che risulta inferiore (garantisce più bassi payoffs) per un giocatore indipendentemente dalle strategie adottate dagli altri giocatori Se esiste una strategia dominante un giocatore razionale giocherà QUELLA Se esiste una strategia dominata un giocatore razionale non la giocherà MAI
B B1b2B3 a10,32,21,3 Aa22,13,22,3 a35,11,41,0 Esempio: prendiamo i due giochi che seguono B B1b2B3 a11,32,41,3 Aa22,13,21,1 a35,14,42,0 Strategia Dominata Strategia Dominante
B B1b2B3 a10,32,21,3 Aa22,13,22,3 a35,11,41,0 Eq. di Nash. Come si trova lequilibrio di Nash Eliminazione iterata delle strategie dominate Vengono eliminate via le strategie dominate finche non si ottiene lequilibrio di Nash ESEMPIOESEMPIO
Equilibrio di Nash verifica
B B1b2B3 a10,34,21,3 Aa22,13,22,3 a35,11,41,0 Problema non sempre è possibile trovare la soluzione di Nash utilizzando tale procedura Consideriamo lo stesso gioco di prima con la sola differenza rappresentata dal payoff del giocatore A nella in (a1,b2) Ora non ci sono né strategie dominate né strategie dominanti Per trovare la soluzione occorre utilizzare la funzione di risposta ottima (BRF) risposta ottima La migliore strategia che un giocatore può effettuare DATA la strategia scelta dagli ALTRI GIOCATORI Funzione di risposta ottima Linsieme delle risposte ottime di un giocatore
B b1b2b3 a10,34,21,3 Aa22,13,22,3 a35,11,41,0 Trovare l E.d.N. utilizzando la BRF Se il giocatore B sceglie b1 la migliore risposta di A è a3 Se il giocatore B sceglie b2 la migliore risposta di A è a1 Se il giocatore B sceglie b3 la migliore risposta di A è a2 Se il giocatore A sceglie a3 la migliore risposta di B è b2 Se il giocatore A sceglie a1 la migliore risposta di B è b1 o b3 Se il giocatore A sceglie a2 la migliore risposta di B è b3 E.d.N deve essere la coppia di strategie che è la risposta ottima di entrambi i giocatori
Limiti della definizione di equilibrio di Nash B b1b2 A a10, 10, -1 a21, 0-1, 2 Se prendiamo il gioco qui a lato e cerchiamo lequilibrio con il metodo della risposta ottima E evidente che non esiste un equilibrio di Nash per questo gioco
Strategie miste: strategie che definiscono combinazioni probabilistiche di tutte le possibile strategie pure del gioco Il giocatore non sceglie direttamente una mossa (ad esempio, a1) ma la probabilità con la quale adotterà ciascuna mossa Valore atteso strategia mista: media ponderata dei premi che il giocatore si aspetta di ricevere, ove i pesi sono le probabilità. del verificarsi di tali vincite Lequilibrio di Nash può non esistere in strategie pure Tuttavia se allarghiamo la definizione di strategie per considerare le strategie miste Si può dimostrare che se consideriamo le strategie miste esiste sempre un equilibrio di Nash
Limiti della definizione di equilibrio di Nash Lei OperaStadio Lui Opera1, 20, 0 Stadio0, 02, 1 Consideriamo questo gioco classico La guerra dei sessi Esiste una molteplicità (due) di equilibri di Nash Quale selezionare ?
Limiti della definizione di equilibrio di Nash Molteplicità equilibri di Nash S PF D P-2, -22, 0 F0, 20, 0 Nino cb Luca c3, 30, 0 b 1, 1 Prendiamo due altri esempi di gioco Gioco dellincrocio Due auto (S e B) arrivano contemporaneamente allincrocio Possono Fermarsi o Passare Gioco dell appuntamento Due amici (Nino e Luca) devono andare al cinema ma si non si sono accordati su dove incontrarsi Davanti al cinema o al bar del Paese Qual è la differenza fra questi due giochi?
Molteplicità equilibri di Nash Nel caso del gioco dellincrocio gli equilibri di Nash non sono Pareto Ordinabili Nel caso del gioco dellappuntamento gli equilibri di Nash sono Pareto Ordinabili 2,0 e 0,2 1, 1 e 3, 3 Nel caso giochi ripetuti ed equilibri Pareto ordinabili allora vi sarà un endogeno coordinamento verso la soluzione Pareto Superiore Gioco in cui un numero fisso di giocatori effettua ripetutamente lo stesso gioco luno contro laltro I giocatori scelgono le loro mosse sulla base delle azioni compiute dalle rivali nei periodi precedenti Le strategie ed i comportamenti sono più complessi ma anche più realistici che nei giochi uniperiodali Folk Theorem Gioco Ripetuto In caso la questo ripetizione del gioco può far scomparire la molteplicità La differenza è importante quando si considerano giochi ripetuti
Molteplicità equilibri di Nash: giochi sequenziali Consideriamo il gioco dellincrocio, immaginando che lauto A si presenti per prima allincrocio Il gioco non è più simultaneo ma sequenziale, lauto A effettuerà la prima mossa e successivamente muoverà lauto B La rappresentazione del gioco a forma estesa è preferibile
Giochi sequenziali in forma estesa: induzione a ritroso Induzione a ritroso Si parte dai nodi finali del gioco e si analizzano le scelte dei giocatori fino a risalire allinizio del gioco B sceglierà P che gli dà 2 al posto di 0 A lo sa e sa che se sceglierà F prenderà 0 B sceglierà F che gli dà 0 al posto di -2 A lo sa e sa che se sceglierà P prenderà 2 A sceglierà P che gli garantisce 2 mentre se scegliesse F avrebbe 0
Minacce non credibili Pierino 1 2 M & P ZiaCinema PunireNon punire Gioco del bambino capriccioso
3,3 2, 1 3,3 2, 5 Induzione allindietro e perfezione nei sottogiochi Sottogioco
Molteplicità equilibri di Nash: meccanismi istituzionali Quando non esistono altri sistemi per eliminare la molteplicità degli equilibri possono intervenire dei meccanismi istituzionali che regolamentano il comportamento individuale e risolvono lambiguità Esempio classico il semaforo nel gioco dellincrocio Risolvere questo tipo di ambiguità è una delle spiegazioni della nascita delle istituzioni
Dilemma del prigioniero Due criminali che hanno commesso in complicità un grave delitto e sono detenuti in celle separate (non possono comunicare). Ci sono le prove solo per accusarli di un delitto minore la cui pena è 1 anno di reclusione Ogni prigioniero può confessare il delitto grave o tacere. Se confessa uscirà subito di prigione, mentre il complice avrà una pena di 20 anni di reclusione. Se entrambi confessano saranno condannati ad una pena intermedia di 5 anni. Se nessuno dei 2 confessa la pena sarà di 1 anno.
O.P Nash B ConfessaTace B Confessa 5, 50, 20 Tace 20, 01, 1 Dilemma del prigioniero LEQUILIBRIO DI NASH È SOTT'OTTIMALE (in senso Paretiano) rispetto ad un altro esito del gioco che sarebbe preferito da entrambi i giocatori ma che non è ottenibile Risultato paradossale Un comportamento teso a massimizzare il benessere individuale produce un risultato non ottimo da un punto di vista individuale
R TA B T3, 30, 4 A4, 01, 1 Pampers NFFP Lines NF 500,500150,750 FP 750,150250,250 Prendiamo due altri esempi di gioco Gioco del traffico Due soggetti (sig. Rossi e sig. Bianchi) devono decidere se prendere lauto o il tram Gioco della Pubblicità Due imprese devono decidere quanto investimento pubblicitario effettuare il prossimo anno Dilemma del prigioniero framework generale
Sotto-ottimalità dellequilibrio di Nash possibili soluzioni Meccanismi istituzionali Mafia, malavita organizzata dilemma del prigioniero Blocco del traffico gioco del traffico Modificano dallesterno la struttura degli incentivi Meccanismi endogeniaccordo fra i giocatori Non sono credibili perché in assenza di meccanismi istituzionali esterni qualsiasi accordo fra le parti non sarebbe rispettato
Dilemma del prigioniero e giochi ripetuti Ma nella realtà il gioco è spesso ripetuto Possono emergere dei meccanismi endogeni di punizione di comportamenti devianti Prendiamo il gioco della pubblicità Immaginiamo un accordo (esplicito o tacito) per non fare pubblicità Se una delle due aziende violasse laccordo di non fare pubblicità laltra farebbe pubblicità per sempre Allinizio di ogni periodo le due imprese devono decidere se violare o meno laccordo Meccanismo punitivo
Dilemma del prigioniero e giochi ripetuti Se si viola laccordo Se non si viola laccordo Ponendo e notando che sono serie convergentiSi ottiene
Dilemma del prigioniero e giochi ripetuti Se i giocatori sono sufficientemente pazienti (attribuiscono un peso adeguato ai guadagni futuri) Il risultato pareto ottimale può essere raggiunto Reputazione -- Credibilità Nota Il gioco deve durare allinfinito o avere una durata finita ma incerta