Teoria dei giochi Teoria che analizza in modo formale l’interazione strategica di soggetti razionali che agiscono in modo strategico Situazione strategica Sette persone si recano insieme al ristorante Si paga alla romana semplice problema di scelta (Max U s.t. VdB) Ciascuno è in grado di controllare autonomamente il risultato delle sue scelte b) Si paga dividendo il conto per 7 problema strategico Non riesco a controllare la mia spesa Il risultato delle mie azioni dipende anche dalle scelte degli altri
insieme astratto di regole Gioco insieme astratto di regole definiscono i risultati sulla base delle azioni che essi intraprendono che vincolano il comportamento dei giocatori Il gioco è le regole
In un gioco vi sono tre elementi caratteristici In un gioco vi sono tre elementi caratteristici
Rappresentazione di un gioco Forma normale: matrice delle vincite Forma estesa: albero del gioco
Esempio Giocatori Strategie B Payoff B Payoff A Strategie A Sinistra Destra Alto 1 , 2 0 , 1 Basso 2 , 1 1, 0 Payoff B Payoff A Strategie A Uno dei 4 esiti del gioco
Forma estesa Rami Nodi A B Dx 2 , 3 1 , 2 2 , 0 0 , 1 Non Sx Uno dei 4 esiti del gioco Payoff A Payoff B
Classificazione dei giochi i giocatori possono assumere degli impegni che hanno valore VINCOLANTE Cooperativi i giocatori NON possono assumere degli impegni che hanno valore VINCOLANTE NON Cooperativi Informazione completa Tutte le informazioni del gioco sono note a tutti i giocatori Informazione incompleta NON tutte le informazioni del gioco sono note a tutti i giocatori
Classificazione dei giochi Giochi a somma zero il guadagno di un giocatore CORRISPONDE sempre alla perdita di un altro giocatore Giochi NON a somma zero La somma delle vincite (o delle perdite) dei giocatori NON È COSTANTE Giochi statici I giocatori fanno le loro mosse SIMULTANEAMENTE I giocatori fanno le loro mosse SEQUENZIALMENTE Giochi dinamici Giochi one-shot Vengono giocati UNA SOLA volta Vengono giocati PIÙ VOLTE fra gli stessi giocatori Giochi ripetuti
Soluzione dei giochi Equilibrio per un gioco: situazione in cui nessun giocatore desidera modificare il suo comportamento unilateralmente dato il comportamento degli altri giocatori
Equilibrio di Nash Un insieme di strategie, una per ogni giocatore, tale che la strategia di ogni giocatore sia la migliore per lui, quando anche gli altri giocatori giochino la loro strategia di equilibrio L’equilibrio di Nash si definisce strategicamente stabile o autovincolante perché nessun giocatore, singolarmente preso, desidera deviare dalla propria strategia di equilibrio ferme restando le strategie adottate dagli altri giocatori
Equilibrio di Nash B b1 b2 b3 a1 0,3 2,2 1,3 A a2 2,1 3,2 2,3 a3 5,1 La strategia (a2,b3) è un equilibrio di Nash perché né A né B hanno l’incentivo a cambiare strategia data la scelta dell’altro giocatore B b1 b2 b3 a1 0,3 2,2 1,3 A a2 2,1 3,2 2,3 a3 5,1 1,4 1,0 Se A cambiasse otterrebbe 1 giocando a1 e 1 giocando a3 Se B cambiasse otterrebbe 1 giocando b1 e 2 giocando b2
Equilibrio di Nash B b1 b2 b3 a1 0,3 2,2 1,3 A a2 2,1 3,2 2,3 a3 5,1 La strategia (a2,b3) è un equilibrio di Nash perché né A né B hanno l’incentivo a cambiare strategia data la scelta dell’altro giocatore B b1 b2 b3 a1 0,3 2,2 1,3 A a2 2,1 3,2 2,3 a3 5,1 1,4 1,0 A preferirebbe il 5 di (a3,b1) ma (a3,b1) non è un equilibrio perché B cambierebbe la sua scelta in b2 ma allora A si sposterebbe in a2 infine B si sposterebbe in b3 da qui NON ci si muove più L’equilibrio non produce né per A né per B necessariamente il payoff più alto
BRF funzione di risposta ottima Equilibrio di Nash è la soluzione del problema Può essere vista come la ottima risposta del giocatore i-esimo alle mosse degli altri giocatori Possiamo definire una risposta ottima per ogni strategia degli altri giocatori costruendo una funzione di risposta ottima BRF funzione di risposta ottima L’equilibrio di Nash sarà caratterizzato dal fatto che per tutti i giocatori è una risposta ottima alle scelte degli altri
Come si trova l’equilibrio di Nash strategia che risulta migliore (garantisce più alti payoffs) per un giocatore indipendentemente dalle strategie adottate dagli altri giocatori Strategia DOMINANTE Se esiste una strategia dominante un giocatore razionale giocherà QUELLA Se esiste una strategia dominata un giocatore razionale non la giocherà MAI strategia che risulta inferiore (garantisce più bassi payoffs) per un giocatore indipendentemente dalle strategie adottate dagli altri giocatori Strategia DOMINATA
Strategia (debolmente) DOMINANTE Strategia (debolmente) DOMINATA Definzione strategia che risulta non peggiore (garantisce payoffs non inferiori) per un giocatore indipendentemente dalle strategie adottate dagli altri giocatori Strategia (debolmente) DOMINANTE strategia che risulta non superiore (garantisce payoffs non più alti) per un giocatore indipendentemente dalle strategie adottate dagli altri giocatori Strategia (debolmente) DOMINATA
Esempio: prendiamo i due giochi che seguono Strategia Dominante B b1 b2 b3 a1 0,3 2,2 1,3 A a2 2,1 3,2 2,3 a3 5,1 1,4 1,0 B b1 b2 b3 a1 1,3 2,4 A a2 2,1 3,2 1,1 a3 5,1 4,4 2,0 Strategia Dominata
Esempio: prendiamo questi altri due giochi Gli unici valori differenti sono i payoffs segnati in rosso Strategia debolmente Dominante B b1 b2 b3 a1 0,3 3,2 1,3 A a2 2,1 2,3 a3 5,1 1,4 1,0 B b1 b2 b3 a1 1,3 2,4 A a2 2,1 3,2 1,1 a3 5,1 4,4 Strategia debolmente Dominata
Come si trova l’equilibrio di Nash 0,3 4,2 1,3 A a2 2,1 3,2 2,3 a3 5,1 1,4 1,0 Non ci sono né strategie dominate né strategie dominanti Per trovare la soluzione occorre utilizzare la funzione di risposta ottima (BRF) La migliore strategia che un giocatore può effettuare DATA la strategia scelta dagli ALTRI GIOCATORI risposta ottima Funzione di risposta ottima L’insieme delle risposte ottime di un giocatore
Trovare l’ E.d.N. utilizzando la BRF B b1 b2 b3 a1 0,3 4,2 1,3 A a2 2,1 3,2 2,3 a3 5,1 1,4 1,0 E.d.N deve essere la coppia di strategie che è la risposta ottima di entrambi i giocatori Se il giocatore B sceglie b1 la migliore risposta di A è a3 Se il giocatore B sceglie b2 la migliore risposta di A è a1 Se il giocatore B sceglie b3 la migliore risposta di A è a2 Se il giocatore A sceglie a1 la migliore risposta di B è b1 o b3 Se il giocatore A sceglie a2 la migliore risposta di B è b3 Se il giocatore A sceglie a3 la migliore risposta di B è b2
Limiti della definizione di equilibrio di Nash P dx cx sx 0,2 2,0 A Gioco del calcio di rigore cerchiamo l’equilibrio con il metodo della risposta ottima E’ evidente che non esiste un equilibrio di Nash per questo gioco
Esiste una molteplicità (due) di equilibri di Nash equilibrio di Nash Consideriamo questo gioco classico La guerra dei sessi Lui Opera Stadio Lei 1 , 2 0 , 0 2 , 1 Esiste una molteplicità (due) di equilibri di Nash Quale selezionare ?
Limiti della definizione di equilibrio di Nash Molteplicità equilibri di Nash Prendiamo un altro gioco Gioco dell’incrocio Due auto (S e D) arrivano contemporaneamente all’incrocio Possono Fermarsi o Passare S P F D -2, -2 2 , 0 0 , 2 0 , 0
Molteplicità equilibri di Nash: giochi sequenziali Consideriamo il gioco dell’incrocio, immaginando che l’auto A si presenti per prima all’incrocio Il gioco non è più simultaneo ma sequenziale, l’auto A effettuerà la prima mossa e successivamente muoverà l’auto B La rappresentazione del gioco a forma estesa è preferibile
Giochi sequenziali in forma estesa: induzione a ritroso Induzione a ritroso Si parte dai nodi finali del gioco e si analizzano le scelte dei giocatori fino a risalire all’inizio del gioco B sceglierà P che gli da 2 al posto di 0 A lo sa e sa che se sceglierà F prenderà 0 B sceglierà F che gli da 0 al posto di -2 A lo sa e sa che se sceglierà P prenderà 2 A sceglierà P che gli garantisce 2 mentre se scegliesse F avrebbe 0
Molteplicità equilibri di Nash: meccanismi istituzionali Quando non esistono altri sistemi per eliminare la molteplicità degli equilibri possono intervenire dei meccanismi istituzionali che regolamentano il comportamento individuale e risolvono l’ambiguità Gioco dell’incrocio il semaforo, regola codice della strada guerra dei sessi Se il rapporto dura nel tempo, la coppia cerca una regola di buona convivenza Risolvere questo tipo di ambiguità è una delle spiegazioni della nascita delle istituzioni
Criterio Paretiano (da W. Pareto) Abbiamo visto che l’individuo ordina i panieri alternativi secondo le sue preferenze e scegli il paniere che massimizza il suo benessere dati i vincoli cui è soggetto Come possiamo confrontare allocazioni che coinvolgano più di un soggetto L’utilità non è misurabile Non possiamo semplicemente sommare la soddisfazione individuale Problema Esiste un punto di vista sociale per valutare le allocazioni? Ci sono o no criteri che ci consentano di dire se l’allocazione A è superiore all’allocazione B, oppure se è vero il contrario? Allocazione = distribuzione di beni, benessere o quant’altro fra più soggetti Criterio Paretiano
Il “criterio di Pareto ” afferma quanto segue: oppure Criterio Paretiano Il “criterio di Pareto ” afferma quanto segue: Un’allocazione A è superiore a un’altra allocazione B, se almeno un soggetto preferisce A a B e nessuno preferisce B ad A (e viceversa). oppure Un’allocazione A è superiore a un’altra allocazione B, se in A tutti stanno altrettanto bene che in B e almeno uno sta meglio in A che in B A = (10, 3, 7) B = (10, 2, 7) C = (9, 5, 16) Non tutte le allocazioni sono Pareto Ordinabili
Criterio Paretiano (da W. Pareto) Un'allocazione è efficiente nel senso di Pareto se non ne esiste un'altra che sia migliore sulla base del principio di Pareto; cioè, se non è possibile migliorare il benessere di qualcuno senza peggiorare quello di qualcun altro Criterio di efficienza distributiva e non di equità
Dilemma del prigioniero Thelma e Louise sono complici in un grave delitto e sono detenute in celle separate (non possono comunicare). Ci sono le prove solo per accusarle di un reato minore la cui pena è 1 anno di reclusione Ogni prigioniera può confessare il delitto grave o negare. Se confessa uscirà subito di prigione, mentre la complice avrà una pena di 10 anni di reclusione. Se entrambe confessano saranno condannate a una pena intermedia di 2 anni. Se nessuna delle due confessa la pena sarà di 1 anno.
Dilemma del prigioniero L’EQUILIBRIO DI NASH È SOTT'OTTIMALE (in senso Paretiano) rispetto ad un altro esito del gioco che sarebbe preferito da entrambi i giocatori ma che non è ottenibile Nota: essendo anni di prigione si tende a minimizzare i payoffs Louise Nega Accusa Thelma 1 , 1 10 , 0 0 , 10 5 , 5 Risultato paradossale Un comportamento teso a massimizzare il benessere individuale produce un risultato non ottimo da un punto di vista individuale O.P Nash
Dilemma del prigioniero Accusa è la strategia dominante per entrambe Louise Nega Accusa Thelma 1 , 1 10 , 0 0 , 10 5 , 5
Dilemma del prigioniero framework generale Le fattispecie di questo tipo sono molto diffuse nel mondo reale Gioco del lavoro di gruppo a scuola Ana e Beatrix devono fare un lavoro i gruppo per cui saranno valutate congiuntamente L’insegante non può valutare chi ha fatto cosa), ma devono lavorare separatamente
Dilemma del prigioniero Gioco del lavoro di gruppo Ipotesi Entrambe partono da una valutazione di 2 (parte del compito già svolta) Lavorare stanca (entrambe giudicano lavorare come perdere 4 punti) Se entrambe lavorano otterranno il punteggio massimo, 6 punti, il punteggio netto (tenendo conto di a) e b) sarà 2+6–4 = 4; Se entrambe non lavorano non guadagnano punti aggiuntivi, il punteggio è 0; il punteggio netto sarà 2+0-0 = 2 Se una sola lavora ottengono solo 3 punti e il punteggio netto sarà 2+3-4 = 1 per quella che lavora 2+3 = 5 per quella che non lavora
Dilemma del prigioniero framework generale Gioco del lavoro di gruppo Ana e Beatrix devono fare un lavoro i gruppo per cui saranno valutate congiuntamente Beatrix L NL Ana 4, 4 1 , 5 5, 1 2 , 2
Sotto-ottimalità dell’equilibrio di Nash possibili soluzioni Mafia, malavita organizzata dilemma del prigioniero Meccanismi istituzionali Modificano dall’esterno la struttura degli incentivi Se il gioco viene ripetuto Meccanismi endogeni accordo fra i giocatori
Dilemma del prigioniero e giochi ripetuti Nella realtà il gioco è spesso ripetuto Possono emergere dei meccanismi endogeni di punizione di comportamenti devianti Prendiamo il gioco della del lavoro di gruppo Immaginiamo un accordo (esplicito o tacito) per lavorare Se una delle due ragazze violasse l’accordo di fare la sua parte l’altra farebbe non collaborerebbe più Meccanismo punitivo Ogni volta che sono chiamate a collaborare, Ana e Beatrix devono decidere se collaborare o «fregarsi» a vicenda
Dilemma del prigioniero e giochi ripetuti Vantaggio immediato π Perdita futura 5 4 2 1 2 3 4 tempo
Dilemma del prigioniero e giochi ripetuti Se i giocatori sono sufficientemente pazienti (attribuiscono un peso adeguato ai guadagni futuri) Nota Il gioco deve durare all’infinito o avere una durata finita ma incerta Il risultato pareto ottimale può essere raggiunto Reputazione -- Credibilità