Cooperazione internazionale e free trade Elaborato da: Andreas Casellato Flavia Cozzo e Il dott. Simone Grandinetti
Il dilemma del Prigioniero Il Dilemma del Prigioniero è un caso di gioco non cooperativo a somma variabile con applicazione del Teorema di Nash. La polizia custodisce in celle diverse due individui accusati di essere complici di uno stesso crimine tuttavia,non disponendo di prove sufficienti,cercherà di indurre i due detenuti a confessare promettendo clemenza.
I due prigionieri non possono comunicare uno con l’altro. La polizia promette a ciascuno dei due prigionieri che qualora confessasse e l’alto no,verrebbe scagionato. I due prigioniere devono decidere se confessare (strategia C) o non confessare (strategia NC). La seguente tabella mostra il numero di anni inflitti ai due prigionieri nei diversi casi.
NC C (-1;-1) (-6;0) (0;-6) (-5;-5)
L’equilibrio di Nash è individuato dalla combinazione (C;C) che comporta per entrambi una reclusione di 5 anni.Tale equilibrio è un risultato subottimale nel senso di Pareto perché è peggiore di quello che potrebbero ottenere se nessuno dei due confessasse. Se i due prigionieri potessero comunicare e stipulare un accordo vincolante,potrebbero entrambi adottare la strategia dominante (NC;NC) ed ottenere così solo 1 anno di reclusione.
Folk Theorem Quando il gioco viene ripetuto più volte esso dà vita ad un gioco differente denominato “supergioco”.La ripetizione del gioco costituente non genera necessariamente un gioco dinamico in senso proprio,in quanto non modificherà né la struttura dei payoffs né lo spazio delle strategie a disposizione dei giocatori.
E’ plausibile però interpretare come gioco dinamico un semplice gioco ripetuto,perché la ripetizione ha come effetto quello di modificare lo stock di informazioni a disposizione di ogni singolo giocatore ad ogni round successivo a quello iniziale. E’ quindi sulla base del proprio set informativo che ogni giocatore prende le proprie decisioni.
In un supergioco però la strategia di ogni giocatore non è più scelta di una singola mossa ma di una sequenza di mosse [st] dove “t” è l’indice temporale che può andare da 0 a T ,e T indica l’istante in cui si gioca l’ultima volta,oppure da o a ∞ , se il gioco non ha mai termine.
L’incrociarsi delle mosse dei giocatori dà luogo ad una sequenza di payoffs {gt} per ciascun giocatore. L’esito del supergioco è dato dalla somma opportunamente scontata,dei guadagni percepiti in ogni round ovvero della somma degli esiti ricevuti ogni volta che è stato giocato in round.
La soluzione del supergioco non è però necessariamente la ripetizione per T volte della soluzione del gioco costituente. La ripetizione porta infatti i giocatori ad affinare i loro criteri di scelta. In conclusione il Folk Theorem afferma che i giochi costituenti non cooperativi se vengono ripetuti un numero finito ma non noto di volte, possono portare i giocatori a cooperare a causa della paura di eventuali ritorsioni future (come avverrebbe in caso di orizzonte temporale infinito).
Applicazione formale del Folk Theorem Il problema cruciale alla base di tale teorema è se ai due giocatori conviene sempre adottare la stessa strategia oppure defezionare nel caso in cui il gioco venga ripetuto all’infinito. Se ad esempio il giocatore A collabora,ottiene un utilità pari a Vcoop , se defeziona consegue un utilità pari a Vdef e se entrambi non collaborano,pari a VNash. Vale la seguente disuguaglianza: Vdef > Vcoop >VNash.
Al tempo “t” ,se il giocatore A tradisce,ottiene un vantaggio incrementale paria a Vdef – Vcoop.Tuttavia in ogni periodo successiovo subirà una perdita pari a Vcoop-VNash perché l’avversario ritorcerà. Infatti una delle caratteristiche fondamentali di questo teorema è la sua implacabilità,nel senso che se un giocatore defeziona una volta,a partire dal round successivo,l’altro applicherà ritorsioni riportando così il gioco sull’equilibrio di Nash.
Risulta pertanto razionale non tradire l’implicito accordo cooperativo se l’incremento immediato nell’utilità è inferiore alle perdite che si verificano successivamente.Il problema consiste quindi nel valutare la dimensione di queste ultime.
Il valore attuale delle perdite future (VAP) per t Є [1;∞) è pari a: VAP= ∑ [1/ (1+r)t ] (Vcoop-VNash) Dato che “r”,tasso di sconto intertemporale,è compreso tra 0 e 1,allora 1/(1+r) sarà certamente minore di 1. ∑ (1/1+r)t (Vcoop-VNash)= (Vcoop-VNash)∑(1/1+r)t
Dalle proprietà delle serie geometriche e considerando il periodo “t” che va da 0 a ∞ otterremo: ∑ [1/ (1+r)]t = (1+r)/r La sommatoria che ci interessa parte però dal tempo t=1 e va all’infinito quindi avremo: ∑(1/1+r)t= [(1+r)/r]-(1/1+r)0= [(1+r)/r]-1 = 1/r
In conclusione converrà tenere fede all’accordo se il vantaggio incrementale che si ottiene defezionando l’accordo,è minore delle perdite successive divise per il tasso di sconto: (Vdef-Vcoop)< 1/r (Vcoop-V Nash) ricavo r ottenendo: r< (Vcoop-VNash) / (Vdef-Vcoop) La decisione se cooperare o no,defezionare o no, dipenderà quindi dal peso che il giocatore attribuisce ad “r”.
Se “r” è abbastanza basso si valutano come molto onerose le perdite future e quindi si deciderà di tener fede all’accordo. Se l’individuo è impaziente ed “r” è molto alto,giudicherà conveniente defezionare perché attribuisce scarso peso alle perdite future.
Cooperazione Internazionale e Free Trade Applicazione congiunta del Dilemma del prigioniero e del Folk Theorem All’interno della teoria delle relazioni internazionali ,la politica mondiale è comunemente ritenuta “anarchica”,intendendo con questo che l’emergere di una qualsiasi forma di cooperazione fra stati deve essere compatibile con il principio di sovranità.Questo,a sua volta,è compatibile con il criterio di reciprocità,il quale alla base,ad esempio,degli accordi sul commercio internazionale (Gatt,Nafta,Alca).
Per analizzare il problema dell’apertura al commercio internazionale come gioco non cooperativo,esaminiamo il caso di un mondo a due paesi: Paese 1 e Paese 2. Ciascun paese dispone di due strategie: F (free trade) e P (protezionismo) mutualmente esclusive. Tale gioco si può rappresentare con la seguente matrice in cui sono indicati i payoffs a seconda delle varie strategie adottate dai paesi 1 e 2.I numeri sono arbitrari ma scelti in modo da rispecchiare il problema.
Paese 2 Paese 1 P F (3;3) (12;1) (1;12) (8;8)
In questo gioco,il problema del free riding che sottende qualsiasi dilemma del prigioniero si manifesta nell’incentivo per ciascuno dei due paesi a tenere chiuse le proprie frontiere per tentare di sfruttare l’apertura unilaterale da parte dell’altro. Osservando la tabella infatti si nota che i maggiori payoffs per ciascun paese corrispondono al caso in cui uno applica barriere protezionistiche (ottenendo 12) e l’altro no.
Ovviamente siccome questo ragionamento (maggior convenienza nel protezionismo) vale per entrambi,l’equilibrio,unico e in strategie strettamente dominanti,è identificato dalla combinazione (P;P) che è inferiore nel senso di Pareto rispetto a (F;F) come accade nel dilemma del prigioniero.Non cooperando ed effettuando un unico round negoziale,l’equilibrio sarà sempre (P;P).
L’esempio appena illustrato mostra però il caso in cui l’interazione fra i due paesi è uniperiodale;si può quindi più realisticamente supporre che l’orizzonte temporale sia infinito,in quanto ,come detto precedentemente,i giocatori agiscono senza conoscere il temine ultimo del gioco.
Posto quindi che il gioco costituente si ripeta sull’orizzonte infinito, il Folk Theorem,ci assicura che i due paesi possano collocarsi in un equilibrio diverso e più efficiente rispetto a quello generato dal gioco costituente grazie alla cooperazione. Estendiamo quindi il caso esaminato precedentemente.
L’orizzonte temporale è definito da t Є[0,∞) e entrambi i paesi scontano il futuro usando lo stesso fattore δ Є [0,1]. ∑ ωi (F;F) δt ≥ ωi (P;F)+ ∑ ωi (P;P) δt L’espressione che compare sul lato sinistro è il payoffs in valore attuale associato al free trade dal primo periodo all’infinito. L’espressione che compare dei payoffs generato dalla deviazione unilaterale verso il protezionismo a t =0 e del flusso scontato dei payoffs scontati dall’equilibrio di Nash del gioco costituente da t = 1 all’infinito.
Entrambi i paesi decideranno di applicare una strategia di free trade solo se i payoffs associati a tale scelta,sono maggiori della somma dei payoffs in caso di deviazione da tale scelta (uno gioca P e l’altro F) e conseguente ritorsione (se uno gioca P anche l’altro giocherà P) dell’altro giocatore.
Siccome:si possono applicare le seguenti trasformazioni matematiche otterremo: ∑ δt = 1/ (1- δ) ↔ ∑ δt = ∑ δt – 1 = 1/(1-δt)-1 = δ/(1- δ) La disuguaglianza: ∑ ωi (F;F) δt ≥ ωi (P;F)+ ∑ ωi (P;P) δt [ωi (F;F)]/[1- δ] ≥ ωi (P;F)+ δ/(1- δ) ωi (P;P) Dalla quale si ricava: δ≥[ ωi (P;F)-ωi (F;F)]/[ωi (P;F)- ωi (P;P)]=δ*
Questa è la condizione di stabilità che le preferenze intertemporali devono soddisfare affinchè il gioco ripetuto abbia come equilibrio perfetto nei sottogiochi l’esito (F;F). La suddetta strategia seguita da ciascun giocatore è denominata trigger strategy in quanto prevede la modifica del comportamento di un giocatore nel caso in cui l'altro giocatore non abbia cooperato nel periodo precedente. Altrimenti se δ Є [0, δ*) allora l’esito dell’equilibrio è (P;P) per tutti i t Є [0,1).
Quindi la ripetizione del gioco su orizzonte infinito consente ai due paesi di sostenere il free trade come esito di equilibrio per sempre. Inoltre l’accordo può diventare “vincolante”, per la mediazione del GATT prima e della WTO oggi.
Caso reale:paese egemone e paese non egemone L’esempio illustrato precedentemente si può applicare a due paesi ,o aree economiche,allo stesso stadio di sviluppo economico;nella realtà attuale vi sono invece paesi arretrati rispetto ad altri.Ciò comporta una disparità decisionale nel campo commerciale. La matrice successiva ci mostra un’applicazione reale riferita a quest’ultimo caso.
Paese piccolo Paese grande P F (1;1) (4;3) (2;2) (3;4)
Come si può notare dalla matrice il paese piccolo ha una strategia strettamente dominante cioè F,mentre il paese grande non ce l’ha.Tuttavia,per dominanza iterata,una volta scartata la prima colonna della matrice,risulta ottimale per esso giocare P. Esisterà quindi un unico equilibrio ottenuto per dominanza iterata che è (P;F) .