Clase 8 Teoría de Juegos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 10

NOTAS DE CLASE SOBRE JUEGOS DE

INFORMACIÓN INCOMPLETA: JUEGOS


BAYESIANOS ESTÁTICOS Y DINÁMICOS
María del Pilar Castillo V
June 15, 2016

1 Juegos Estáticos de Información incompleta o


Bayesianos (Tomado de Vega-Redondo))
Supongamos una situación en la que los jugadores no tienen información com-
pleta sobre el juego. En principio, esa falta de información está relacionada con
no saber con precisión cuál es el pago que puede obtener un jugador en el juego.
Esto necesariamente deberá afectar cómo los jugadores analizan su situación es-
tratégica y cómo hacen sus respectivas elecciones. Veamos el siguiente ejemplo
del juego de la batalla de los sexos modi…cado. Supongamos que Ana y Beto
se enfrentan simultáneamente a tomar una decisión de sí ir a cine o fútbol. Los
pagos para Beto son los que hemos trabajado en el juego original de la Batalla
de los sexos. Sin embargo, para la chica, ahora suponemos que sus pagos pueden
a priori ser de dos tipos: ella puede ser una ciné…la o puede ser una hincha fori-
bunda. Si ella es del primer tipo, siempre pre…ere ir al cine, no importa lo que
Beto haga. Si ella es del segundo tipo, su mejor opción siempre es ir a cenar,
independiente de lo que el chico decida. Sin embargo, para cualquiera de las dos
posibilidades, Ana preferirá estar en la compañía de Beto que ir sola a alguno
de los dos eventos.
Ana y Beto conocen sus preferencias, pero este último lo único que sabe de
los gustos de Ana están descritos en una de las siguientes tablas.
Ana/Beto Cine Cena Ana/Beto C F
C 3,2 2,1 Cine 1,2 0,1
F 0,0 1,3 Cena 2,0 3,3
Ana es ciné…la Ana es hincha
Beto, por tanto, asigna una probabilidad subjetiva a que la chica sea
ciné…la y 1 a que le encante ir a comer. En este contexto, el problema de
A los posibles lectores agradezco sus comentarios, críticas y sugerencias sobre esta versión
preliminar de las notas de clase

1
Ana es fácil, ella elige Cine o Fútbol, dependiendo de cuál sea su condición (esta
condición la llamamos estado del mundo). Para Beto su decisión dependerá del
valor de que le asigne a cada uno de los estados del mundo de Ana.

1.1 ¿Cómo modelar contextos en el que la información es


incompletamente distribuida entre jugadores?
En el caso que expusimos arriba, Ana tiene información completa sobre los
estados del mundo en los que ella decide, mientras que Beto no lo sabe. Entre
1967 y 1968, Harsanyi desarrolló una forma muy elegante y precisa de resolver
el problema de información asimétrica entre los jugadores. El propuso incluir en
el juego un jugador …cticio llamado Naturaleza o Azar, el cual tendría el papel
del agente que elige aleatoriamente, al comienzo del juego, cualquier situación
o detalle que no sea de dominio público. Su rol se concreta antes de que los
jugadores del juego tomen decisiones, y la información que produce la distribuye
asimétricamente entre los agentes. Cada jugador recibirá de este jugador inicial
una información privada que, en terminología de Harsanyi, es lo que se conoce
como el tipo del jugador.
Antes de iniciar el juego, la Naturaleza selecciona los diferentes tipos de
agentes e informa a cada uno de ellos, cuál es el tipo asignado. Cada uno
conoce su tipo pero no conoce el del adversario pero si sabe la distribución de
probabilidad con la que se asignan los tipos para un agente.
De acuerdo con Harsanyi, la formulización de un juego bayesiano consiste en
los siguientes elementos:

1. Un conjunto …nito N de jugadores


2. Para cada jugador i 2 N , tenemos
a) Un espacio de tipos Ti
b) Un conjunto de acciones puras Ai
c) Una función de pagos i :T A1 ::: An ! <
con T T1 ::::: Tn . como el espacio de conjuntos de tipos.
3. Una función de probabilidad: P : T ! [0; 1], el cual especi…ca las prob-
abilidades con las cuales la Naturaleza selecciona cada per…l de tipo t
(t1 ; t2 ; :::; tn ) 2 T
4. La estructural temporal de un juego bayesiano: en la primera etapa, la
Naturaleza o jugador etiquetado con 0, asigna el tipo ti 2 Ti para cada
jugador i 2 N . En la siguiente etapa, cada jugador i 2 N , es informado
de su tipo t y elige, en consecuencia, una estrategia de…nida como i :
Ti ! Ai .

De…nición: sea un juego Bayesiano, como el descrito anteriormente. El per…l


estratégico = ( i )ni=1 , : Ti ! Ai es un equilibrio Bayesiano si 8i =
1; 2; :::; n; 8 , tenemos que:

2
P
P (t) i (t; 1 (t1 ); ::; i (ti ); ::; n (tn ))
P
t2T
P (t) i (t; 1 (t1 ); ::; i (ti ); ::; n (tn ))
t2T

Volvamos al juego de la batalla de los sexos modi…cado, expresándolo en


forma extensa y asignándole probabilidades concretas a que Ana sea ciné…la o
a que Ana sea amante a los restaurantes. :

Cinéfila Hincha
Ana ρ=3/4 1-ρ=1/4 Ana

C F C F
Beto

C F C F C F C F

3,2 2,1 0,0 1,3 1,2 0,1 2,0 3,3

La forma estratégica del juego:

N = fN aturaleza, Ana, Betog, n o


AA AB = fC; F g ; TA = fCi nef ila (t1 ), Hincha (t2 )g ; TB = U nico
SA = fCC; CF; F C; F F g, SB AB ;
Pr ob(Ana sea ciné…la)= = 43 ; Pr ob(Ana sea hincha)=(1 ) = 14

Elegimos candidatos a ser equilibrios Bayesianos perfectos del conjunto de


estrategias de Ana o Beto pero como para Beto su conjunto tiene un cardinal
más pequeño, nos es más fácil evaluar sus estrategias como posibles candidatos
a equilibrios Bayesianos perfectos. Tomemos: Cine. Asumimos que Beto eligió
esta estrategia, nos preguntamos cuál es la mejor respuesta de Ana a Beto. Su
elección dependera de su tipo:

Estrategia de Ana CC CF FC FF
t1 3 3 0 0
t2 1 2 1 2
Candidato C de Beto

De esta tabla se intuye que si es tipo 1 elige C y si es tipo 2 elige F, de


forma que su mejor respuesta es CF a la estrategia C de Beto. Ahora, ¿cuál

3
es la mejor respuesta de Beto a CF de Ana? Esta dependerá de las conjeturas
que Beto tenga sobre el tipo de Ana. Dado que es un juego simultáneo, en el
que no hay señales, las conjeturas que Beto se forme no serán distintas a las
probabilidades que usa la Naturaleza para elegir los diferentes tipos de Ana y
que ya le fue revelado. Sea B (tipo cinef ila j tipo unico) la creencia que Beto
tiene acerca de que Ana sea del tipo 1 dado que es del tipo único, por tanto,
3
B (tipo cinef ila j tipo unico) = 4 . Con base en este sistema de creencias
hallamos los pagos esperados de Beto:
3 1
e
B (CF; C j B (:)) =2 4 +0 4 = 21
3 1
e
B (CF; F j B (:)) = 1 4 +3 4 = 12

Beto será indiferente o elegira ambas: C o F. El equilibrio Bayesiano perfecto


estará de…nido: sAna = CF ; sBeto = C más el sistema de conjeturas B (tipo
cinef ila j tipo unico) = 34 :o sAna = CF ; sBeto = F más el sistema de conjeturas
3
B (tipo cinef ila j tipo unico) = 4 o, una mixta entre las dos.
Tomamos el segundo canditato a Equilibrio Bayesiano Perfecto: Beto elige
Fútbol. ¿Cuál es la mejor respuesta de Ana?

Estrategia de Ana CC CF FC FF
t1 2 2 1 1
t2 0 3 0 3
Candidato F de Beto

De acuerdo con la tabla, tenemos que CF. Por tanto, Ana tiene una estrategia
dominante con la que responde a cualquier estrategia que elija Beto.

1.2 UNA APLICACIÓN ECONÓMICA DE LOS JUE-


GOS BAYESIANOS PERFECTOS: SUBASTAS
Dos agentes o licitantes acuden a una subasta para comprar un objeto: "la
boína del Ché Guevara". Cada uno ha de entregar en sobre cerrado su puja o
licitación que puede ser 100, 200 o 300. Se abren los sobres y se adjudica la
boína a aquel que ofrezca la puja más alta. Si las pujas son iguales, se adjudica
a uno de ellos con probabilidad igual a un medio. El licitante que se lleve el
objeto, ha de pagar por el objeto la puja que hizo. Suponemos que uno de los
licitantes tiene información privada sobre sus valoraciones mientras que el otro
no. El licitante informado tiene dos posibles valoraciones: 300 0 400. Mientras
que la valoración del jugador desinformado es de 350 y es de dominio público,
él sabe que la probabilidad de que el agente 1 valore en 300 el objeto es de 1/3.

4
N
V= 300 V= 400
(1/3) (2/3)

J1 J1

J1/J2 100 200 300 J1/J2 100 200 300


100 100,125 0,150 0,50 100 150,125 0,150 0,50
200 100,0 50,75 0,50 200 200,0 100,75 0,50
300 0,0 0,0 0,25 300 100,0 100,0 50,25
J2 valoración 350 J2 valoración 350

Describamos la forma estratégica del juego: N = fN, J1 ; J2 g, A1 = A2 =


f100; 200; 300g; T1 = ftipo1, tipo 2g = f300; 400g; T2 = f350g, y las probabili-
dades a priori: Pr ob( 300) = Pr ob( 400) = 21 ; Pr ob( 350) = 1:
Una estrategia para cualquiera de dos jugadores se de…ne como una función
que va desde el conjunto de tipos al conjunto de acciones si : Ti ! Ai . 8i 2 N
de forma que S1 = f100200; 100200; 100300; 200100; 200200; 200300; 300100; 300200; 300300g
y S1 = f100; 200; 300g. Los pagos de los jugadores vienen dados por:

vi ai si ai m aj
vi ai
i (ai ; aj ; vi ; vj ) =f 2 si ai = aj con i,j = 1; 2; i 6= j
0 si ..ai l aj

Para encontrar los equilibrios Bayesianos perfectos (EBP), tomamos can-


didatos del conjunto de estrategias de los jugadores, en este caso, tomamos el
conjunto con el cardinal más pequeño. De…nimos un EBP, como un per…l de
estrategias, una para cada jugador y un sistema de creencias o conjeturas.
Tomamos como candidato a EBP la estrategia 100 del jugador 2, ¿Cuál es
la mejor respuesta del jugador 1? Si es tipo 1 elige 100 o 200, y si es tipo 2
elige 300:En este sentido tenemos dos mejores respuestas de 1 a la estrategia
100 del jugador 2: 100300 y 200300. Tomamos el primero evaluamos cuál es la
mejor respuesta del jugador 2. Este jugador basará su elección en su sistema
de conjeturas: Sea 2 (300 j 350) la probabilidad que asigna el jugador 2 a
que el jugador 1 sea del tipo 300 cuando él es tipo 350 (único). Por tanto,
1
2 (300 j 350) = 2 y sus pagos esperados de sus acciones serán como:

5
1
e
2 (100300; 100) = ( 2 125) + ( 12 0) = 62; 5
1
e
2 (100300; 200) = ( 2 150) + ( 12 0) = 75
1
e
2 (100300; 300) = ( 2 50) + ( 12 25) = 37; 5

El jugador 2 responde con 200, no hay EPB. Ahora evaluamos cuál es la


mejor respuesta del jugador 2 a 200300.
1
e
2 (200300; 100) = ( 2 0) + ( 12 0) = 0
1
e
2 (200300; 200) = ( 2 75) + ( 12 0) = 37; 5
1
e
2 (200300; 300) = ( 2 50) + ( 12 25) = 37; 5

El jugador 2 responde con 200 o 300. Tampoco hay EBP.


Tomamos como segundo candidato a EBP, la estrategia 200 del jugador 2,
nos preguntamos ¿Cuál es la mejor respuesta del jugador 1 a esta estrategia? Si
es tipo 1 elige 100 y es tipo 2 elige 100.¿Cómo responde óptimamente el jugador
2? Con el mismo sistema de conjeturas, construimos los pagos esperados de sus
diferentes estrategias
1
e
2 (100100; 100) = ( 2 125) + ( 21 125) = 125
1
e
2 (100100; 200) = ( 2 150) + ( 21 150) = 150
1
e
2 (100100; 300) = ( 2 50) + ( 12 50) = 50

El jugador 2 elige pujar con 200. El EBP viene dado por s1 = 100100;
s2 = 200; y el sistema de conjeturas 2 (300 j 350) = 21 ; (1 1
2 (300 j 350)) = 2 :
Este método deberá ser repetido con la estrategia 300 del jugador 2 y probar
si este hacer parte de un EBP.

1.3 EQUILIBRIOS BAYESIANOS DINÁMICOS O JUE-


GOS DE SEÑALIZACIÓN (tomado de Gibbons)
Un juego de señalización es un juego dinámico con información completa: con
tres jugadores: la naturaleza, un jugador llamado Emisor y un jugador llamado
Receptor. El emisor es un jugador informado por la naturaleza sobre su ver-
dadero tipo, a él le corresponde emitir señales o enviar mensajes al jugador
desinformado quien no sabe a qué tipo de jugador se enfrenta. La estructura
temporal del juego1 es:

1. La naturaleza escoge un tipo ti para el emisor de acuerdo con una función


de probabilidad: P : T ! [0; 1], el cual especi…ca las probabilidades con las
cuales la Naturaleza selecciona cada per…l de tipo t (t1 ; t2 ; :::; tn ) 2 T:
2. El emisor observa ti y elige un mensaje mj del conjunto de mensajes
factibles M = fm1 ; ::; mJ g.
1 Gibbons, 1992, hace una excelente exposición sobre los requisitos de señalización necesar-

ios para conseguir un EBP. Estos se pueden revisar en la versión Un primer curso de teoría
de juegos del mismo autor.

6
3. El receptor observa mj (pero no ti ) y elige a continuación una acción ak
de un conjunto de acciones factibles A = fa1 ; ::; aK g:
4. Los pagos vienen dados por i (ti ; mj ; ak ).

EMISOR 2,1
1,3 a1 a1
p I t1 D q

ρ a2
a2 0,0
4,0
R Azar R
1,0
2,4 a1 a1
1-ρ

1-p I t2 D 1- q a2
a2
0,1 1,2
EMISOR

La forma estratégica del árbol se puede de…nir como N = fN;Emisor,


Receptorg, AE = fI,Dg; AR = fa1 ; a2 g;
T1 = ft1 , t2 g =; T2 = funicog, y las probabilidades a priori: Pr ob( t1 )
= = 0; 5; Pr ob( t2 ) = 1 = 0; 5;
Una estrategia para cualquiera de dos jugadores se de…ne como una función
que va desde el conjunto de tipos al conjunto de acciones si : Ti ! Ai . 8i 2
N . En este caso el conjunto de estrategias del jugador Emisor lo llamamos el
conjunto de mensajes del emisor
de forma que SE = ME = fII; ID; DI; DDg y SR = fa1 a1 , a1 a2 , a2 a1 ,
a2 a2 g. A diferencia del juego bayesiano estático en el que los jugadores juegan
de forma simultánea y no tienen la posibilidad de emitir señales, en el juego
bayesiano dinámico, cuando los jugadores juegan secuencialmente, el emisor
tiene la oportunidad de emitir mensajes al receptor y de acuerdo con ellos,
él podrá establecer del algún modo qué tipo envía la señal o el mensaje. Más
concretamente, la posibilidad de saber los mensajes que envía el emisor, permite
al receptor, actualizar sus probabilidades acerca de los tipos del emisor. Por
tanto, cuando el emisor envíe la señal II o DD, el receptor no sabrá a qué tipo de
jugador se enfrenta, porque esta señal no permine discriminar el tipo. No ocurre
lo mismo, si el receptor observa ID o DI., en este caso, el receptor sabrá que
cada señal se corresponde con un tipo diferente. A las primeras los llamaremos
estrategias de agrupación y a las segundas, estrategias de separación. En efecto,
esta diferenciación de estrategias nos permitirá hablar de tipos de equilibrios
bayesianos perfectos: de separación y agrupación.
Empecemos eligiendo candidatos del conjunto de estrategias del emisor.

7
1. Agrupación: el receptor observa la señal II, y la interpreta como si el
emisor siendo t1 envía la señal I, y siendo es t2 , envía la señal I, en otras
palabras, las acciones del emisor no discriminan tipo y por tanto, el re-
ceptor no obtiene más información que la que sabe al inicio del juego. Sus
creencias o conjeturas sobre el tipo del emisor serán iguales a la distribu-
ción a priori de los tipos. Sea p la creencia del receptor de que el emisor
sea t1 y sea 1 p la creencia de que sea del t2 . Con base en el sistema de
conjeturas construye sus pagos esperados, con p = 0; 5.
e
R (II; a1 : j p = 0; 5) = ( 12 3) + ( 12 4) = 7
2
e
R (II; a2 : j p = 0; 5) = ( 21 0) + ( 12 1) = 1
2

El receptor elige a1 . Frente a esta respuesta, ¿cuál es la mejor decisión del


emisor? Su respuesta dependerá del tipo.

Candidato Desviación
Pagos del emisor II DD
t1 1 2 0
t2 2 1 1
Cuando el receptor elige a1 a1 a2

El cuadro anterior muestra los pagos que obtendría con si elige el candidato
a EPB como mejor respuesta cuando sabe que el receptor elegirá a1 .Ahora, si
se desvía y elige DD, sus pagos dependerán de la elección que haga el receptor
frente a esa señal. Así II será una mejor respuesta frente a DD, si en el caso
de que el emisor envía la señal DD, el receptor responda con a2 , los pagos para
cada tipo serán mayores en II que los pagos obtenidos con DD, y entonces se
quedara con la primera como mejor respuesta. El emisor se pregunta si hay
alguna probabilidad positiva –así sea muy pequeña– de que el receptor elija
a2 , como respuesta a DD. Para responder a esta pregunta, el emisor busca la
probabilidad q con la que el receptor elegirá a2 .
e
R (DD; a1 : j q) = (q 1) + ((1 q) 0) = q
e
R (DD; a2 : j q) = (q 0) + ((1 q) 2) = 2 2q

Con base en estos pagos, el emisor encuentra que con probabilidad q 32 , el


receptor ante la señal DD elegirá a2 , haciendo que sus pagos sean peores que con
la estrategia de agrupación DD. Este análisis con…gura un equilibrio Bayesiano
de agrupación, en el que tenemos un par de estrategias de equilibrio para el
emisor y el receptor y un sistema de creencias que de…nen la probabilidades
con las que se elegiran las estrategias del receptor ante las señales del emisor:
[sE = II; sR = a1 a2 , con p = 0; 5; q 23 ].

2. Agrupación DD. El receptor observa la señal de agrupación DD y re-


sponde de acuerdo con su sistema de creencias, q = 0; 5
e
R (DD; a1 : j q = 0; 5) = ( 12 1) + ( 12 0) = 12
e
R (DD; a2 : j q = 0; 5) = ( 12 0) + ( 12 2) = 1

8
El receptor elige a2 . Frente a esta respuesta, ¿cuál es la mejor decisión del
emisor? Su respuesta dependerá de su tipo.

Candidato Desviación
Pagos del emisor DD II
t1 0 1 4
t2 1 2 0
Cuando el receptor elige a2 a1 a2

En el cuadro se puede apreciar que DD nunca será mejor respuesta que II


si el receptor elige a1 , y si escoge a2 , tampoco DD se comportaría como una
estrategia dominante, a lo sumo el emisor tendería a responder con una mixta
entre DD y II. En conclusión DD no haría parte de un equilibrio bayesiano
perfecto en puras.

3. Separación ID. El receptor observa que emisor envía la señal I si es


tipo 1 y D si es tipo 2. Su sistema de creencias se actualiza al conocer
con precisión en que nodo se encuentra, de forma que p = 1, y q = 0,
haciendo que sus pagos sean ciertos en estos nodos. El elige a1 a2 como
mejor respuesta, con pagos

R (ID; a1 : j p = 1) = 3
R (ID; a2 : j q = 0) = 2

¿Cómo responde el emisor? Él compara los pagos de elegir ID contra los


pagos de elegir DI,

Candidato Desviación
Pagos del emisor ID DI
t1 1 2
t2 1 2
Cuando el receptor elige a1 a2 a1 a1

En el cuadro se aprecia que la estrategia ID está estrictamente dominada


por DI, para cada tipo del emisor. Por tanto, ID no se con…gura como una
mejor respuesta y no hará parte de algún EBP.

4. Separación DI. El receptor observa que emisor envía la señal D si es


tipo 1 y I si es tipo 2. Su sistema de creencias se actualiza al conocer
con precisión en que nodo se encuentra, de forma que q = 1, y p = 0,
haciendo que sus pagos sean ciertos en estos nodos. El elige a1 a1 como
mejor respuesta, con pagos

R (DI; a1 : j q = 1) = 1
R (DI; a1 : j p = 0) = 4

¿Cómo responde el emisor? Él compara los pagos de elegir DI contra los


pagos de elegir ID,

9
Candidato Desviación
Pagos del emisor DI ID
t1 2 1
t2 2 1
Cuando el receptor elige a1 a1 a1 a2

En el cuadro se aprecia que la estrategia ID está estrictamente dominada


por DI, para cada tipo del emisor. En este caso, el emisor no tiene incentivo
para desviarse y elegir ID. El EBP en separación vendrá dado por: [sE =
DI; sR = a1 a2 ; p = 0; q = 1].

1.4 Juegos de señalización con dos jugadores (incompleto)


El juego expuesto aquí es tomado de Gardner(1994), llamado el Caveat Emptor.
El jugador 1 es el vendedor quien está informado acerca de su artículo y el posible
comprador quien no sabe el estado actual del artículo. El juego comienza con un
suceso aleatorio que de…ne si el artículo es bueno o malo y este resultado es sólo
es conocido por el vendedor. Lo único que el comprador sabe es que con una
cierta probabilidad el artículo en venta es bueno y con una cierta probabilidad
el artículo será malo. Después de que el vendedor sabe si el artículo es bueno
o malo, el siguiente paso es decidir si lo pone en venta o no. Si no lo pone en
venta el juego se acaba. Si decide ponerlo en venta, y el artículo es bueno, lo
pone en venta tal como está, mientras que si el artículo es malo, el vendedor
deberá embellercerlo a un costo igual c, de forma que no se note su verdadero
estado. Después de eso, el comprador decide si lo compra o no a un precio p,
independiente de si es bueno o malo. Si el comprador decide no comprarlo,
entonces el juego se acaba. Si el artículo es bueno, entonces ambos ganan cero.
Si el artículo es malo, el vendedor pierde c. Si el comprador decide comprar el
artículo, entonces el precio es p que es la ganancia del vendedor si es bueno,
y p c si el artículo es malo. Un artículo bueno tiene una valoración V por
parte del comprador menos el precio pagado, V p. Un artículo malo tiene
un valor de W para el comprador, de donde hay que restar el precio pagado,
p, para obtener una ganancia W-p. El comprador sale ganando si compra un
artículo bueno, pero sale perdiendo si compra un artículo malo: V > p > W .
Esto signi…ca que si el comprador adquiere un artículo malo, él se quema, es
por eso que él tiene que ser precavido.
Este juego de señalización es muy sencillo y dependiendo de las variables
económicas presentadas por los parámetros que representan la probabilidad de
que sea bueno, de que sea malo, p, V, W y c, tiene cuatro posibles equilibrios:
1. Fallo total de mercado: todos los vendedeores, inclusos los de artículos
buenos, temiendo el rechazo de los compradores
2. Éxito total de mercado
3. Éxito parcial del mercado
4. Casi fallo del mercado.

10

También podría gustarte