Clase 8 Teoría de Juegos
Clase 8 Teoría de Juegos
Clase 8 Teoría de Juegos
1
Ana es fácil, ella elige Cine o Fútbol, dependiendo de cuál sea su condición (esta
condición la llamamos estado del mundo). Para Beto su decisión dependerá del
valor de que le asigne a cada uno de los estados del mundo de Ana.
2
P
P (t) i (t; 1 (t1 ); ::; i (ti ); ::; n (tn ))
P
t2T
P (t) i (t; 1 (t1 ); ::; i (ti ); ::; n (tn ))
t2T
Cinéfila Hincha
Ana ρ=3/4 1-ρ=1/4 Ana
C F C F
Beto
C F C F C F C F
Estrategia de Ana CC CF FC FF
t1 3 3 0 0
t2 1 2 1 2
Candidato C de Beto
3
es la mejor respuesta de Beto a CF de Ana? Esta dependerá de las conjeturas
que Beto tenga sobre el tipo de Ana. Dado que es un juego simultáneo, en el
que no hay señales, las conjeturas que Beto se forme no serán distintas a las
probabilidades que usa la Naturaleza para elegir los diferentes tipos de Ana y
que ya le fue revelado. Sea B (tipo cinef ila j tipo unico) la creencia que Beto
tiene acerca de que Ana sea del tipo 1 dado que es del tipo único, por tanto,
3
B (tipo cinef ila j tipo unico) = 4 . Con base en este sistema de creencias
hallamos los pagos esperados de Beto:
3 1
e
B (CF; C j B (:)) =2 4 +0 4 = 21
3 1
e
B (CF; F j B (:)) = 1 4 +3 4 = 12
Estrategia de Ana CC CF FC FF
t1 2 2 1 1
t2 0 3 0 3
Candidato F de Beto
De acuerdo con la tabla, tenemos que CF. Por tanto, Ana tiene una estrategia
dominante con la que responde a cualquier estrategia que elija Beto.
4
N
V= 300 V= 400
(1/3) (2/3)
J1 J1
vi ai si ai m aj
vi ai
i (ai ; aj ; vi ; vj ) =f 2 si ai = aj con i,j = 1; 2; i 6= j
0 si ..ai l aj
5
1
e
2 (100300; 100) = ( 2 125) + ( 12 0) = 62; 5
1
e
2 (100300; 200) = ( 2 150) + ( 12 0) = 75
1
e
2 (100300; 300) = ( 2 50) + ( 12 25) = 37; 5
El jugador 2 elige pujar con 200. El EBP viene dado por s1 = 100100;
s2 = 200; y el sistema de conjeturas 2 (300 j 350) = 21 ; (1 1
2 (300 j 350)) = 2 :
Este método deberá ser repetido con la estrategia 300 del jugador 2 y probar
si este hacer parte de un EBP.
ios para conseguir un EBP. Estos se pueden revisar en la versión Un primer curso de teoría
de juegos del mismo autor.
6
3. El receptor observa mj (pero no ti ) y elige a continuación una acción ak
de un conjunto de acciones factibles A = fa1 ; ::; aK g:
4. Los pagos vienen dados por i (ti ; mj ; ak ).
EMISOR 2,1
1,3 a1 a1
p I t1 D q
ρ a2
a2 0,0
4,0
R Azar R
1,0
2,4 a1 a1
1-ρ
1-p I t2 D 1- q a2
a2
0,1 1,2
EMISOR
7
1. Agrupación: el receptor observa la señal II, y la interpreta como si el
emisor siendo t1 envía la señal I, y siendo es t2 , envía la señal I, en otras
palabras, las acciones del emisor no discriminan tipo y por tanto, el re-
ceptor no obtiene más información que la que sabe al inicio del juego. Sus
creencias o conjeturas sobre el tipo del emisor serán iguales a la distribu-
ción a priori de los tipos. Sea p la creencia del receptor de que el emisor
sea t1 y sea 1 p la creencia de que sea del t2 . Con base en el sistema de
conjeturas construye sus pagos esperados, con p = 0; 5.
e
R (II; a1 : j p = 0; 5) = ( 12 3) + ( 12 4) = 7
2
e
R (II; a2 : j p = 0; 5) = ( 21 0) + ( 12 1) = 1
2
Candidato Desviación
Pagos del emisor II DD
t1 1 2 0
t2 2 1 1
Cuando el receptor elige a1 a1 a2
El cuadro anterior muestra los pagos que obtendría con si elige el candidato
a EPB como mejor respuesta cuando sabe que el receptor elegirá a1 .Ahora, si
se desvía y elige DD, sus pagos dependerán de la elección que haga el receptor
frente a esa señal. Así II será una mejor respuesta frente a DD, si en el caso
de que el emisor envía la señal DD, el receptor responda con a2 , los pagos para
cada tipo serán mayores en II que los pagos obtenidos con DD, y entonces se
quedara con la primera como mejor respuesta. El emisor se pregunta si hay
alguna probabilidad positiva –así sea muy pequeña– de que el receptor elija
a2 , como respuesta a DD. Para responder a esta pregunta, el emisor busca la
probabilidad q con la que el receptor elegirá a2 .
e
R (DD; a1 : j q) = (q 1) + ((1 q) 0) = q
e
R (DD; a2 : j q) = (q 0) + ((1 q) 2) = 2 2q
8
El receptor elige a2 . Frente a esta respuesta, ¿cuál es la mejor decisión del
emisor? Su respuesta dependerá de su tipo.
Candidato Desviación
Pagos del emisor DD II
t1 0 1 4
t2 1 2 0
Cuando el receptor elige a2 a1 a2
R (ID; a1 : j p = 1) = 3
R (ID; a2 : j q = 0) = 2
Candidato Desviación
Pagos del emisor ID DI
t1 1 2
t2 1 2
Cuando el receptor elige a1 a2 a1 a1
R (DI; a1 : j q = 1) = 1
R (DI; a1 : j p = 0) = 4
9
Candidato Desviación
Pagos del emisor DI ID
t1 2 1
t2 2 1
Cuando el receptor elige a1 a1 a1 a2
10