Tema1 PME2023-2024

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 38

Tema 1.

Tª de Juegos y estrategia competitiva

Notas sobre

Tema 1. Teoría de Juegos y Estrategia Competitiva

PODER DE MERCADO Y ESTRATEGIA


Curso 3º

Grado en Economía
2023-2024

Iñaki Aguirre

Departamento de Análisis Económico

Universidad del País Vasco


Tema 1. Tª de Juegos y estrategia competitiva

ÍNDICE

Tema 1. Teoría de Juegos y la estrategia competitiva

Introducción.

1.1. Nociones fundamentales

1.1.1. Juegos en forma extensiva.

1.1.2. Juegos en forma normal

1.2. Conceptos de solución de juegos no cooperativos.

1.2.1. Criterio de dominación.

1.2.2. Criterio de inducción retroactiva.

1.2.3. Equilibrio de Nash.

1.2.4. Problemas y refinamientos del equilibrio de Nash.

1.3. Juegos repetidos.

1.3.1. Horizonte temporal finito.

1.3.2. Horizonte temporal infinito.

1.4. Conclusiones.

2
Tema 1. Tª de Juegos y estrategia competitiva

Introducción

La Teoría de los Juegos no Cooperativos estudia y modela situaciones de conflicto entre


agentes económicos; es decir, estudia situaciones en las que los beneficios (ganancias,
utilidad o pagos) de cada agente económica dependen no sólo de sus propios actos sino
también de los actos de las demás agentes.

Supondremos jugadoras racionales y, por tanto, cada una de ellas tratará de maximizar su
función de beneficios (utilidad o pagos) dadas sus conjeturas o creencias sobre cómo van a
actuar las otras jugadoras. El resultado del juego dependerá de las acciones de todas las
jugadoras.

Una característica fundamental de los juegos no cooperativos es que no se pueden establecer


contratos entre las jugadoras que se hagan cumplir por terceros. Es decir, no existe una
institución externa (p.e. tribunales de justicia) que sea capaz de hacer cumplir los acuerdos.
En este contexto, la cooperación entre las jugadoras solo surgirá como equilibrio o propuesta
de solución si está en el mejor interés de las jugadoras actuar así.

Para cada juego trataremos de proponer una “solución” que sea una predicción razonable del
comportamiento racional de las jugadoras (OBJETIVO).

Nos interesa la Tª de los Juegos no Cooperativos porque es de gran utilidad para modelar y
comprender los problemas económicos multipersonales caracterizados por interdependencia
estratégica. Como ejemplo consideremos la competencia entre las empresas de una industria.
La competencia perfecta y el monopolio puro (en el sentido de no estar amenazado por la
entrada) son casos muy especiales y poco realistas. Lo frecuente es encontrarse en la realidad
industrias en las que existen pocas empresas (o existen muchas pero un número pequeño de
ellas produce un porcentaje muy elevado de la producción total). Cuando hay pocas empresas,
la competencia entre ellas estará mediatizada por consideraciones estratégicas: cada empresa
toma sus decisiones (precio, producción, publicidad..) teniendo en cuenta o conjeturando el
comportamiento de las demás. Por tanto, la competencia en un oligopolio, claramente la

3
Tema 1. Tª de Juegos y estrategia competitiva

podemos ver como un juego no cooperativo donde las empresas son las jugadoras. Así,
muchas de las predicciones o propuestas de solución que provienen de la Teoría de Juegos
nos serán de gran utilidad para entender el comportamiento de las agentes económicas bajo
interacción estratégica

En la sección 1, definiremos las principales nociones de la Teoría de Juegos. Veremos que


existen dos formas de representar un juego: la forma extensiva y la forma normal o
estratégica. En la sección 2, analizaremos los principales conceptos de solución y los
problemas que presentan. Estudiaremos el equilibrio de Nash y los refinamientos. La sección
3 estudia los juegos repetidos y, por último, en la sección 4 se presentan algunas
conclusiones.

1.1. Nociones fundamentales

Existen dos formas de representar un juego: la forma extensiva y la forma normal o

estratégica. Vamos a comenzar analizando los principales elementos de un juego en forma

extensiva.

1.1.1. Juegos en forma extensiva (dinámicos o secuenciales)

Un juego en forma extensiva especifica:

1) Las jugadoras.

2) El orden del juego.

3) Las elecciones factibles para una jugadora cuando le toca el turno (en cada nodo de

decisión).

4) La información que tiene cada jugadora en cada uno de sus turnos de juego (nodos).

5) Los pagos para cada jugadora como una función de los movimientos seleccionados.

6) Distribuciones de probabilidad para movimientos de la naturaleza.

4
Tema 1. Tª de Juegos y estrategia competitiva

Un juego en forma extensiva se suele describir a través de un árbol de decisión. Un árbol de

decisión está constituido por ramas y nodos. Hay dos tipos de nodos: nodos de decisión y

nodos terminales. Hay que señalar en cada nodo la agente que tiene que tomar la decisión.

Cuando alcanzamos un nodo de decisión, la agente de ese nodo tiene su turno y elige en qué

dirección ir. Cuando se alcanza un nodo terminal se producen pagos: un vector de pagos en

cada nodo terminal que nos dice lo que gana cada jugadora.

EJEMPLO 1: Juego de entrada

Consideremos una industria en la que hay una empresa establecida, A, y un entrante

potencial, B. En la primera etapa del juego, el entrante potencial decide si entrar o no en la

industria. Si decide no entrar el juego termina y se producen pagos (A obtiene el beneficio de

monopolio) y si decide entrar entonces le toca el turno a la empresa establecida, A, que tiene

que decidir si acomodarse a la entrada de B (repartirse el mercado) o comenzar una guerra de

precios mutuamente perjudicial. En forma extensiva el juego quedaría representado de la

siguiente forma:
β

NE (0, 10)
α (4, 4)
Ac. β
B α
E
A
G.P.
(-1, -1)

β
Jugadoras: B y A.

Acciones: E (entrar), NE (no entrar), Ac. (acomodar), G.P. (guerra de precios).

Nodos de decisión: α.

5
Tema 1. Tª de Juegos y estrategia competitiva

Nodos terminales: β.

(x, y): vector de pagos. x: pago para la jugadora B; y: pago para la jugadora A.

En cada nodo terminal se tienen que especificar los pagos de cada una de las jugadoras

(incluso aunque alguna de ellas no haya llegado “físicamente” a jugar).

Supuestos:

(i) Todas las jugadoras tienen la misma percepción de cómo es el juego.

(ii) Información completa: cada jugadora conoce las características de las demás jugadoras:

preferencias y espacios de estrategias.

(iii) Memoria perfecta: cada agente recuerda todo lo que ha jugado.

Definición 1: Conjunto de información

“Es la información de la que dispone cada jugadora en cada nodo de decisión que le

corresponde”.
L
(., .) L (., .)
A
I M M
2 (., .) I
(., .)
2
1 B R (., .)
D 1 L (., .)
D
2
S (., .) (., .)
M
Juego 1 Juego 2

En el juego 1, la jugadora 2 tiene diferente información en cada uno de sus dos nodos. En A,

si le toca jugar sabe que la jugadora 1 ha jugado I y en B que ha jugado D. Decimos que estos

conjuntos de información constan de un único nodo de decisión. En el juego 2, la jugadora 2

6
Tema 1. Tª de Juegos y estrategia competitiva

tiene la misma información en sus dos nodos de decisión. Es decir, el conjunto de

información constaría de dos nodos de decisión.

Un juego en el que existen conjuntos de información de más de un nodo se dice que es un

juego de información imperfecta: alguna de las jugadoras no observa los movimientos de la

otra o de las otras jugadoras. Abusando del lenguaje se suele llamar conjunto de información

al conjunto de nodos en los que una misma jugadora tiene que jugar en ausencia de

información sobre el nodo concreto en el que se encuentra.

El hecho de que todas las jugadoras sepan el tipo de juego que están jugando y el supuesto de

memoria perfecta limitan las situaciones en las que podemos tener conjuntos de información

con más de un nodo.

(., .) (., .)
(., .) I (., .)
I 2
(., .) (., .)
2
1 (., .) 1 (., .)
D D
2
(., .) (., .)
Juego 3 Juego 4

El juego 3 está mal representado ya que no sería un juego de información imperfecta. Si la

jugadora 2 conoce el juego, cuando le toque jugar y se enfrente a tres alternativas

automáticamente deducirá que se encuentra en el nodo superior. Es decir, el juego en forma

extensiva debería ser como el del juego 4. Por tanto, si un conjunto de información consta de

7
Tema 1. Tª de Juegos y estrategia competitiva

dos o más nodos de decisión, en cada uno de ellos el número de opciones (acciones o

movimientos) debe ser el mismo.

(., .) (., .)
L L (., .)
I (., .) a (., .) I a (., .)
C C
2 M b (., .) 2 M 1 b (., .)
1 a
1 a (., .) 1 (., .)
D R D R
(., .) 1 (., .)
b 2 b
2 S S
(., .) (., .)
Juego 5 Juego 6

El supuesto de memoria perfecta impide situaciones como la del juego 5. La jugadora 1

cuando le toca jugar en su segundo nodo de decisión “recuerda” perfectamente lo que hizo en

el primero. La forma extensiva debería ser como la del juego 6.

Definición 2: Subjuego

“Lo que queda por jugar a partir de un nodo de decisión, siempre y cuando lo que quede por

jugar no forme parte de un conjunto de información de dos o más nodos. Al formar subjuegos

se miran partes del árbol de decisión que puedan construirse sin romper ningún conjunto de

información. Un subjuego comienza en un conjunto de información de un único nodo de

decisión y todos los nodos de decisión de un mismo conjunto de información deben

pertenecer al mismo subjuego.”

8
Tema 1. Tª de Juegos y estrategia competitiva

EJEMPLO 2: El dilema de la prisionera

Dos individuas, 1 y 2, son detenidas como sospechosas de haber cometido conjuntamente un

delito. La policía les interroga en habitaciones separadas de forma que no hay comunicación

entre ellas. Cada una tiene la posibilidad de confesarse culpable (C) o no confesar (NC). Si

sólo confiesa una ésta queda en libertad y las autoridades culpan a la otra condenándole a 6

meses. Si ambas niegan su participación son condenadas a 1 mes cada una y si ambas

confiesan son condenadas a 3 meses cada una.

- Caso simultáneo: cada individua toma su decisión sin saber lo que ha decidido la otra.

C (1, 1)

C
NC (3, 0)
2
1 C (0, 3)
NC

NC (2, 2)
DP1

Hay un conjunto de información con dos nodos de decisión. Es un juego de información

imperfecta. Sólo hay un subjuego que coincide con el propio juego.

- Caso secuencial: la segunda observa la elección tomada por la primera (y ésta lo sabe).

C (1, 1)

C 2 (3, 0)
NC

1 C (0, 3)
NC
2
NC (2, 2)
DP2

9
Tema 1. Tª de Juegos y estrategia competitiva

El juego DP2 es un juego de información perfecta y tiene tres subjuegos. “En los juegos de

información perfecta hay tantos subjuegos como nodos de decisión”.

Definición 3: Estrategia

“Una estrategia de una jugadora es una descripción completa de lo que haría en caso de ser

llamado a jugar en cada uno de sus nodos de decisión. Hay que especificarlo incluso en

aquellos nodos que no fueran alcanzables para ella dado el comportamiento actual de la otra o

de las otras jugadoras. Es un plan de comportamiento o plan de conducta”. (Ejemplos:

entrenador de baloncesto, demanda del consumidor, oferta de la empresa competitiva…). Es

una función en la que cada jugadora asigna una acción a cada nodo que le corresponde. Una

estrategia de una jugadora tiene tantas componentes como conjuntos de información tenga la

jugadora.

Definición 4: Acción

“Es una elección (decisión o movimiento) en un nodo de decisión”

Las acciones son “físicas” y las estrategias son “conjeturales”.

Definición 5: Jugada o combinación de estrategias

“Es una especificación de una estrategia para cada una de las jugadoras”. El resultado (vector

de pagos) de una jugada debe quedar inequívocamente determinado.

10
Tema 1. Tª de Juegos y estrategia competitiva

EJEMPLO 1: Juego de entrada

Es un juego de información perfecta y dos subjuegos. Cada jugadora tiene dos estrategias:

S B = { NE , E} y S A = {Ac.,G.P.}. Combinaciones de estrategias: (NE, Ac.), (NE, G.P.), (E,

Ac.) y (E, G.P.).

EJEMPLO 2: Dilema de la prisionera

DP1: Es un juego de información imperfecta y tiene un subjuego. Cada jugadora tiene dos

estrategias: S1 = {C , NC} y S 2 = {C , NC} . Combinaciones de estrategias: (C, C), (C, NC),

(NC, C) y (NC, NC).

DP2: Es un juego de información perfecta y tiene tres subjuegos. La jugadora A tiene dos

estrategias S1 = {C , NC} pero la jugadora B tiene cuatro S 2 = {CC , CNC , NCC , NCNC} .

Combinaciones de estrategias: (C, CC), (C, CNC), (C, NCC), (C, NCNC), (NC, CC),

(NC,CNC), (NC, NCC) y (NC, NCNC).

EJEMPLO 3

D (10, 0)
(4, 4)
R
1
I s (1, -1)
2
S
1 r (8, 10)

La jugadora 1 tiene en su primer nodo de decisión dos posibles acciones, D e I, y en el

segundo nodo también dos acciones: s y r. S1 = {Ds, Dr, Is, Ir} y S2 = {R, S}.
11
Tema 1. Tª de Juegos y estrategia competitiva

1.1.2. Juegos en forma normal o estratégica (simultáneos o estáticos)

Un juego en forma normal se describe por:

1) Las jugadoras.

2) El conjunto (o espacio) de estrategias de cada jugadora.

3) Una función de pagos que asigna a cada combinación de estrategias un vector de pagos.

El elemento clave de esta forma de representar un juego es la descripción de los pagos del

juego en función de las estrategias de las jugadoras, sin explicitar las acciones que se van

tomando a lo largo del juego. La representación gráfica, para dos jugadoras, es una matriz

(binaria) de pagos que tiene como entradas las posibles estrategias de las dos jugadoras.

EJEMPLO 1: Juego de entrada

A
Ac. G.P.
NE (0, 10)
(4, 4)
NE (0, 10) (0, 10)
Ac.
B B
E
A E (4, 4) (-1, -1)
G.P.
(-1, -1)

EJEMPLO 2: Dilema de la prisionera

2
C (1, 1) C NC

C C (1, 1) (3, 0)
NC (3, 0)
2
1
1 C (0, 3)
NC NC (0, 3) (2, 2)

NC (2, 2)
12
Tema 1. Tª de Juegos y estrategia competitiva

2
C (1, 1) CC CNC NCC NCNC

C 2 (3, 0)
NC C (1, 1) (1, 1) (3, 0) (3, 0)

1 C (0, 3) 1
NC
NC (0, 3) (2, 2) (0, 3) (2, 2)
2
NC (2, 2)

EJEMPLO 3
2
R S

D (10, 0) Ds (10, 0) (10, 0)


(4, 4)
R
1 Dr (10, 0) (10, 0)
I s (1, -1) 1
2
S Is (4, 4) (1, -1)
1 r (8, 10)
Ir (4, 4) (8, 10)

Relación entre juegos en forma normal y juegos en forma extensiva

a) Para todo juego en forma extensiva tenemos de forma inequívoca un juego en forma

normal que le corresponde. Esto es debido a que el juego en forma normal se describe en

función de las estrategias de las jugadoras.

b) (Problema) Juegos diferentes en forma extensiva pueden tener la misma forma normal.

(Ejemplo: dilema de la prisionera, DP1, cambiando el orden del juego).

13
Tema 1. Tª de Juegos y estrategia competitiva

1.2. Conceptos (criterios) de solución de juegos no cooperativos

El objetivo es intentar predecir cómo se van a comportar las jugadoras cuando se enfrentan a

un determinado juego. NOTA: “Una propuesta de solución no es un vector de pagos sino una

combinación de estrategias, una para cada jugadora, que conducirá a un vector de pagos. Nos

interesa predecir comportamientos, no ganancias.

Notación

i: Jugadora representativa, i = 1,…, n

Si : conjunto o espacio de estrategias de la jugadora i.

si ∈ Si : estrategia de la jugadora i.

s−i ∈ S−i : estrategia o combinación de estrategias de la otra jugadora (o las otras jugadoras).

Π i (si ,s−i ) : beneficio o ganancia de la agente i correspondiente a la combinación de

estrategias s ≡ (s1,s2 ,.....,sn ) ≡ (si ,s−i ).

1.2.1. Criterio de dominación

Definición 6: Estrategia dominante

“Una estrategia es estrictamente dominante para una jugadora si lleva a unos resultados

estrictamente mejores (mayores ganancias) que el resto de sus estrategias ante cualquier

combinación de estrategias de las demás jugadoras”.

“Si Π i ( siD , s− i ) > Π i ( si , s− i ), ∀si ∈ Si , si ≠ siD ; ∀s− i ∈ S − i , entonces siD es una estrategia

(estrictamente) dominante de la jugadora i”.

14
Tema 1. Tª de Juegos y estrategia competitiva

EJEMPLO 2: Dilema de la prisionera

En el juego DP1 “confesar”, C, es una estrategia dominante para cada jugadora.

Independientemente de lo que haga la otra jugadora lo mejor que puede hacer cada una es

confesar.

La presencia de estrategias dominantes conduce a una solución del juego. Cada jugadora

utilizará su estrategia dominante. La propuesta de solución para el juego DP1 será la

combinación de estrategias (C, C).

Definición 7: Dominación (estricta)

“Decimos que una estrategia domina estrictamente a otra para una jugadora cuando conduce a

mejores resultados cualesquiera que sean las estrategias seguidas por las demás jugadoras”.

“Si Π i ( sid , s− i ) > Π i ( sidd , s− i ), ∀s− i ∈ S − i , entonces sid domina estrictamente a sidd ”.

Definición 7’: Estrategia (estrictamente) dominada

“Decimos que una estrategia está estrictamente dominada para una jugadora si existe otra

estrategia que conduce a mejores resultados cualesquiera que sean las estrategias seguidas por

las demás jugadoras”.

“ sidd está estrictamente dominada si ∃sid tal que Π i ( sid , s− i ) > Π i ( sidd , s− i ), ∀s− i ∈ S − i ”.

El criterio de dominación consiste en la eliminación iterativa de estrategias estrictamente

dominadas.

15
Tema 1. Tª de Juegos y estrategia competitiva

EJEMPLO 4
2
t1 t2 t3

s1 (4, 3) (2, 7) (0, 4)


1
s2 (5, 5) (5, -1) (-4, -2)

En este juego no existen estrategias dominantes. Sin embargo, la presencia de estrategias

dominadas nos va a permitir predecir un resultado. Vamos a aplicar el criterio de dominación.

Como la estrategia t3 es una estrategia estrictamente dominada por t2 la jugadora 1 puede

conjeturar (predecir) que la jugadora 2 nunca utilizará esa estrategia. Dada esta conjetura, que

supone racionalidad de la jugadora 2, para la jugadora 1 s2 es mejor que s1 . La estrategia s1

sólo sería utilizada ante la posibilidad de que la jugadora 2 juegue t3 . Como la jugadora 1

piensa que la jugadora 2 es racional asignará una probabilidad nula a que la jugadora 2 juegue

t3 . En ese caso, la jugadora 1 debería jugar s2 y si la jugadora 2 es racional lo mejor que

podría hacer es jugar t1. La utilización del criterio de dominación sucesiva (eliminando las

estrategias dominadas y computando los juegos reducidos) permite resolver el juego.

EJEMPLO 5 2
t1 t2

s1 (10, 0) (5, 2)
1
s2 (10, 1) (2, 0)

En este juego no existen estrategias dominantes ni estrategias dominadas (estrictamente).

16
Tema 1. Tª de Juegos y estrategia competitiva

Definición 8: Dominación débil

“Una estrategia domina débilmente a otra para una jugadora si lleva a resultados por lo menos

tan buenos como la segunda cualesquiera que sean las estrategias seguidas por las demás

jugadoras, y estrictamente mejores que la segunda para alguna combinación de estrategias de

las demás”.

“Si Π i ( sidb , s− i ) ≥ Π i ( siddb , s− i ), ∀s− i ∈ S − i y ∃s−i tal que Π i (sidb , s−i ) > Π i (sddb
i , s−i ), entonces

sidb domina débilmente a siddb ”.

Definición 8’: Estrategia débilmente dominada

“Una estrategia está débilmente dominada para una jugadora si existe otra estrategia que lleva

a resultados por lo menos tan buenos como la primera cualesquiera que sean las estrategias

seguidas por las demás jugadoras, y estrictamente mejores que la primera para alguna

combinación de estrategias de las demás”.

“ siddb es una estrategia débilmente dominada si existe otra estrategia sidb tal que

Π i ( sidb , s− i ) ≥ Π i ( siddb , s− i ), ∀s− i ∈ S − i y ∃s−i tal que Π i ( sidb , s− i ) > Π i ( siddb , s− i ) ”.

En el Ejemplo 5, s1 domina débilmente a s2 . La jugadora 2 podría conjeturar que la jugadora

1 jugará s1 y ante esta conjetura lo mejor que podría hacer sería jugar t2 . Siguiendo el criterio

de dominación débil nuestra propuesta de solución sería (s1 ,t2 ).

Sin embargo, la aplicación sucesiva del criterio de dominación débil puede llevar a resultados

problemáticos como ocurre en el Ejemplo 6, o a no proponer ninguna solución como ocurre

17
Tema 1. Tª de Juegos y estrategia competitiva

en el Ejemplo 7 (al no existir ni estrategias dominantes, ni dominadas, ni débilmente

dominadas).

EJEMPLO 6

t1 t2 t3

s1 (10, 0) (5, 1) (4, -200)


1

s2 (10, 100) (5, 0) (0, -100)

EJEMPLO 7
2
t1 t2 t3

s1 (4, 10) (3, 0) (1, 6)


1
s2 (0, 0) (2, 10) (10, 6)

18
Tema 1. Tª de Juegos y estrategia competitiva

1.2.2. Criterio de inducción retroactiva

Vamos a utilizar el criterio de dominación para analizar la forma extensiva. Consideremos el

Ejemplo 1.

EJEMPLO 1: Juego de entrada


A
Ac. G.P.
NE (0, 10)
(4, 4)
NE (0, 10) (0, 10)
Ac.
B B
E
A E (4, 4) (-1, -1)
G.P.
(-1, -1)

En el juego en forma normal, la jugadora A tiene una estrategia débilmente dominada: G.P..

La jugadora B podría conjeturar esto y jugar E. Sin embargo, la jugadora B también podría

haber elegido NE para asegurarse el pago ante la posibilidad de que A jugara G.P..

En el juego en forma extensiva, la solución es más natural. Se aplica la inducción hacia atrás

o inducción retroactiva. La jugadora B como juega primero puede conjeturar, correctamente,

que si juega E seguro que la jugadora A elegirá Ac.. La jugadora B al jugar antes que A puede

anticipar el comportamiento de A. En la forma extensiva tenemos más información ya que

cuando A juega conoce el movimiento de B. El criterio de inducción retroactiva consiste en

aplicar el criterio de dominación sucesiva de forma retroactiva comenzando desde el último(s)

subjuego(s). En el Ejemplo 1, en forma extensiva, el criterio de inducción retroactiva propone

como solución (E, Ac.).

19
Tema 1. Tª de Juegos y estrategia competitiva

Resultado: Si el juego es de información perfecta y sin empates, el criterio de inducción

retroactiva nos llevará a una única propuesta de solución.

Problemas

(i) Posibilidad de empates.

(ii) Información imperfecta. Existencia de conjuntos de información con más de un nodo.

(iii) El éxito de la inducción hacia atrás reside en que todas las conjeturas sobre la

racionalidad de las agentes se verifiquen exactamente con independencia de lo largo que sea

el camino hacia atrás. (Requiere racionalidad ilimitada)

EJEMPLO 8

D (0, 0)
(6, 1)
R
1
I s (5, 0)
2
S
1 r (5, 2)

La inducción retroactiva no nos lleva a ninguna propuesta de solución ya que en el último

subjuego la jugadora 1 está indiferente entre s y r. En el subjuego anterior, la jugadora 2 no

tendría una acción dominada (ya que no sería capaz de predecir el comportamiento de la

jugadora 1).

20
Tema 1. Tª de Juegos y estrategia competitiva

EJEMPLO 9
(0, 0)
D s (2, 2)

1 R
I r (2, 0)
1
2 s (0, 1)
S

r (-1, 3)

No podemos aplicar el criterio de inducción retroactiva.

EJEMPLO 10: El ciempiés de Rosenthal (1981)

1 D 2 D 1 D 2 D 1 D 2 D 1 D 2 D (100, 100)

B B B B B B B B

(1, 1) (0, 3) (2, 2) (1, 4) (98, 98) (97, 100) (99, 99) (98, 101)

En el resultado de inducción retroactiva los pagos son (1, 1). ¿Es posible otra racionalidad?

21
Tema 1. Tª de Juegos y estrategia competitiva

1.2.3. Equilibrio de Nash

La jugadora i, i = 1,…, n, viene caracterizada por:

(i) Su espacio estratégico: Si .

(ii) Una función de beneficios o función de ganancias, Π i (si ,s−i ) donde si ∈ Si y s−i ∈ S−i .

Cada jugadora tratará de maximizar su función de beneficios (utilidad o ganancias) eligiendo

una estrategia apropiada con conocimiento de los espacios estratégicos y las funciones de

beneficios de las otras jugadoras aunque sin conocer la estrategia concreta utilizada por las

rivales. Por tanto, cada jugadora debe conjeturar la estrategia utilizada por las rivales.

Definición 9: Equilibrio de Nash

“Una combinación de estrategias s ≡ (s1 , ...,s n ) constituye un equilibrio de Nash si el


* * *

resultado para cada una de las jugadoras es mejor o igual que el resultado que obtendría,

permaneciendo constante la jugada de las demás, jugando otra estrategia. Es decir,

s * ≡ (s1* , ...,s *n ) es un equilibrio de Nash si: Π i (si*, s*−i ) ≥ Π i (si, s−i


*
) ∀si ∈Si ,∀i,i = 1,...,n .”

En una situación de equilibrio se tienen que cumplir dos condiciones:

(i) Las conjeturas de las jugadoras sobre cómo van a jugar las rivales deben ser correctas.

(ii) Ninguna jugadora tiene incentivos a cambiar su estrategia dadas las estrategias de las

demás jugadoras. Éste es un elemento de racionalidad individual: dado lo que hacen las

demás hacerlo lo mejor posible. O lo que es lo mismo, ninguna jugadora aumenta sus

beneficios (utilidad o pagos) mediante una desviación unilateral.

22
Tema 1. Tª de Juegos y estrategia competitiva

Ser equilibrio de Nash es una condición necesaria o requisito mínimo para que cualquier

propuesta de solución de un juego sea una predicción razonable del comportamiento racional

de las jugadoras. Sin embargo, como ya veremos no es una condición suficiente. Es decir, no

basta con que una combinación de estrategias sea equilibrio de Nash para que sea nuestra

predicción de la solución de un juego.

Definición 10: Equilibrio de Nash

“Una combinación de estrategias s ≡ (s1 , ...,s n ) constituye un equilibrio de Nash si la


* * *

estrategia de cada jugadora es la mejor respuesta (o al menos una de ellas) ante las estrategias

seguidas por las otras jugadoras.” Es decir, s ≡ (s1 , ...,s n ) es un equilibrio de Nash si:
* * *

* *
si ∈ MRi (s−i )∀i,i = 1,...,n

{ }
donde MRi (s*−i ) = s'i ∈ Si : Πi (si' ,s*−i ) ≥ Π i (si ,s*−i ), ∀si ∈ Si ,si ≠ s'i .

Una forma sencilla de calcular los equilibrios de Nash consiste en construir los conjuntos de

mejores respuestas de cada jugadora ante las estrategias (o combinaciones de estrategias) de

la otra (o las otras jugadoras) y buscar aquellas combinaciones de estrategias que sean

mutuamente mejores respuestas.

23
Tema 1. Tª de Juegos y estrategia competitiva

EJEMPLO 11

2
h i j
s1 MR2 s2 MR1
a (5, 3) (5, 11) (20, 5)
a i h b

1 b (9, 11) (2, 8) (15, 6) b h i c

c h j a
c (3, 10) (10, 2) (0, 5)

La combinación de estrategias (b, h) constituye el único equilibrio de Nash del juego.

EJEMPLO 7
2
t1 t2 t3

s1 (4, 10) (3, 0) (1, 6)


1
s2 (0, 0) (2, 10) (10, 6)

Nótese que para este juego el criterio de dominación no nos proponía ninguna solución. Sin

embargo, la combinación de estrategias (s1,t1) constituye el único equilibrio de Nash del

juego.

24
Tema 1. Tª de Juegos y estrategia competitiva

1.3. Problemas y refinamientos del equilibrio de Nash

1.3.1. Posibilidad de ineficiencia

Es habitual encontrar juegos en los que el equilibrio de Nash no es óptimo de Pareto

(eficiente).

EJEMPLO 2: Dilema de la prisionera

C (1, 1) 2
C NC
C
NC (3, 0) C (1, 1) (3, 0)
2
1 C (0, 3) 1
NC
NC (0, 3) (2, 2)
NC (2, 2)

(C, C) es un equilibrio de Nash en estrategias dominantes. Sin embargo, encontramos otra

combinación de estrategias (NC, NC) en la que ambas jugadoras obtienen mayores ganancias.

1.3.2. Inexistencia de equilibrio de Nash

EJEMPLO 12
2
t1 t2

s1 (1, 0) (0, 1)
1
s2 (0, 1) (1, 0)

25
Tema 1. Tª de Juegos y estrategia competitiva

En este juego no existe equilibrio de Nash en estrategias puras. Sin embargo, permitiendo la

utilización de estrategias mixtas (distribuciones de probabilidad sobre el espacio de

estrategias puras de una jugadora) se obtiene el resultado de que “siempre existe equilibrio de

Nash en estrategias mixtas (juegos finitos)”.

1.3.3. Multiplicidad de equilibrios de Nash

Vamos a distinguir dos tipos de juegos.

1.3.3.1. Sin posibilidad de refinamiento o selección

EJEMPLO 13: La batalla de los sexos

Una pareja de novios tiene que elegir entre ir al cine o al teatro. El novio prefiere el cine al

teatro, pero prefiere ir al teatro acompañado que ir solo al cine. Similarmente (pero al

contrario) para la novia. El juego en forma normal es:

Na
C T

C (3, 2) (1, 1)
No
T (1, 1) (2, 3)

En este juego hay dos equilibrios de Nash: (C, C) y (T, T). Existe un problema de

coordinación pura.

26
Tema 1. Tª de Juegos y estrategia competitiva

1.3.3.2. Con posibilidad de refinamiento o selección

a) Criterio de eficiencia

Elegir el equilibrio de Nash que proporcione mayores pagos a las jugadoras. No es en general

un buen criterio de selección.

b) Criterio de dominación débil

El criterio consiste en eliminar aquellos equilibrios de Nash basados en estrategias débilmente

dominadas. Aunque como concepto de solución no es bueno, nos permite seleccionar entre

los equilibrios de Nash.

EJEMPLO 14
2
D I

D (1, 1) (0, 0)
1
I (0, 0) (0, 0)

Equilibrios de Nash: (D, D) y (I, I). Jugar I es una estrategia débilmente dominada para cada

jugadora. Jugando D cada jugadora se garantiza un pago por lo menos tan alto como jugando

I. Tenderíamos a rechazar (I, I) por estar basado en estrategias débilmente dominadas. Por

tanto, proponemos como solución la combinación de estrategias (D, D).

27
Tema 1. Tª de Juegos y estrategia competitiva

c) Criterio de inducción retroactiva y equilibrio perfecto en subjuegos

EJEMPLO 15

D (1, 1) s1 MR2 s2 MR1


(2, 2)
R
1 Dr R, S R Ir, Is
I r (-1, -1)
2 Ds R, S S Dr, Ds
S
1 s (0, 3)
Ir R

Is S

En este juego hay tres equilibrios de Nash: (Dr, S), (Ds, S) y (Ir, R). Comencemos mirando a

la solución eficiente: (Ir, R). Este equilibrio de Nash presenta un problema: en su segundo

nodo de decisión la jugadora 1, aunque no es alcanzable, está anticipando (amenazando) que

jugaría r. Amenazando con r trata de conseguir que la jugadora 2 juegue R y así obtener más

pago. Pero este equilibrio está basado en una amenaza no creíble: aunque, dada la estrategia

de la jugadora 2, el segundo nodo de decisión de la jugadora 1 no es alcanzable, si lo fuera la

jugadora 1 nunca elegiría r ya que es una acción dominada (amenaza no creíble) por s en el

último subjuego. El refinamiento que vamos a utilizar consiste en la eliminación de aquellos

equilibrios basados en amenazas no creíbles (es decir, acciones dominadas dentro de los

subjuegos). De la utilización conjunta de la noción de equilibrio de Nash y del criterio de

inducción retroactiva surge la noción de:

Definición 11: Equilibrio perfecto en subjuegos

“Una jugada o combinación de estrategias s ≡ (s1 , ...,s n ) , que sea equilibrio de Nash,
* * *

constituye un equilibrio perfecto en subjuegos si las partes relevantes de las estrategias de

28
Tema 1. Tª de Juegos y estrategia competitiva

equilibrio de cada una de las jugadoras son también de equilibrio para cada uno de los

subjuegos.”

En el Ejemplo 15 (Dr, S) y (Ir, R) no son equilibrios perfectos en subjuegos. El equilibrio

perfecto en subjuegos se obtiene por inducción retroactiva. Comenzamos por el último

subjuego. En este subjuego, r es una acción dominada; por tanto, no puede formar parte de la

estrategia de la jugadora 1 en un equilibrio perfecto en subjuegos, de modo que la eliminamos

y computamos el juego reducido

D (1, 1)
(2, 2)
R
1
I r (-1, -1)
2
S
1 s (0, 3)

En la segunda etapa de la inducción retroactiva, nos fijamos en el anterior subjuego, el

correspondiente a la jugadora 2. En este subjuego R es una acción dominada para ls jugadora

2. Dado que la jugadora 2 anticipa que la jugadora 1 no va a jugar r jugar R es una acción

dominada o amenaza no creíble. Por tanto, la eliminamos y computamos el juego reducido

D (1, 1)
(2, 2)
R
1
I r (-1, -1)
2
S
1 s (0, 3)

En su primer nodo de decisión, la jugadora 1 tiene como acción dominada (en el juego

reducido) I, y por tanto jugará D. Luego el equilibrio perfecto en subjuegos es (Ds, S).

29
Tema 1. Tª de Juegos y estrategia competitiva

Podemos interpretar la lógica de la inducción retroactiva de la siguiente forma. Cuando la

jugadora 2 tiene que elegir debería conjeturar que si juega S la jugadora 1 seguro que jugará s.

La jugadora 2 es capaz de predecir el comportamiento racional de la jugadora 1 ya que esta

último observa la acción elegida por ella. Si la jugadora 1 es igualmente racional debería

anticipar el comportamiento de la jugadora 2 y jugar D.

EJEMPLO 16 (1, 2)
L
M (1, 1)

A 2
N (0, 0)
r (2, 2)

1 O
B s (2, 0)
1
2 r (0, 1)
P

s (-1, 3)

En este juego, hay multiplicidad de equilibrios de Nash y no podemos aplicar la inducción

retroactiva ya que hay un subjuego de información imperfecta. Utilizaremos la definición de

equilibrio perfecto en subjuegos y requeriremos que las partes relevantes de las estrategias de

equilibrio sean también de equilibrio en los subjuegos.

(1, 2)
L
M (1, 1)

2 N (0, 0)

30
Tema 1. Tª de Juegos y estrategia competitiva

En el subjuego superior (el subjuego de información perfecta), la única amenaza creíble es L.

r (2, 2)

O
s (2, 0)
1
r (0, 1)
2 P

s (-1, 3)

En el subjuego inferior (el subjuego de información imperfecta que empieza en el nodo de decisión

inferior de la jugadora 2), es directo comprobar que el equilibrio de Nash es O, r.

En su primer nodo de decisión, la jugadora 1 tiene que elegir entre A y B anticipando que si elige A

la jugadora 2 jugará L y si elige B, entonces ambas jugarán el equilibrio de Nash (del subjuego) O,

r. En consecuencia, la jugadora 1 elige B.


L
(1, 2)

A 2

1
B O r
(2, 2)
2
1

Por tanto, el equilibrio perfecto en subjuegos es (Br, LO): las partes relevantes de las estrategias de

equilibrio son también de equilibrio en cada uno de los subjuegos.

31
Tema 1. Tª de Juegos y estrategia competitiva

1.3. Juegos repetidos

EJEMPLO 2: Dilema de la prisionera

C (1, 1) 2
C NC
C
NC (3, 0) C (1, 1) (3, 0)
2
1 C (0, 3) 1
NC
NC (0, 3) (2, 2)
NC (2, 2)

Cuando el juego se juega una vez, (C, C) es un equilibrio de Nash en estrategias dominantes y

la cooperación o colusión entre las jugadoras no se puede sostener como equilibrio. Aunque

las jugadoras obtendrían mayores pagos en la combinación de estrategias (NC, NC) ambas

tendrían incentivos a desviarse utilizando su estrategia dominante. En esta sección, vamos a

estudiar las posibilidades de cooperación entre las jugadoras cuando el juego se repite.

1.3.1. Horizonte temporal finito

Supongamos que el juego (el dilema de la prisionera) se repite un número finito de veces: T

(conocido por ambos jugadoras). Conocemos que si T = 1 el único equilibrio de Nash del

juego es (C, C).

Lo primero que hay que notar es que si el juego se repite durante T periodos, una estrategia de

una jugadora en el juego repetido debe indicar lo que haría esta jugadora en cada etapa del

juego contingente con la historia pasada.

Vamos a utilizar un argumento de inducción retroactiva para mostrar que en el único

equilibrio perfecto en subjuegos de este juego repetido cada jugadora (independientemente de

32
Tema 1. Tª de Juegos y estrategia competitiva

la historia pasada) elegirá “confesar” en cada etapa del juego. Consideremos T, t = 1, 2,…..,

T, iteraciones del dilema de la prisionera.

Comencemos mirando al periodo T: en esta última etapa del juego, todo lo anterior (la

historia pasada del juego) resulta irrelevante (ya que no existe futuro) y sólo queda por jugar

una vez el dilema del prisionero. Por tanto, como cada jugadora tiene como estrategia

dominante (cuando el juego se juega sólo una vez) “confesar”, en el último periodo cada

jugadora decidirá “confesar”. La única razón para jugar “no confesar” en una etapa del juego,

sería para intentar mejorar en el futuro, ya que esta acción podría ser interpretada como un

signo de buena voluntad por la otra jugadora, consiguiendo su cooperación. Pero en la última

etapa del juego ya no hay futuro, y, por tanto, (C, C) es inevitable.

Consideremos ahora el periodo T-1. Dado que las jugadoras anticipan que en el último

periodo no van a cooperar, lo mejor que pueden hacer en el periodo T-1 es seguir su estrategia

dominante a corto plazo, es decir, “confesar”. La única razón para jugar “no confesar” en esta

etapa del juego sería para intentar mejorar en el futuro, pero en el periodo T las jugadoras

elegirán (C, C). El mismo argumento se aplicaría a los periodos T-2, T-3,….hasta el periodo

1. Por tanto, el equilibrio perfecto en subjuegos del dilema de la prisionera repetido un

número finito de veces T, consiste simplemente en T repeticiones del equilibrio de Nash a

corto plazo. Por tanto, si el juego se repitiera un número finito (y conocido) de veces, en el

único equilibrio perfecto en subjuegos cada jugadora elegiría su estrategia dominante a corto

plazo en cada ronda del juego. Luego la cooperación entre las jugadoras no se puede sostener

como equilibrio cuando el horizonte temporal es finito.

33
Tema 1. Tª de Juegos y estrategia competitiva

1.3.2. Horizonte temporal infinito

Hay dos formas de interpretar un horizonte temporal infinito:

(i) Interpretación literal: el juego se repite infinitos periodos. En este contexto, cuando una

jugadora compara una estrategia con otra debería comparar el valor presente descontado de

las respectivas ganancias. Sea δ el factor de descuento, 0 < δ < 1. Si r es el tipo de interés

1
δ= . El factor de descuento mide cuánto valoramos el futuro en comparación con el
1+ r

presente. Así, si δ = 0 (que corresponde con r = ∞ ) entonces solo nos interesa el presente,

mientras que si δ = 1 (que corresponde con r = 0) entonces el futuro nos importa lo mismo

que el presente.

(ii) Interpretación informacional: no se conoce la duración del juego. En cada etapa del

juego, existe una probabilidad 0 < δ < 1 de que el juego continúe. En este marco, cada

jugadors debería comparar el pago esperado (que también se podría descontar) de las

diferentes estrategias.

En este contexto, una estrategia de una jugadora especificará su comportamiento en cada


t −1
periodo t como una función de la historia pasada del juego. Represente Ht −1 = {s1τ , s 2 τ }τ =1 ,

donde s iτ ∈{C, NC} , la historia pasada del juego.

En primer lugar, nótese que hay un equilibrio perfecto en subjuegos del juego infinitamente

repetido en el que cada jugadora juega C (su estrategia dominante a corto plazo) en cada

periodo. Cada jugadora tendría como estrategia “confesar en cada periodo con independencia

de la historia pasada del juego”.

34
Tema 1. Tª de Juegos y estrategia competitiva

Vamos a ver si además del anterior equilibrio, hay algún equilibrio perfecto en subjuegos en

el que las jugadoras cooperen. Consideremos la siguiente combinación de estrategias a largo



plazo. s i ≡ {s it (H t−1 )}t=1
c

donde,

 NC si todos los elementos de H t −1 son iguales a ( NC , NC ) o t = 1


sit ( H t −1 ) = 
C en caso contrario

i =1,2.

Podemos resumir esta estrategia de la siguiente forma:

“Cooperar (no confesar) en cada periodo si anteriormente se ha cooperado (es decir se ha

jugado no confesar periodo tras periodo) o t = 1 . No cooperar (confesar) durante el resto del

juego si anteriormente alguna jugadora se ha desviado de la cooperación”.

Nótese que estas estrategias a largo plazo incorporan “amenazas implícitas de castigo” en

caso de violación del acuerdo (implícito) de cooperación. La amenaza para que sea creíble

debe ser equilibrio de Nash.

Para ver si en este contexto se puede sostener como equilibrio la cooperación, tenemos que

comprobar que las jugadoras no tienen incentivos a desviarse; es decir, que la combinación de
c c
estrategias (s1 , s2 ) constituye un equilibrio de Nash del juego repetido. El valor presente

descontado de las ganancias futuras de la jugadora i de cooperar viene dado por:

2
π i (s ic , s cj ) = 2 + 2δ + 2δ 2 + .... = 2(1 + δ + δ 2 + ...)=
1−δ

35
Tema 1. Tª de Juegos y estrategia competitiva

Supongamos que la jugadora i se desvía y lo hace en el primer periodo del juego. Dado que la

otra jugadora si sigue su estrategia le penalizará durante el resto del juego, lo mejor que puede

hacer si confiesa en el primer periodo, es confesar también durante el resto del juego. Sus

ganancias vendrían dadas por:

1
π i (s i , s jc ) = 3 + 1δ +1δ 2 + .... = 3 + δ (1 + δ + δ 2 + ...) = 3 + δ
1−δ
La cooperación será equilibrio de Nash si ninguna de las jugadoras tiene incentivos a

1
desviarse; es decir, si π i (s ic , s cj ) ≥ π i (si , s cj ) . Es inmediato comprobar que si δ ≥
2
ninguna de las jugadoras tiene incentivos a romper el acuerdo de colusión.

Vamos a comprobar a continuación como el equilibrio es perfecto en subjuegos: es decir, que

las amenazas son creíbles. Consideremos un subjuego que surge después de que una

desviación se ha producido. La estrategia de cada jugadora exige “confesar” en todo periodo

futuro, independientemente del comportamiento de su rival. Este par de estrategias constituye

un equilibrio de un dilema del prisionero infinitamente repetido ya que cada jugadora si no se

desvía obtendría un pago de (si la desviación se ha producido en el periodo T-1)

T −1 δ T −1
δ (1 + δ + δ + ...)=
2
1−δ
mientras que obtendría un pago de 0 cada periodo que se desviase de la estrategia

cooperativa.

El análisis anterior sirve como ejemplo de un principio general que ocurre en situaciones de

juegos repetidos con horizonte temporal infinito. En estos juegos es posible sostener como

equilibrio comportamientos que no son de equilibrio en el corto plazo. Esto se produce

gracias a la “amenaza implícita de castigo” de que en caso de incumplimiento del acuerdo se

36
Tema 1. Tª de Juegos y estrategia competitiva

“castiga” durante el resto del juego. De modo que el aumento de beneficios (derivado de la

violación del acuerdo) a corto plazo, no compensa la pérdida de beneficios durante el resto del

juego.

1.4. Conclusiones

Hemos visto diferentes métodos de resolución de juegos, aunque ninguno de ellos está exento

de problemas. El criterio de dominación (eliminación de estrategias dominadas) aunque útil

para resolver algunos juegos, no sirve para otros al no realizar ninguna propuesta de solución.

La versión “débil” de este criterio (eliminación de estrategias débilmente dominadas) es de

gran utilidad para seleccionar entre los equilibrios de Nash, especialmente en juegos en forma

normal o estratégica. El criterio de inducción retroactiva permite realizar propuestas de

solución en juegos en forma extensiva. Tiene la importante propiedad de que para juegos de

información perfecta y sin empates conduce a una única propuesta de solución. Pero la

posibilidad de empates, la existencia de información imperfecta y la racionalidad ilimitada

que puede requerir en algunos juegos, son los principales problemas que presenta. Este

criterio de inducción retroactiva resulta de gran utilidad para seleccionar entre los equilibrios

de Nash (en juegos en forma extensiva). De la utilización conjunta de este criterio y de la

noción de equilibrio de Nash surge el concepto de equilibrio perfecto en subjuegos.

Aunque también presenta problemas (ineficiencia, inexistencia y multiplicidad) el equilibrio

de Nash es el criterio de solución más general y más ampliamente utilizado para resolver

juegos. Se considera que ser equilibrio de Nash es una condición necesaria (aunque no

suficiente) para que cualquier propuesta de solución sea una predicción razonable del

comportamientos racional de los jugadores. Si para algún juego se propone como solución

37
Tema 1. Tª de Juegos y estrategia competitiva

una combinación de estrategias que no constituye un equilibrio de Nash, esta predicción sobre

el comportamiento de los jugadores se vería desmentida por el propio desarrollo del juego. Al

menos un jugador tendría incentivos a cambiar su estrategia con respecto a la predicha para él.

En conclusión, aunque presenta problemas, existe cuasi-unanimidad sobre que toda propuesta

de solución debe ser como mínimo equilibrio de Nash.

38

También podría gustarte