A DT UCM
A DT UCM
A DT UCM
Begoña Vitoriano
[email protected]
Julio 2007
MÉTODOS DE DECISIÓN
ÍNDICE
15/02/2008 i
I.4.5.2 Una caracterización de las soluciones: las imputaciones ...................................................79
I.4.5.3 Un concepto de solución de un juego: El núcleo...............................................................80
I.4.5.4 Un concepto de solución de un juego: El valor Shapley....................................................81
I.5 REFERENCIAS ............................................................................................85
I.6 BIBLIOTECA DE PROBLEMAS ......................................................................87
I.7 RESULTADOS DE LA BIBLIOTECA DE PROBLEMAS ......................................101
ii 15/02/2008
MÉTODOS DE DECISIÓN
15/02/2008 3
MÉTODOS DE DECISIÓN
An Xn1 Xn 2 X nm
A la matriz central formada por las consecuencias, se le suele denominar
matriz de pagos o consecuencias, tomada esta denominación más del contexto
de la teoría de juegos que de la decisión clásica.
15/02/2008 5
I.2 TEORÍA DE LA DECISIÓN CON INCERTIDUMBRE O RIESGO
6 15/02/2008
MÉTODOS DE DECISIÓN
15/02/2008 7
I.2 TEORÍA DE LA DECISIÓN CON INCERTIDUMBRE O RIESGO
8 15/02/2008
MÉTODOS DE DECISIÓN
• Criterio de Hurwicz
En este caso, para cada alternativa tenemos: A1 1500, A2 3000 α +500(1- α ),
A3 4500 α -500(1- α ) y A4 6000 α -1500(1- α ). Si α <0.4, la alternativa sería
producir 1 artículo, mientras que si es superior sería producir 4 artículos.
• Criterio de Savage
El primer paso es construir la matriz de penalizaciones o costes de
oportunidad. La matriz la formamos por columnas, obteniendo el máximo de
la columna y restándole a este valor el pago de cada alternativa. Así la
matriz obtenida es:
0 1500 3000 4500
1000 0 1500 3000
2000 1000 0 1500
3000 2000 1000 0
Ahora aplicamos el criterio minimax, para minimizar la máxima
penalización, obteniendo que los máximos son 4500, 3000, 2000 y 3000, por lo
que la alternativa sería producir 3 artículos.
15/02/2008 9
I.2 TEORÍA DE LA DECISIÓN CON INCERTIDUMBRE O RIESGO
10 15/02/2008
MÉTODOS DE DECISIÓN
D2
Buen tiempo
0'7 D.Alta 0'3 65.000
A'2 95.000
A1 P. Pequeño D.Media 0'5
permiso
D.Baja 0'2 -10.000
D1 Mal tiempo
0'3 -40.000
No permiso 0
15/02/2008 11
I.2 TEORÍA DE LA DECISIÓN CON INCERTIDUMBRE O RIESGO
todos los nodos, así que lo desarrollaremos según el criterio del valor
medio.
• Nodo A’2: puesto que se ha decidido hacerlo según el criterio del valor
medio, será 65.000.
• Nodo D2: al ser un nodo de decisión se valora con el mejor valor de los
nodos conectados a él, es decir, el mejor de A2 y A’2, con 65.000
• Nodo A1: es un nodo de azar, luego se valora por el criterio adoptado con
la media del nodo 45.500.
• El otro nodo es un nodo terminal valorado con 0.
• Nodo D1: es un nodo de decisión en el que se elige entre 45.500 y 0, con
lo que resulta valorado 3n 45.500. Además es el nodo inicial, con lo que
ya se ha valorado todo el árbol.
Así la política óptima resulta ser pedir el permiso en Enero, y si hace buen
tiempo ir con pedido pequeño. Esta política óptima nos da una ganancia
esperada de 45.500 euros.
En bastantes situaciones es posible incorporar información al árbol de
decisión de manera parcial. Para llevar a cabo esta incorporación ha de
utilizarse el análisis bayesiano. Este análisis modifica las probabilidades de los
escenarios en función de la nueva información de que se dispone.
El análisis bayesiano se fundamenta en los dos resultados de probabilidad
más utilizados en el cálculo de probabilidades condicionadas: el teorema de
Bayes y el teorema de la probabilidad total.
El teorema de la probabilidad total permite calcular la probabilidad de un
suceso a partir de las probabilidades de este suceso condicionadas a otros
sucesos que formen un sistema completo, es decir, cuya unión sea todo el espacio
muestral y sean disjuntos. Así si {B1,..., Bn } son tales que ∪Bi = Ω y
Bi ∩ B j = ∅ ∀i ≠ j , para cualquier suceso (no necesariamente sobre el mismo
espacio) se tiene
P (A) = ∑ P (A / Bi ) ⋅ P (Bi )
i
Por otra parte el teorema de Bayes establece la probabilidad de un suceso A
condicionada a la ocurrencia de otro suceso, cuando la información de la que se
dispone es del condicionado inverso:
P (A / B ) ⋅ P (B )
P (B / A) =
P (A)
Supóngase que en el ejemplo anterior, el vendedor dado la suma tan alta que
está en juego busca desesperadamente alguien que pueda darle información
adicional en Enero acerca de lo que va a ocurrir con el clima en septiembre. Al
fin encuentra a un experto meteorólogo que le dice que él puede hacer una
12 15/02/2008
MÉTODOS DE DECISIÓN
predicción por 10.000 euros de nada, y que ya lo ha hecho más veces con los
siguientes resultados:
- cuando hizo bueno acertó 3 de cada 5 veces
- cuando hizo malo acertó 2 de cada 5 veces.
Al vendedor entonces se le presenta una decisión previa a decidir si va a
pedir el permiso que es si consultar al experto. Así ahora el nodo inicial es otro
del que salen dos arcos, uno que es consultar al experto y otro que es no hacerlo.
En el caso de que no le consulte todo se mantiene igual exactamente que antes,
con lo que el nodo que sale de ahí ya estaría valorado: 45.500. Quedaría por
valorar el otro nodo, pero hay que tener en cuenta que tras la consulta viene un
nodo de azar acerca del resultado de la consulta, y que además según sea este
resultado modifica las posteriores probabilidades de ocurrencia de buen tiempo y
mal tiempo (todo ello fiándonos de lo que dice el experto, claro está).
Así, primero necesitamos obtener las probabilidades de lo que dirá el
experto.
Empecemos por recopilar y denotar la información disponible. Llamaremos B al
suceso hace buen tiempo en septiembre y M al suceso hace mal tiempo.
Llamaremos DB al suceso el experto dice que va a hacer buen tiempo, y DM
al suceso el experto dice que va a hacer mal tiempo.
La información de la que disponíamos ya es P (B ) = 0.7 y P (M ) = 0.3 . Por
otra parte, ahora nos dicen P (DB / B ) = 3 / 5 = 0.6 y P (DM / M ) = 2 / 5 = 0.4 ,
de los que se deducen por complementariedad, P (DM / B ) = 1 − 3 / 5 = 0.4 y
P (DB / M ) = 1 − 2 / 5 = 0.6 . De estos datos, aplicando el teorema de la
probabilidad total podemos obtener directamente la probabilidad de que el
experto diga que hará bueno o que diga que hará malo:
P (DB ) = P (DB / B )P (B ) + P (DB / M )P (M ) = 0.6 × 0.7 + 0.6 × 0.3 = 0.6
P (DM ) = P (DM / B )P (B ) + P (DM / M )P (M ) = 0.4 × 0.7 + 0.4 × 0.3 = 0.4
Este último valor podía haberse obtenido directamente por complementariedad.
Estas serán las probabilidades de los arcos que salen del nodo del experto,
pero según sea una u otra afectará a las probabilidades que habrá que poner en
los arcos posteriores cuando se llegue al nodo de la previsión meteorológica de
septiembre, ya que las probabilidades han de ser probabilidades condicionadas a
los valores que la aleatoriedad haya tomado previamente. Así en los arcos
posteriores al que dice que el experto dice que hará bueno, las probabilidades
que hay que situar son P (B / DB ) y P (M / DB ) , mientras que en las que
derivan del estado dice el experto que hará malo serán condicionadas al suceso
DM . Por lo tanto, hay que calcular estas probabilidades condicionadas ya que
no las tenemos y para ello se utiliza el teorema de Bayes:
P (DB / B )P (B ) 0.6 × 0.7
P (B / DB ) = = = 0.7
P (DB ) 0.6
15/02/2008 13
I.2 TEORÍA DE LA DECISIÓN CON INCERTIDUMBRE O RIESGO
14 15/02/2008
MÉTODOS DE DECISIÓN
3/4 0
se denotaría por (1/4, 500; 3/4, 0).
Se define la relación L1pL2 si la lotería L1 es preferida a la lotería L2 , y la
relación de equivalencia L1iL2 si la lotería L1 es indiferente a la lotería L2 , es
decir, son equivalentes.
Dadas estas definiciones, podemos definir formalmente la utilidad de una
cantidad ri en función de una lotería y que denotaremos por u(ri ) como el valor
qi tal que es equivalente recibir con seguridad la cantidad ri , que sería la lotería
(1, ri ) a la lotería en que se recibe con probabilidad qi el valor más favorable de
la lotería de referencia y con probabilidad 1 − qi el resultado menos favorable.
La función de utilidad sería la función que especifica todos los pagos de la
lotería, y la utilidad esperada de una lotería sería ∑ piu(ri ) . Así pues, las
i
alternativas de un problema de decisión se pueden ver como loterías, ya que se
tienen unos pagos con ciertas probabilidades cuando es decisión bajo riesgo.
Dadas estas definiciones, se pueden mostrar los axiomas que Von Neumann y
Morgestern establecieron para que una relación de preferencia/indiferencia
pueda definir una función de utilidad.
15/02/2008 15
I.2 TEORÍA DE LA DECISIÓN CON INCERTIDUMBRE O RIESGO
0.3 10 0.15 10
0.5
0.7 -5
0.5 -5 0.85 -5
16 15/02/2008
MÉTODOS DE DECISIÓN
V a lo r re a l
15/02/2008 17
MÉTODOS DE DECISIÓN
1
No tiene sentido sin aleatoriedad, ya que si el conjunto está definido
explícitamente y no hay aleatoriedad, basta una exploración de las alternativas
para ver cuál es la mejor.
15/02/2008 19
I.3 DECISIÓN MULTICRITERIO
20 15/02/2008
MÉTODOS DE DECISIÓN
z2
Espacio de objetivos
Alternativas dominadas
z1
Sin embargo, en la mayoría de las situaciones, el fin último es dar una única
solución, no un conjunto de posibles soluciones. Se denomina solución de mejor
compromiso a la solución del conjunto eficiente que es seleccionada por el
decisor.
A continuación, vamos a ver diferentes métodos usados en decisión
multicriterio continua. Básicamente hay dos enfoques dentro de estos métodos:
los métodos de optimización multiobjetivo y los métodos satisfacientes o
programación por metas.
15/02/2008 21
I.3 DECISIÓN MULTICRITERIO
3500 C’
D’
Coste
2000
E’ B’
1000
A’
2 C alid a d 9 11
22 15/02/2008
MÉTODOS DE DECISIÓN
max zl (x ) ⎫⎪
⎪⎪
⎪⎪
x ∈F ⎬ Pl (ε)
⎪⎪
z k (x ) ≥ εk k = 1,..., l − 1, l + 1,..., p⎪⎪
⎪⎭
El fundamento de este procedimiento se recoge en los dos resultados
siguientes:
Teorema: Si la solución del problema Pl (ε) es única, entonces es una solución
eficiente.
15/02/2008 23
I.3 DECISIÓN MULTICRITERIO
24 15/02/2008
MÉTODOS DE DECISIÓN
15/02/2008 25
I.3 DECISIÓN MULTICRITERIO
z i (x ) + ni − pi = zˆí i = 1,..., p
x ∈F
ni ≥ 0, pi ≥ 0 i = 1,..., p
26 15/02/2008
MÉTODOS DE DECISIÓN
15/02/2008 27
I.3 DECISIÓN MULTICRITERIO
28 15/02/2008
MÉTODOS DE DECISIÓN
15/02/2008 29
I.3 DECISIÓN MULTICRITERIO
30 15/02/2008
MÉTODOS DE DECISIÓN
Z1
f2
Z2
Z
f1
15/02/2008 31
I.3 DECISIÓN MULTICRITERIO
32 15/02/2008
MÉTODOS DE DECISIÓN
w1 − 2w2 + n1 − p1 = 0
w1 − 5w 3 + n2 − p2 = 0
w2 − 3w 3 + n 3 − p3 = 0
w1 + w 2 + w 3 = 1
La solución obtenida es (w1, w2, w 3 ) = (.588,.294,.118) , siendo las variables de
desviaciones n1 = p1 = p2 = n2 = p3 = 0, n 3 = 0.06 .
• Nivel 3:
La interacción con el decisor en este nivel supone que el decisor emita sus
juicios de valor cuando se comparan las alternativas por parejas para un
determinado criterio. De esta forma se obtiene una tabla de
comparaciones de alternativas para cada criterio. Estas comparaciones se
valoran igual que en el caso anterior. Supongamos que para el ejemplo, se
han obtenido las siguientes tres tablas:
A B C A B C A B C
15/02/2008 33
I.3 DECISIÓN MULTICRITERIO
A 1 6 3 . A 1 1/9 1/5 . A 1 ½ ¼
B 1/6 1 ½ B 9 1 2 B 2 1 ½
C 1/3 2 1 C 5 ½ 1 C 4 2 1
Coste Imp. Medioamb. Tiempo ejecuc.
Por último, se obtienen los pesos globales de las alternativas para ambos
niveles jerárquicos mediante una agregación multiplicativa, es decir, para cada
alternativa se suman los productos de los pesos de ésta por el peso del criterio
correspondiente. Así, para la alternativa A se obtendría
0.667x0.588+0.069x0.294+0.143x0.118=0.429. De esta forma se obtienen los
pesos globales 0.429 para A, 0.282 para B y 0.289 para C. De este modo se
obtiene una ordenación de las alternativas, resultando la A la preferida.
34 15/02/2008
MÉTODOS DE DECISIÓN
Algoritmo Electre
1.- Formar la matriz decisional (Ei,Aj), es decir, una matriz donde las filas son
las posibles elecciones y las columnas los atributos, siendo el “valor” de un
elemento de la matriz el valor de ese atributo para esa elección.
Dar un vector de pesos preferencial de los atributos W, es decir, dar un
vector que ordene la importancia de los criterios. La forma más sencilla de
obtenerlo es pedirle al decisor que clasifique los criterios por orden de
importancia, de modo que si hay n criterios, al más importante le asigne el
valor 1 y al menos importante el valor n ; a continuación, con el fin de que
la suma de los pesos sea 1 se le asigna al criterio en posición j-ésima el peso
1/ r n − rj + 1
Wj = n j o el peso Wj = n . El problema de este método es
∑ ri
i =1
∑ (n − ri + 1)
i =1
que no tiene en cuenta la diferencia de importancia entre criterios, es decir,
cuánto más importante es uno que el siguientes. Para evitarlo Saaty propone
otro método que consiste en comparar los criterios por parejas, de modo que
se asigne un 1 si ambos son de la misma importancia, un 3 si hay una
moderada importancia de un criterio respecto a otro, un 7 si hay una
demostrada importancia y un 9 si hay extrema importancia. Con ello se
forma una matriz cuadrada aij que valora la importancia del criterio i
respecto al j. Si la importancia de un criterio respecto a otro es aij , a la
inversa será 1/ aij . Obtenida esta matriz, se busca un vector de pesos para
15/02/2008 35
I.3 DECISIÓN MULTICRITERIO
Wi
los criterios que sea solución del sistema = aij . Lamentablemente, ese
Wj
sistema no suele tener solución dadas las normales inconsistencias del decisor
y hay que buscar los que más se aproximen.
Aunque no puede hablarse de cuál es el mejor método para estimar pesos
preferenciales, siempre que la situación lo permita parecen tener más solidez
los métodos propuestos por Saaty que los anteriores.
2.- Cálculo de la matriz de índices de concordancia, c(i,k):
c(i,k) = suma de los pesos de los atributos en que Ei es mejor que Ek
(en caso de empate en un atributo se suma la mitad del peso)
3.- Normalización de la matriz decisional: consiste en normalizar los criterios
para evitar el posible efecto de trabajar con distintas unidades. Hay varios
métodos para la normalización: dividir los valores por el mejor que haya en
ese criterio, o dividir por el rango o recorrido del criterio, o restar al mejor
valor del criterio el de esa alternativa y dividir después por el rango (con
este procedimiento los valores quedan entre 0 y 1, siendo 0 el mejor y 1 el
peor).
4.- Cálculo de la matriz de decisión normalizada y ponderada: Multiplicar cada
columna (atributo) de la matriz de decisión por el peso preferencial
correspondiente a ese atributo.
5.- Cálculo de la matriz de índices de discordancia, d(i,k):
d(i,k) = diferencia mayor entre los criterios en que Ei es dominada por Ek
dividida entre la diferencia mayor en valor absoluto entre los valores de un
criterio cualquiera.
6.- Fijar un umbral mínimo de concordancia, c , y un umbral máximo de
discordancia, d .
7.- Calcular la matriz de dominancia concordante: poner un 1 si el índice de
concordancia es mayor que el umbral, un 0 si no.
8.- Calcular la matriz de dominancia discordante: poner un 1 si el índice de
discordancia es menor que el umbral, un 0 si no.
9.- Calcular la matriz de dominancia agregada: multiplicar términos homólogos
de las matrices de dominancia concordante y discordante. Así si un elemento
de esa matriz es 1 es porque la alternativa de esa fila es mejor que la de la
columna en un número de importante de criterios y no es claramente peor en
ningún criterio. Si hay un 0 es que o bien no es mejor en un número
importante de criterios o es claramente peor en algún criterio o ambas.
10.- Obtener el núcleo: se eliminan las alternativas que están sobreclasificadas
por alguna otra, es decir, las que tienen al menos un 1 en su columna en la
matriz de dominancia agregada. Si se representa en un grafo en los nodos las
alternativas y en los arcos las sobreclasificaciones (el origen es la alternativa
36 15/02/2008
MÉTODOS DE DECISIÓN
que sobreclasifica a otra que es el destino), el núcleo será único si este grafo
no tiene circuitos.
w1 − 2w2 + n1 − p1 = 0
w1 − 5w 3 + n2 − p2 = 0
w2 − 3w 3 + n 3 − p3 = 0
w1 + w 2 + w 3 = 1
La solución obtenida es (w1, w2, w 3 ) = (.588,.294,.118) , siendo las variables de
desviaciones n1 = p1 = p2 = n2 = p3 = 0, n 3 = 0.06 .
15/02/2008 37
I.3 DECISIÓN MULTICRITERIO
38 15/02/2008
MÉTODOS DE DECISIÓN
⎡ A B C D E⎤
⎢ ⎥
⎢A − 1 1 1 1 ⎥
⎢ ⎥
⎢ ⎥
⎢B 0 − 1 0 1 ⎥
⎢ ⎥
⎢C 0 0 − 1 1 ⎥
⎢ ⎥
⎢ ⎥
⎢ D 0 0 0 − 1 ⎥
⎢ ⎥
⎢ E 0 0 0 0 −⎥
⎣ ⎦
8.- Calcular la matriz de dominancia discordante: poner un 1 si el índice de
discordancia es menor que el umbral, un 0 si no.
⎡ A B C D E⎤
⎢ ⎥
⎢A − 1 1 0 0 ⎥
⎢ ⎥
⎢ ⎥
⎢B 0 − 1 1 0 ⎥
⎢ ⎥
⎢C 0 1 − 0 0 ⎥
⎢ ⎥
⎢ ⎥
⎢ D 0 0 1 − 1 ⎥
⎢ ⎥
⎢ E 0 0 0 0 −⎥
⎣ ⎦
9.- Calcular la matriz de dominancia agregada: multiplicar términos homólogos
de las matrices de dominancia concordante y discordante.
⎡ A B C D E⎤
⎢ ⎥
⎢A − 1 1 0 0 ⎥
⎢ ⎥
⎢ ⎥
⎢B 0 − 1 0 0 ⎥
⎢ ⎥
⎢C 0 0 − 0 0 ⎥
⎢ ⎥
⎢ ⎥
⎢ D 0 0 0 − 1 ⎥
⎢ ⎥
⎢ E 0 0 0 0 −⎥
⎣ ⎦
10.- Obtener el núcleo: es único y está formado por las alternativas A y D.
Según el grafo:
B
C
A
E D
15/02/2008 39
MÉTODOS DE DECISIÓN
15/02/2008 41
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
⎛ (a b ) (a1n,b1n ) ⎞⎟⎟
⎜⎜ 11, 11
⎜⎜ ⎟⎟
⎜⎜ ( ij , ij )
a b ⎟⎟
⎜⎜ ⎟⎟
⎟
⎜⎜(a b )
⎝ m 1, m 1 (amn,bmn )⎠⎟⎟⎟
siendo aij el pago que recibe el primer jugador si él opta por su estrategia i-
ésima y el segundo jugador por la j-ésima, y bij el pago que recibe el segundo
jugador si eligen ambos esas mismas estrategias.
42 15/02/2008
MÉTODOS DE DECISIÓN
15/02/2008 43
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
44 15/02/2008
MÉTODOS DE DECISIÓN
otro evidentemente esta sería la solución, pero, es que en tal caso no habría
conflicto.
El concepto de solución dependerá del tipo de juego con el que se trabaje, y
más concretamente, de si hay cooperación o no. En cualquier caso, habrá de ser
un concepto que represente el comportamiento racional de los jugadores.
Para el caso no cooperativo, este concepto es el de estrategias en equilibrio o
punto de equilibrio o punto de silla debido a Nash. Para el caso de dos jugadores
(es inmediato extrapolarlo al caso N-personal) (x *, y * ) es un par de estrategias
⎧M 1(x *, y * ) ≥ M 1(x , y * ) ∀x ∈ X
⎪
⎪
en equilibrio si y sólo si ⎪
⎨ ; es decir, es un par de
⎪
⎪M (x *
, y *
) ≥ M (x *
, y ) ∀ y ∈ Y
⎪
⎩ 2 1
estrategias para el cuál ningún jugador está interesado en cambiar de estrategia
unilateralmente.
Por ejemplo, en el caso del dilema del prisionero, el único par de estrategias
que hay en equilibrio es el par (D, D ) , es decir, que ambos se delatan. Es la
solución no sólo porque matemáticamente sea el único par que cumple las
condiciones, sino que por el propio razonamiento es la solución a la que llegarían
movidos únicamente por su propio interés. Veamos este razonamiento
analizando por parte de los jugadores las posibilidades que tienen. El jugador 1
observa que puede no delatar a su compañero, y si hace eso el jugador 2
buscando su propio interés lo que le conviene es delatar al jugador 1. Entonces
el jugador 1 observa que si el otro le va a delatar, a él le conviene delatar al
jugador 2. Este mismo razonamiento es válido para el jugador 2 ya que es un
juego cuyos pagos son simétricos.
Sin embargo, es evidente que este problema tiene una solución que
proporciona mejores pagos para ambos jugadores, que es la solución (ND, ND ) ,
es decir, que no se delatan, pero es una solución que no está en equilibrio porque
cualquiera de ellos observa que si el otro mantiene esa estrategia a él le va mejor
cambiar. Para poder optar al par de estrategias de no delatarse tendrían que
llegar a algún acuerdo, es decir, intercambiar información, lo que haría del juego
un juego cooperativo. En estos juegos, los cooperativos, el concepto de solución
pasa por las coaliciones, de modo que una coalición se reparte el beneficio
conjunto obtenido, pudiendo incluso llegar a alguna solución del tipo (ND, D ) o
viceversa, si ello favorece a ambos (obviamente para el dilema del prisionero en
el contexto planteado no sería una alternativa, pero sí si son consecuencias de
tipo económico) 2. La cooperación permite llegar a una solución que sea eficiente
2
La gran diferencia de la cooperación es que permite que la solución sea una
solución óptima en el sentido de Pareto.
15/02/2008 45
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
46 15/02/2008
MÉTODOS DE DECISIÓN
m
0 ≤ xi y ∑x
i =1
i = 1 . Así el elemento x i se interpreta como la probabilidad de
que J 1 elija su i-ésima estrategia.
Análogamente, una estrategia mixta y para J 2 es una distribución de
probabilidad sobre sus estrategias puras, es decir, es y = (y1,.., yn ) tal que
n
0 ≤ yj y ∑y
j =1
j = 1 . Así el elemento y j se interpreta como la probabilidad de
que J 2 elija su j-ésima estrategia.
Obsérvese que las estrategias puras no son más que un caso particular de las
estrategias mixtas, el caso degenerado (probabilidad 1 para una de las
estrategias y 0 para el resto).
En cualquier juego en el que a cada jugador le convenga adivinar la jugada
del otro y que el otro no adivine la suya, no existe ningún equilibrio de Nash
como el considerado anteriormente, porque el juego incluye necesariamente un
elemento de incertidumbre sobre lo que harán los jugadores (por ejemplo, el
juego de pares y nones, el póker, etc).
Dado este nuevo concepto de estrategia hay que establecer el pago asociado
a un par de estrategias de estas características, siendo éste el pago esperado.
Dado un par de estrategias mixtas (x , y ) , el pago esperado por J 1 para este par
m n m n
de estrategias es EJ 1 [x , y ] = ∑ ∑ aij x iy j y para J 2 sería EJ 2 [x , y ] = ∑ ∑ bij x iy j .
i =1 j =1 i =1 j =1
Para el siguiente ejemplo es inmediato ver que no existe un par de
estrategias puras en equilibrio,
⎛(2, −2) (4, −4) (3, −3)⎞⎟
⎜⎜ ⎟⎟
⎜
⎜⎝⎜(7, −7) (2, −2) (5, −5)⎠⎟⎟
y sean el par de estrategias mixtas x = (1/ 4, 3 / 4) e y = (1/ 5,2 / 5,2 / 5) . El
pago esperado del primer jugador para este par de estrategias será
11 12 12 31 32 32
EJ 1 [x , y ] = 2 +4 +3 +7 +2 +5 = 3 ' 95 ,
45 45 45 45 45 45
15/02/2008 47
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
48 15/02/2008
MÉTODOS DE DECISIÓN
15/02/2008 49
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
M : X ×Y →
estrategias del jugador 2, y es la matriz de pagos del
(x , y ) → M (x , y )
jugador 1.
En los juegos de suma nula cada jugador debe esperar lo peor del otro (lo
mejor para el otro jugador), con lo que la forma de buscar estrategias en
equilibrio para este problema es mediante el criterio pesimista, que será un
criterio maxi-min para el jugador 1 (para cada estrategia propia, fila de la
matriz, busca el mínimo y selecciona la que dé mayor valor mínimo) y un
criterio mini-max para el jugador 2 (para cada estrategia propia, columna de la
matriz, busca el máximo ya que es lo peor para él, y selecciona la que dé el
mínimo de esos valores). Si los valores obtenidos por la estrategia maximin del
primer jugador y la minimax del segundo coinciden, el par de estrategias está en
equilibrio, y a ese valor coincidente se le llama valor del juego, que es el pago
que recibirá el primer jugador con ese par de estrategias.
Como ejemplo sea la siguiente matriz de pagos de un juego de suma nula,
donde al final de cada fila se ha escrito el mínimo de ella, y al final de cada
columna el máximo. Es decir, si el jugador J 1 elige su primera estrategia, debe
esperar lo peor del jugador J 2 , es decir, J 2 elegirá su segunda estrategia
proporcionando al primer jugador un pago de –1. Y así sucesivamente.
J2
⎛2 −1 0⎞⎟ −1
⎜⎜ ⎟⎟
⎜⎜ ⎟⎟ 3
⎜⎜ 3 4 5 ⎟⎟
J1 ⎜
⎜⎜2 5 2⎟⎟⎟ 2
⎝ ⎠
3 5 5
Obtenidos los mínimos de la filas, evidentemente J 1 elige su segunda
estrategia que es la que le da mayor pago (3), y análogamente, J 2 elige su
primera estrategia que es la que da menor pago a J 1 y por lo tanto mayor para
sí mismo. Como ambos valores coinciden existe solución que es el par de
estrategias (2,1) y el valor del juego es v = 3 , es decir, el primer jugador recibe
3 unidades y el segundo –3.
Un análisis previo de las estrategias de los jugadores puede reducir las
posibles estrategias en equilibrio, mediante la eliminación iterativa de estrategias
dominadas, tal y como se vio en la sección anterior. Se dice que una estrategia
es una estrategia dominada si existe una combinación lineal convexa de las otras
estrategias que proporciona mejores pagos. Así a efectos de búsqueda de la
solución las estrategias dominadas pueden eliminarse. De forma esquemática, se
podría haber llegado a la solución siguiendo el siguiente proceso:
50 15/02/2008
MÉTODOS DE DECISIÓN
⎛2 −1 0⎞⎟ ↓ ↓
⎜⎜ ⎟⎟ → Domi.
⎜⎜
⎜⎜⎜
3 4 5⎟⎟⎟
⎟⎟
→ ⎛3 4 5⎞⎟ → ⎛⎜3
⎜⎜ ⎟ ⎜
⎞⎟
⎟⎟ (
→ 3 )
⎜⎜2 5 2⎟⎟⎟ ⎜⎜2
⎜⎜2 5 2⎟⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎟⎟ → D.
15/02/2008 51
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
52 15/02/2008
MÉTODOS DE DECISIÓN
dualidad, se tiene que v = w 3. Al ser problemas duales, basta con resolver uno
de ellos y obtener la solución del otro a partir de las variables duales.
Así pues, el procedimiento a seguir para resolver un juego de suma nula debe
ser el siguiente:
1. Buscar estrategias puras en equilibrio con las estrategias minimax y
maximin. Si existe solución, terminar.
2. Buscar estrategias mixtas óptimas planteando el problema de
programación lineal de uno de los jugadores, y dar como solución la
solución de este problema para ese jugador y la solución del dual para el
otro.
Obsérvese que en cualquier momento del proceso se puede reducir las
dimensiones del problema eliminando estrategias dominadas. Por su sencillez, no
se suele hacer antes del primer paso, pero si es necesario plantear el problema de
programación lineal en un paso previo se suelen eliminar para que el problema
sea de dimensiones menores.
Para ilustrar el procedimiento resolvamos el siguiente problema:
⎛2 4 3⎞⎟
⎜⎜ ⎟
⎜⎜7 2 5⎟⎟⎟
⎝ ⎠
1) Es claro que no hay estrategias puras en equilibrio, ya que para el jugador 1
los mínimos son 2 y 2, y para el jugador 2 los máximos son 7, 4, y 5. Como
no coinciden máximo de (2,2) y mínimo de (7,4,5), no hay estrategias puras
en equilibrio.
2) Formulamos uno de los problemas de programación lineal, o el del jugador 1
max v ⎫⎪
⎪
s.a. 2x 1 + 7x 2 ≥ v ⎪⎪⎪
⎪
4x 1 + 2x 2 ≥ v ⎪⎪⎪
⎪
3x 1 + 5x 2 ≥ v ⎬⎪
⎪⎪
x 1 + x 2 = 1 ⎪⎪
⎪⎪
x 1, x 2 ≥ 0 ⎪⎪
⎪⎭
o bien, el del jugador 2
3
La primera vez en la historia que se planteó el problema dual en
programación lineal fue en el contexto de la teoría de juegos, como el problema
del otro jugador. Posteriormente, se derivó de la programación no lineal,
obteniendo las propiedades que tiene el problema dual.
15/02/2008 53
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
min w ⎫⎪
⎪⎪
s.a. 2y1 + 4y2 + 3y 3 ≤ w ⎪⎪
⎪⎪
7y1 + 2y2 + 5y 3 ≤ w ⎪⎬
⎪
y1 + y2 + y 3 = 1 ⎪⎪⎪
⎪⎪
y1, y2 , y 3 ≥ 0 ⎪⎪
⎭
Si por ejemplo resolvemos este último problema, la solución óptima obtenida
es y1 = 2 / 7, y2 = 5 / 7, y 3 = 0 , siendo w = v = 24 / 7 , y las variables duales son
(−5 / 7, −2 / 7) , de donde se deduce que la estrategia óptima del primer jugador
es x 1 = 5 / 7 x 2 = 2 / 7 .
54 15/02/2008
MÉTODOS DE DECISIÓN
15/02/2008 55
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
56 15/02/2008
MÉTODOS DE DECISIÓN
* 1 we* + ws*
* we* + ws*
(w − w ) f (
s e ) = 1 − F( ) . Resolviendo este sistema, se llega a
2 2 2
que el punto medio entre ambas ofertas ha de ser la mediana de la distribución,
* *
es decir, F ( we +2 ws ) = 1/ 2 , y la distancia entre las dos ofertas
we* +ws*
ws* − we* = 1/ f ( ) . Por ejemplo, si la distribución del valor deseado por el
2
árbitro fuera una normal de media μ y desviación típica σ , dado que la media
we + ws
y mediana coinciden por ser simétrica, se tiene =μ y
2
ws − we
= 2πσ 2 , de donde se obtendría we* = μ − 2πσ 2 y ws* = μ + 2πσ 2 .
2
I.4.2.3.4 Los ejidos
Al menos desde Hume (1739) filósofos políticos y economistas han observado
que si los ciudadanos responden exclusivamente a incentivos privados, habrá un
déficit en la provisión de bienes públicos y los recursos comunes estarán
sobreutilizados. Veamos un ejemplo teórico pero que viene a ilustrar esta idea.
Sea una aldea de N habitantes, que se dedican al cuidado de cabras y
comparten un ejido en el que pastan sus cabras. Sea gi el número de cabras que
posee el i -ésimo habitante, siendo el total de cabras G = ∑ gi . Sea c el coste
i
de comprar y cuidar una cabra, independiente del número de cabras que se
posean, y sea v(G ) el valor unitario de una cabra cuando hay G cabras en el
ejido. Esta función de valor ha de cumplir ciertas condiciones; una es que hay
un número máximo de cabras que pueden pastar en el ejido, Gmax , de modo que
a partir de él la función de valor será 0; otra condición es que cuántas más
cabras haya, menor será el valor unitario de éstas pues las condiciones
empeoran, de modo que para G < Gmax será v '(G ) < 0 ; y, por último, el
decrecimiento del valor será más acentuado cuanto mayor sea el número de
cabras, es decir, si hay pocas cabras añadir una no hace que disminuya mucho el
valor, pero cuando ya hay muchas y está a punto de saturarse ese efecto será
más fuerte; para expresar este comportamiento se pedirá v ''(G ) < 0.
Supóngase que los habitantes deciden simultáneamente cuántas cabras tener.
El espacio de estrategias de cada habitante será Xi = [0, ∞) , o también valdría,
Xi = [0,Gmax ) . La ganancia de cada habitante por tener gi cabras cuando las
que tienen los demás suman g−i = g1 + ... + gi−1 + gi +1 + ... + gn , será
giv(gi + g−i ) − cgi , de modo que el problema que se plantea cada habitante si
responde a incentivos personales exclusivamente, será max giv(gi + g−* i ) − cgi .
gi ≥0
Derivando e igualando a cero para obtener las condiciones de primer orden, se
tiene v(gi + g−* i ) + giv '(gi + g−* i ) − c = 0 . Si se suman todas estas condiciones
15/02/2008 57
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
58 15/02/2008
MÉTODOS DE DECISIÓN
1) Los jugadores
2) Las estrategias posibles de cada jugador, donde se entiende por estrategia
un plan de acción completo
3) La ganancia recibida por cada jugador para cualquier combinación
posible de jugadas
Sin embargo, los elementos que se han de precisar cuando se describe un
juego en forma extensiva siguen otra secuencia:
1) Los jugadores
2) A) Cuándo tiene que jugar cada jugador
B) Lo que cada jugador puede hacer cuando tiene oportunidad de jugar
C) Lo que el jugador sabe cuando tiene oportunidad de jugar
3) La ganancia recibida por cada jugador para cualquier combinación posible
de jugadas
Esta forma extensiva, se puede representar en forma de árbol, si bien, la
representación de lo que sabe cada jugador para verlo en forma de árbol
requiere de un concepto más, que veremos con posterioridad. En general, para
juegos dinámicos, resulta mucho más apropiada la representación en forma
extensiva que la representación en forma normal. Veamos un ejemplo. Sea un
juego en que el jugador 1 elige una de las acciones del conjunto {I,D}. A
continuación, el jugador 2 una vez que ha observado lo que ha elegido el jugador
1, elige entre una de 3 acciones {1,2,3}. Los pagos que se tienen se reflejan en la
siguiente tabla, donde las filas representan las estrategias del jugador 1 y las
columnas las del jugador 2, y los pagos, primero del jugador 1 y luego del
jugador 2:
1 2 3
I (3,1) (1,2) (0,0)
D (2,1) (0,0) (1,0)
I D
J2 J2
1 3 1 3
2 2
3 1 0 2 0 1
1 2 0 1 0 0
Si este mismo juego se quiere representar en forma normal, hay que tener en
cuenta que una estrategia del jugador 2 ha de ser un plan de acción completo, es
15/02/2008 59
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
decir, ha de incluir la respuesta a las dos opciones del jugador 1. De esta forma
la bimatriz sería:
I D
J2
1 3 1 3
2 2
U1(X,Y), U2(X,Y)
Para el ejemplo 1 de la sección I.4.1, ene l que un jugador escribe en un
papel I o D, a continuación actúa el azar con dos posibles opciones, A o B, y
después juega el jugador 2 eligiendo un elemento del conjunto {1,2,3},
conociendo el resultado del azar pero no la estrategia del jugador 1, la forma
extensiva o árbol sería:
60 15/02/2008
MÉTODOS DE DECISIÓN
J1
I
D
Azar Azar
A B A B
J2 J2 J2
J2
1 2 3 1 2 3 1 2 3 1 2 3
U1(X,Y,Z), U2(X,Y,Z)
A partir de estas definiciones, se define el concepto de información perfecta.
Un juego es de información perfecta si en cada jugada el jugador conoce toda la
historia del juego hasta ese momento. En términos de conjuntos de información,
y suponiendo información completa, un juego es de información perfecta si cada
conjunto de información tiene un único elemento. Así, el ejemplo con que ha
empezado esta sección es un ejemplo de información perfecta, mientras que si
suponemos que el jugador 2 no conoce la estrategia del jugador 1, sería de
información imperfecta. También el juego que acabamos de ver sería de
información imperfecta, pues aunque conoce el resultado del azar no conoce la
estrategia del primer jugador.
I.4.3.1 Concepto de solución: equilibrio de Nash perfecto en subjuegos
La idea de concepto de solución en los juegos dinámicos difiere en cierto
modo de la idea vista en el caso estático. El concepto de solución es el de
equilibrio de Nash perfecto en subjuegos, pero para ver su definición, primero
hemos de entender qué es un subjuego.
Un subjuego en un juego representado en forma extensiva es un subconjunto
de nodos con las siguientes propiedades:
a) Empieza en un nodo n que sea un conjunto de información con un único
elemento, y que no sea el primero del árbol.
b) Incluye a todos los nodos de decisión que siguen a n en el árbol
c) No interseca a ningún conjunto de información, es decir, si un nodo está
en el subjuego lo están todos los de su conjunto de información.
Un subjuego se puede analizar por sí mismo y obtener resultados relevantes
para el juego completo. En el primer ejemplo de esta sección, existen dos
subjuegos, el que empieza en un nodo de decisión del jugador 2 y el que empieza
en el otro nodo del jugador 2, ya que son de conjuntos de información distinta.
Sin embargo, si el jugador 2 no conociera la estrategia elegida por el jugador 1,
no existirían subjuegos, ya que ambos nodos serían del mismo conjunto de
información y deberían estar en el mismo subjuego, pero el único nodo por el
que podría empezar el subjuego sería el primero, que no es posible por
definición.
15/02/2008 61
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
Cómo puede observarse, entre estas soluciones hay amenazas no creíbles. Los
pares de estrategias {I,(2,2)}, {I,(2,3)} y {D,(3,1)} no son soluciones reales para
jugadores racionales. Por ejemplo, la estrategia {D,(3,1)} incluye una amenaza
no creíble, ya que viene a decir que si el jugador 1 juega D (que es su estrategia)
le responderá con 1 que es lo lógico, pero si juega I le responderá con 3, que
sería un comportamiento no racional o amenaza no creíble (sería ganar 0
pudiendo ganar 2). Ese par de estrategias no son solución del subjuego que
comienza en el nodo del jugador 2 una vez que el jugador 1 ha elegido D, es
decir, no forman un equilibrio de Nash perfecto en subjuegos.
I.4.3.2 Cálculo de la solución con información perfecta y finitas etapas:
inducción hacia atrás.
El siguiente paso es, una vez que sabemos qué queremos obtener como
solución, tener un procedimiento para encontrarla. Un método relativamente
sencillo es el método de inducción hacia atrás. Sea un juego dinámico no
cooperativo con información completa. Además para poder aplicar la
metodología que se va a ver, ha de suponerse que el juego es de información
perfecta y con finitas etapas. La metodología sería:
1) Calcular para el último jugador la función de mejor respuesta en cada
nodo de decisión previo, es decir, en cada nodo dar cuál sería la mejor
respuesta del jugador al que le toca jugar. Si suponemos dos jugadores y
a1 la estrategia del jugador 1, y a2 la estrategia del jugador 2, definimos
62 15/02/2008
MÉTODOS DE DECISIÓN
como función de mejor respuesta del jugador 2 a R2 (a1 ) = a2* , tal que
u2 (a1, a2* ) = max u2 (a1, a2 ) .
a2
2) Repetir este proceso para los sucesivos nodos hasta el primero, sabiendo la
respuesta en los posteriores, es decir, hasta resolver en el primer nodo
max u1(a1, R2 (a1 )) = u1(a1*, R2 (a1* )) .
a1
Si en el ejemplo anterior aplicamos el procedimiento, se tendría:
J1
I D
J2 J2
1 3 1 3
2 2
3 1 0 2 0 1
1 2 0 1 0 0
1) R2 (I ) = 2 R2 (D ) = 1
2) max {u(I , R2 (I )), u(D, R2 (D )} = {1,2} = 2 que se alcanza eligiendo D, y la
mejor respuesta del jugador 2 a D es 1.
15/02/2008 63
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
muchos casos, la primera es una empresa líder, y la segunda una empresa con
menos poder de mercado.
Pueden ser más empresas, pero para concretar el ejemplo, supongamos que
son dos y que sus estrategias son la elección de la cantidad de producción. El
precio unitario de venta, al igual que en el duopolio de Cournot, se considera
⎧a − Q Q < a
⎪
que varía con las cantidades producidas según P (Q ) = ⎪ ⎨ , y el coste
⎪ 0
⎪ Q >a
⎩
unitario de producción se considera constante, c . El planteamiento en forma
extensiva sería:
1. La empresa 1 elige q1 ≥ 0
2. La empresa 2 observa q1 y elige q2 ≥ 0
3. Cada empresa recibe πi (qi , q j ) = qi [P (qi + q j ) − c ] = qi [a − (qi + q j ) − c ]
Resolvamos mediante inducción hacia atrás cuál sería la solución de este
juego.
Empresa 2: para una estrategia de la empresa 1 se plantea
max π2 (q1, q2 ) = max q2 [a − q1 − q2 − c ] . Que derivando e igualando a 0,
q2 ≥0 q2 ≥0
a − q1 − c
resulta la función de mejor respuesta R2 (q1 ) = (si q1 < a − c) .
2
Empresa 1: sabiendo la mejor respuesta de la empresa 2 (la sabe puesto que
la información es completa, es decir, conoce los costes y beneficios de la otra
empresa y puede razonar igual que ella), el problema que se plantea es
a − q1 − c
max π1(q1, R2 (q1 )) = max q1[a − q1 − R2 (q1 ) − c ] = max q1 , cuya
q1 ≥0 q1 ≥0 q1 ≥0 2
a −c a −c
solución (derivando e igualando a cero), es q1* = ⇒ q2* = .
2 4
3
Como puede observarse, la cantidad total producida es (a − c) , que es
4
2
mayor que la cantidad en equilibrio de Cournot ( (a − c) , con lo que el
3
precio del producto será menor. Por otra parte, obsérvese que la cantidad
que ha de producir la primera empresa es la de monopolio, mientras que la
segunda es la mitad; es decir, sale mejor parada la empresa que actúa
primero. Es curioso observar cómo disponer de más información a la hora de
actuar no implica obtener una solución mejor, ya que la primera empresa
sabe que cuando actúe la segunda tendrá esa información. Esta
particularidad hace que sea muy distinto el enfoque desde la teoría de juegos
que desde la teoría de la decisión clásica, en la que disponer de más
información siempre lleva a mejorar la posible solución, mientras que aquí
disponer de más información a la hora de actuar lleva a una peor solución si
la primera empresa sabe que vas a disponer de ella. La conclusión es que la
empresa que toma la iniciativa, es la que obtiene mayores beneficios.
64 15/02/2008
MÉTODOS DE DECISIÓN
15/02/2008 65
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
1−δ 1 1
s= 2
= . Es decir, en la etapa primera, J 1 ofrecerá s * = , y J2
1−δ 1+δ 1+δ
δ
aceptará, recibiendo 1 − s * = .
1+δ
I.4.3.4 Juegos con información imperfecta: decisiones simultáneas en una etapa
La información imperfecta supone que al menos un jugador cuando tiene que
jugar no conoce todo el desarrollo previo del juego. Un caso claro es cuando un
jugador elige una estrategia, y a continuación, lo hace el segundo jugador, pero
sin conocer la decisión del primero. Esta situación se puede modelar de la misma
forma que si los jugadores deciden de forma simultánea, de modo que la
selección de estrategias por parte de los jugadores en esa etapa es como resolver
un juego estático. De hecho la forma de resolver este juego es mediante
inducción hacia atrás, pero en las etapas con decisión simultánea (o asimilables
a tales) resolviendo el juego estático asociado.
Por ejemplo, sea el siguiente juego en forma extensiva:
1. J 1 y J 2 escogen simultáneamente sus acciones (a1, a2 )
2. J 3 y J 4 observan (a1, a2 ) y eligen simultáneamente sus acciones
(a 3 , a 4 ) .
3. Los jugadores reciben las ganancias ui (a1, a2, a 3 , a 4 ), i = 1,2, 3, 4
Para resolver el juego en cada etapa se ha de resolver el juego estático
planteado. Así se tiene en la inducción hacia atrás la secuencia:
Etapa 2: Encontrar el equilibrio de Nash que da mejor respuesta para los
posibles valores de (a1, a2 ) , que denotaremos por (a 3* (a1, a2 ), a 4* (a1, a2 )) .
Supongamos que es único para cada valor de (a1, a2 )
Etapa 1: Encontrar el equilibrio de Nash con las funciones de pagos
u1(a1, a2 , a 3* (a1, a2 ), a 4* (a1, a2 )) y u2 (a1, a2 , a 3* (a1, a2 ), a 4* (a1, a2 )) , obteniendo el
resultado (a1*, a2*, a 3* (a1*, a2* ), a 4* (a1*, a2* )) .
I.4.3.5 Aplicaciones con información imperfecta
66 15/02/2008
MÉTODOS DE DECISIÓN
15/02/2008 67
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
max ei (a − (ei + h j* ) − c − t j )
ei ≥0
Al derivar e igualar a cero, se obtienen las ecuaciones de primer orden de
ambas empresas, y resolviendo el sistema de ecuaciones resultante se tienen las
siguientes funciones de mejor respuesta, que son función de los aranceles:
a - c + ti a - c - 2t j
hi* = ei* =
3 3
Conocida esta función de mejor respuesta, los gobiernos pueden plantear su
juego estático, consistente en maximizar la función de pagos:
2
(a - c + ti ) (a - c - 2t j )
2 2 *
1 ⎛⎜ 2(a - c) - ti ⎞⎟ a - c - 2ti
max ⎜⎜
ti ≥0 2 ⎝
⎟⎟ + + + ti
3 ⎠ 9 3 3
Al establecer las condiciones de primer orden derivando e igualando a cero,
la solución que se obtiene final para aranceles, producciones nacionales y
exportaciones es:
a -c 4(a - c) a -c
ti* = hi* = ei* =
3 9 9
Obsérvese que con esta solución, la cantidad agregada en cada país es
5(a − c)/ 9 , que es inferior a 2(a − c)/ 3 que sería la cantidad de un modelo de
Cournot. Precisamente, esta última cantidad, la del equilibrio de Cournot, sería
la solución si las tasas arancelarias fueran cero, que a se vez sería la solución si
los gobiernos resolvieran el problema conjuntamente, cooperando
( maxW1(t1, t2 ) + W2 (t2 , t1 ) ). Por otra parte, esta segunda solución implica que hay
t1 ,t2 ≥0
más artículos en el mercado, lo que socialmente es mejor (término cuadrático de
utilidad de los consumidores). De modo que con este ejemplo se puede observar
que los gobiernos tenderán a establecer acuerdos, de modo que se eliminen los
aranceles, una tendencia que se puede constatar en la realidad. Sin embargo,
68 15/02/2008
MÉTODOS DE DECISIÓN
hay que ser cautos al analizar este resultado, ya que se ha supuesto que la
capacidad de producción de las empresas de ambos países así como sus costes
marginales son iguales, lo cuál es razonable para países con una situación
económica semejante pero no cuando hay grandes desequilibrios. El problema 20
se centra en pedir establecer la política de aranceles cuando hay distintos costes
de producción.
I.4.3.5.3 Juegos repetidos en T etapas
Sea G un juego de una etapa, y sea G (T ) el juego consistente en repetir el
juego G durante T etapas, de modo que en cada etapa los jugadores conocen
los resultados de las etapas anteriores. Considérese una función de pagos
aditiva, de modo que el pago al final de las T etapas es la suma de los pagos de
cada etapa. Se pueden demostrar los dos resultados siguientes:
• Si G tiene un único equilibrio de Nash, entonces G (T ) tiene un único
resultado perfecto en subjuegos, consistente en jugar en todas las
etapas el equilibrio de Nash.
• Si G tiene más de un equilibrio de Nash, entonces pueden existir
resultados perfectos en subjuegos de G (T ) tales que para t < T el
resultado no sea jugar un equilibrio de Nash.
A continuación, se ilustran estos resultados con sendos ejemplos.
El primer ejemplo es un juego de dos jugadores y dos etapas, en el que en
cada etapa ambos jugadores tienen 3 estrategias (A, B, C) y la matriz de pagos
⎛1,1 * 5, 0 0, 0⎞⎟
⎜⎜ ⎟⎟
⎜
del juego de una etapa es ⎜⎜ 0, 5 4, 4 4, 0⎟⎟⎟ . El juego de una etapa sólo tiene un
⎜⎜ ⎟
⎜⎜ 0, 0 0, 0 3, 3⎟⎟⎟
⎝ ⎠
equilibrio de Nash, (A,A), marcado con un asterisco. Analicemos el juego de 2
etapas.
En la segunda etapa, la estrategia de los jugadores será esa. En la primera,
sabiendo lo que harán en la segunda, la matriz de pagos acumulados será
⎛2,2 * 6,1 1,1 ⎞⎟
⎜⎜ ⎟⎟
⎜⎜ ⎟
⎜⎜ 1, 6 5, 5 5,1⎟⎟⎟ , cuyo único punto en equilibrio es (A,A). Así pues, el único
⎜⎜ ⎟
⎜⎝ 1,1 1,1 4, 4⎠⎟⎟
resultado perfecto en subjuegos es jugar el equilibrio de Nash en ambas etapas.
⎛1,1 * 5, 0 0, 0 ⎞⎟
⎜⎜ ⎟⎟
⎜⎜ ⎟
Sea ahora el mismo juego, pero con la matriz de pagos ⎜⎜ 0, 5 4, 4 0, 0 ⎟⎟ .
⎜⎜ ⎟⎟
⎟
⎜⎝ 0, 0 0, 0 3, 3 *⎠⎟⎟
Este juego tiene dos pares de estrategias en equilibrio, (A,A) y (C,C), aunque el
15/02/2008 69
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
primer par está dominado ya que el segundo ofrece mejores pagos. En esta
ocasión, los jugadores pueden plantear otro tipo de estrategia, que incluya
penalizaciones o amenazas. Así, lsi los jugadores prevén na estrategia que
pueden valorar es que si en la primera etapa las estrategias elegidas por los
jugadores son (B,B), la respuesta en la segunda etapa sea el equilibrio que más
les favorece, mientras que si es cualquier otra opción, en la segunda etapa se
llegue al equilibrio que menos les favorece. Con este comportamiento, la matriz
de pagos de la primera etapa, donde se ha incluido la respuesta de la segunda,
⎛2,2 * 6,1 1,1 ⎞⎟⎟
⎜⎜
⎜ ⎟⎟
sería ⎜⎜⎜ 1, 6 7, 7 * 1,1 ⎟⎟ , que tiene tres pares de estrategias en equilibrio, pero,
⎜⎜ ⎟⎟
⎜⎝ 1,1 1,1 4, 4 *⎠⎟⎟⎟
hay un par que claramente domina a los otros dos, jugar en la primera etapa
(B,B), y en la segunda (C,C). Esto demuestra que amenazas o promesas creíbles
sobre el futuro pueden modificar el comportamiento presente, incluso haciendo
que la solución del presente no sea un equilibrio de Nash. A pesar de todo, en
este planteamiento hay una amenaza poco creíble que es la correspondiente a
llegar en la primera etapa a la solución (A,A) y volver a hacerlo en la segunda.
Si fuera así, se podría renegociar para ver la segunda etapa, pudiendo llegar a la
solución (C,C) en la segunda, aunque en ningún caso se obtiene mejor resultado
que el dado por (B,B) en la primera y (C,C) en la segunda.
Veamos otro ejemplo de 2 jugadores, en 2 etapas, 5 estrategias (A,B,C,D,E)
para cada uno delos jugadores y función de pagos de cada etapa
⎛1,1 * 5, 0 0, 0 0, 0 0, 0 ⎞⎟
⎜⎜ ⎟⎟
⎜⎜ 0, 5 4, 4 0, 0 0, 0 0, 0 ⎟⎟
⎜⎜ ⎟⎟
⎜⎜ ⎟
⎜⎜ 0, 0 0, 0 3, 3 * 0, 0 0, 0 ⎟⎟
⎟⎟
⎜⎜
⎜⎜ 0, 0 0, 0 0, 0 4,1/ 2 * 0, 0 ⎟⎟⎟
⎜⎜ ⎟⎟
⎜⎝ 0, 0 0, 0 0, 0 0, 0 1/ 2, 4 *⎠⎟⎟
Como puede observarse, hay 3 pares de estrategias en equilibrio, pero el par
(C,C) domina estrictamente en el sentido de Pareto al par (A,A). Los otros dos
pares son incomparables (estarían en la frontera de Pareto).
Los jugadores, previendo el castigo o penalización, prevén que el resultado de
la segunda etapa será:
• Si en la etapa 1 juegan (B,B), en la etapa 2 jugar (C,C)
• Si en la etapa 1 juegan (B, no B), en la segunda el jugador 1 castiga a
2 eligiendo D, con lo que 1 también ha de elegir D para maximizar su
beneficio, luego la solución será (D,D)
70 15/02/2008
MÉTODOS DE DECISIÓN
15/02/2008 71
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
4
ganancia será ∑ 4δ
t ≥1
t −1
=
1−δ
. Comparando ambos términos,
δ 4
5+ > ⇒ 5 − 4δ > 4 ⇒ δ < 1/ 4 , es decir, el factor de descuento
1−δ 1−δ
tendría que ser menor que ¼ para que fuera preferible no cooperar (es decir, el
valor hoy de un dinero ganado en la siguiente etapa tendría que ser menor que
la cuarta parte, lo que no parece admisible ni una hipótesis razonable para los
tipos de interés, etc. que se manejan habitualmente, aunque en casos de mucha
inflación se hayan dado circunstancias semejantes).
El ejemplo anterior, sirve para introducir los resultados siguientes. En un
juego repetido infinitamente del tipo G (∞, δ) , cada subjuego que se inicia en la
etapa t + 1 es idéntico al original. Por otra parte, se definen ganancias factibles
(x 1,..., x n ) como las combinaciones lineales convexas de las ganancias obtenidas
mediante las estrategias puras de una etapa. Se define ganancia media como la
ganancia constante (igual en todas las etapas, salvo el factor de descuento) que
debería tenerse en cada etapa para que tuviera el mismo valor presente que una
ganancia dada por una sucesión de estrategias. Es decir, dada la sucesión de
pagos {πt }t ≥1 , la ganancia media ha de ser tal que ∑V δ t −1 = ∑ πt δ t −1 . Dado
t ≥1 t ≥1
V
que el primer término es , la ganancia media será V = (1 − δ)∑ πt δ t −1 .
1−δ t ≥1
Teorema (de Friedman o de tradición oral o folk)
Sea (e1,..., en ) las ganancias en el equilibrio de Nash para el juego G , y sea
(x 1,..., x n ) una ganancia factible tal que x i > ei , ∀i . Entonces, existe un
equilibrio de Nash perfecto en subjuegos de G (∞, δ) con (x 1,..., x n ) de ganancia
media.
Este resultado implica que hay una solución que no es jugar el equilibrio de
Nash, sino otras estrategias. Esto es lo que se llama colusión.
Veamos el planteamiento si en cada etapa se juega un juego como el del
modelo de Cournot. Recuérdese que planteábamos dos empresas que han de
decidir su nivel de producción, siendo su coste marginal c constante e igual
para ambas, y el precio de la forma P (Q ) = a − Q = a − q1 − q 2 . En este caso, el
a −c
punto de equilibrio en una etapa es q1 = q2 = , con lo que la cantidad
3
2(a − c)
agregada es Q = , y el beneficio de cada empresa es (a − c)2 / 9 . Sin
3
embargo, la cantidad de monopolio, que sería la que obtendrían si cooperaran ya
a −c
que produce mejores beneficios, era q1 = q2 = , dado que la cantidad
4
a −c
agregada debería ser Q = , con un beneficio por empresa de (a − c)2 / 8 .
2
72 15/02/2008
MÉTODOS DE DECISIÓN
15/02/2008 73
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
q1* =
2
Al resolver este sistema de ecuaciones la solución obtenida es
a − 2cA + c 1 − θ a − 2cB + c θ
q 2* (cA ) = + (cA − cB ) q 2* (cB ) = − (cA − cB )
3 6 3 6
a − 2c + θ c + (1 − θ )c
q1* = A B
3
Obsérvese que la solución con costes distintos del equilibrio de Cournot, sería
a − 2ci + c j
qi* = . Comparando lo que la empresa 2 obtiene por mantener su
3
a − 2cA + c
información privada, se tiene que q2* (cA ) > mientras que
3
a − 2cB + c
q2* (cB ) < , es decir, si el coste es el más alto, produce más que lo que
3
haría si la información fuera pública, mientras que si el precio es el más bajo,
acaba produciendo menos que si lo hace público. Para la empresa 1 la respuesta
es equivalente a considerar que la información es pública pero con coste de la
otra empresa el coste medio o esperado.
Consideremos ahora como se puede representar en forma normal un juego
bayesiano estático. Considérese que la función de pagos del jugador i es en
realidad una colección de funciones, ui (a1,..., an ; ti ) , que dependen de ti que es el
tipo del jugador i , donde ti ∈ Ti que es el espacio de tipos del jugador i .
El jugador i conoce sus ganancias, es decir, su tipo, pero no está seguro del
tipo de los demás jugadores, que denotaremos por t−i = (t1,..., ti −1, ti +1,..., tn ) .
Denotemos también por T−i al conjunto de posibles valores de t−i , y por
74 15/02/2008
MÉTODOS DE DECISIÓN
15/02/2008 75
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
76 15/02/2008
MÉTODOS DE DECISIÓN
15/02/2008 77
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
78 15/02/2008
MÉTODOS DE DECISIÓN
aeropuerto llegan por día uno de cada uno de esos aviones. El objetivo es decidir
qué parte del coste de mantenimiento corresponde a cada avión. Esta situación
puede representarse como un juego con la siguiente función característica, donde
se anota como ganancia negativa el coste para que se cumpla la propiedad de la
superaditividad,
v ({ }) = 0 v ({1}) = −100 v ({2}) = −150 v ({3}) = −400 v ({1,2}) = −150
v ({1, 3}) = −400 v ({2, 3}) = −400 v ({1,2, 3}) = −400
15/02/2008 79
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
yi > x i ∀i ∈ S
80 15/02/2008
MÉTODOS DE DECISIÓN
x 1 + x 2 + x 3 = 1000000 x 1 + x 2 ≥ 1000000
x1 ≥ 0 x2 ≥ 0 x 3 ≥ 0 x 1 + x 3 ≥ 1000000
x2 + x 3 ≥ 0
Este sistema sólo tiene una solución que será el núcleo del juego que es
x = (1000000, 0, 0) , es decir, el inventor debe recibir el millón de euros.
Así el núcleo subraya la importancia del jugador 1, es decir, del inventor.
2. En el juego del propietario del terreno, las condiciones de imputación
junto con las del núcleo dan el siguiente sistema
x 1 + x 2 + x 3 = 300000 x 1 + x 2 ≥ 200000
x 1 ≥ 100000 x2 ≥ 0 x 3 ≥ 0 x 1 + x 3 ≥ 300000
x2 + x 3 ≥ 0
Las soluciones de este sistema han de cumplir x 2 = 0 , x 1 + x 3 = 300000 y
x 1 ≥ 200000 , es decir, la solución es que el jugador 3, pague al jugador 1,
el propietario, una cantidad x 1 entre 200000 y 300000 euros por su
terreno, siendo su pago 300000 − x 1 . La promotora 2 se queda fuera.
3. En el juego del aeropuerto, las condiciones de imputación junto con las
del núcleo plantean el siguiente sistema
x 1 + x 2 + x 3 = −400 x 1 + x 2 ≥ −150
x 1 ≥ −100 x 2 ≥ −150 x 3 ≥ −400 x 1 + x 3 ≥ −400
x 2 + x 3 ≥ −400
Las soluciones de este sistema, o mejor en términos del juego original, las
soluciones del juego son múltiples, pero han de cumplir, que el avión tipo
1 pague entre 0 y 100, el de tipo 2 entre 0 y 150 pero entre ambos no
pagan más de 150, y el de tipo 3 pagará el resto, que puede ir entre 250 y
los 400 totales, dependiendo de los valores anteriores. Así pues, para este
juego el núcleo es bastante amplio, aunque queda claro en qué márgenes
de pago se mueve cada uno.
I.4.5.4 Un concepto de solución de un juego: El valor Shapley
15/02/2008 81
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
82 15/02/2008
MÉTODOS DE DECISIÓN
Esta solución presupone que las dos empresas llegan a un acuerdo, es decir,
que ninguna se queda fuera en la solución, compartiendo la fabricación del
invento, y repartiendo por lo tanto los beneficios.
Esta solución es más interesante para las empresas aunque menos para el
inventor que la del núcleo, aunque si las empresas pueden colaborar es más
equitativa, de modo que el beneficio no es sólo para el inventor. Así mismo
puede ser interpretado como que el 66.66% del poder del juego lo tiene el
inventor y un 16.66% cada una de las empresas.
2. En el juego del propietario del terreno el valor Shapley es el siguiente:
2 1 1 2 1300000
x 1 = (100000 − 0) + (200000 − 0) + (300000 − 0) + (300000 − 0) =
6 6 6 6 6
2 1 1 2 100000
x 2 = (0 − 0) + (200000 − 100000) + (0 − 0) + (300000 − 300000) =
6 6 6 6 6
2 1 1 2 400000
x 3 = (0 − 0) + (300000 − 100000) + (0 − 0) + (300000 − 200000) =
6 6 6 6 6
15/02/2008 83
I.4 TEORÍA DE JUEGOS O JUEGOS DE ESTRATEGIA
2 1 1 2 −200
x1 = (−100 − 0) + (−150 − (−150)) + (−400 − (−400)) + (−400 − (−400)) =
6 6 6 6 6
2 1 1 2 −350
x 2 = (−150 − 0) + (−150 − (−100)) + (−400 − (−400)) + (−400 − (−400)) =
6 6 6 6 6
2 1 1 2 −1850
x 3 = (−400 − 0) + (−400 − (−100)) + (−400 − (−150)) + (−400 − (−150)) =
6 6 6 6 6
Así, la participación en el coste de mantenimiento de la pista debería ser que
el avión tipo 1 pague 33.33, el avión tipo 2 58.33 y el avión tipo 3 308.33.
Básicamente, este reparto lo que dice es que los primeros 100 metros los
pagan entre todos los usuarios, es decir, un tercio cada uno (33.33); los
siguientes 50 metros son pagados por los usuarios, es decir, por los aviones
tipo 2 y tipo 3, de modo que cada uno para 25; y los siguientes 250 se pagan
por el único usuario que es el avión tipo 3. Así, es fácil extrapolar y se puede
comprobar que este criterio de reparto de costes es el que debería aplicarse
incluso aunque no fuera un avión de cada tipo.
84 15/02/2008
MÉTODOS DE DECISIÓN
I.5 Referencias
Benayoun, R., Roy, B., Sussman, B. Electre: Une Méthode pour Guider le
Choix en Présence de Vue Multiples. Sema (Metra International), Direction
Scientifique. Note de travail, 49.
Bertrand, J. (1883) Théorie Mathématique de la Richesse Sociale. Journal des
Savants 499-508.
Charnes, A., Cooper, W.W (1961) Management Models and Industrial
Applications of Linear Programming. John Wiley and Sons.
Cournot, A. (1838) Recherches su le Principes Mathématiques de la Théorie des
Richesses.
DeGroot, M.H. (1970) Optimal Statistical Decisions, McGraw Hill, New York
Farber, H. (1980) An Analysis of Final-Offer Arbitration. Journal of Conflit
Resolution, 35.
French, S. (1986) Decision Theory: An introduction to the mathematics of
rationality, Ellis Horwood, Chichester.
Gibbons, R. (1993) Un Primer Curso de Teoría de Juegos. Antoni Bosch, ed.
Hannan, E.L. (1980) Nondominance in Goal Programming. INFOR, Canadian
Journal of Operational Research and Information Processing 18
Hume, D. (1739) A Treatise of Human Nature.
Ignizio, J. P. (1976) Goal Programming and Extensions. Lexington Books.
Klemperer, P. D. (2000) Economic Theory of Auctions, Edward Elgard,
Massachusetts.
Klemperer, P. D. (2002) What Really Matters in Auction Design, Journal of
Economic Perspectives
Klemperer, P. D. (2002) Why Every Economist Should Learn Some Auction
Theory, in Dewatripont, M., Hansen, L, and Turnovsky, S. (eds.) Advances
in Economics and Econometrics: Theory and Applications, Eight world
congress of the econometric society.
Lee, S. M. (1972) Goal Programming for Decision Analysis. Auerbach
Publishers.
Keeney, R.L. and Raiffa, H. (1976) Decisions with Multiple Objectives:
Preferences and Value Trade-Offs. John Wiley and Sons.
Marglin, J.A. (1967) Public Investment Criteria. MIT Press, Cambridge,
Massachusetts.
Myerson, Roger B. (2001) Game Theory. Analysis of conflict. Harvard
University Press.
15/02/2008 85
I.5 REFERENCIAS
86 15/02/2008
MÉTODOS DE DECISIÓN
PROBLEMA 2
Una compañía ha diseñado un nuevo circuito integrado que le permitirá
entrar en el mercado de los microordenadores si así lo desea. En otro caso,
puede vender sus derechos por 80 millones. Si elige construir ordenadores, la
rentabilidad de este proyecto depende de la habilidad de la compañía para
comercializarlas durante el primer año. Tiene suficiente acceso a los
distribuidores para asegurar la venta de 1000 ordenadores. Por otro lado, si
tiene éxito puede llegar a vender hasta 10000 máquinas. La compañía piensa que
ambas alternativas de venta son igualmente probables y que cualquier otra
puede ignorarse. El coste de instalar la línea de producción es de 60 millones. La
diferencia entre el precio de venta y el coste de cada ordenador es de 60000
euros. Determinar según los diferentes criterios cuál es la decisión óptima.
Supóngase ahora que se puede realizar un estudio de mercado a un coste de
40 millones para predecir cuál de los dos niveles de demanda es más probable
que se dé. La experiencia indica que esta investigación de mercado es correcta
dos tercios de las veces. Determinar la política óptima a seguir, según el criterio
del valor medio.
PROBLEMA 3
Colaco tiene en la actualidad activos de 15 millones de euros y desea decidir
si vende o no un refresco con sabor a chocolate, la Chocola. Colaco tiene tres
opciones: 1) Probar en forma local el mercado de Chocola y, a continuación,
usar los resultados del estudio de mercado para decidir si vende la Chocola a
nivel nacional o no. 2) Directamente vender la Chocola a nivel nacional. 3)
Decidir directamente no vender la Chocola.
A falta de un estudio de mercado, Colaco cree que Chocola tiene un 55% de
posibilidades de éxito nacional, y 45% de fracaso absoluto. Si es un éxito
nacional, el beneficio será de 30 millones y si es un fracaso, se perderán 10.
15/02/2008 87
I.6 BIBLIOTECA DE PROBLEMAS
PROBLEMA 4
Una compañía es dueña de unos terrenos en los que puede haber petróleo.
Un geólogo consultor ha informado a la gerencia que piensa que existe una
posibilidad de 1 entre 4 de encontrar petróleo. Debido a esta posibilidad, otra
compañía petrolera ha ofrecido comprar las tierras por 9 millones de euros. Sin
embargo, la compañía está considerando conservarla para perforar ella misma.
Si encuentra petróleo, espera ganar aproximadamente 70 millones, pero perderá
10 si el pozo está seco.
1. Dar la decisión óptima según los distintos criterios de decisión. Para el
criterio de Hurwicz determinar el grado de optimismo que separa cada una
de las decisiones. ¿Cuál darías como solución si sabes que la empresa está
operando con poco capital y la pérdida de 10 millones resulta importante?
2. A la empresa, se le ofrece una opción anterior a tomar una decisión que
consiste en llevar a cabo una exploración sísmica detallada en el área para
obtener una mejor estimación de la probabilidad de encontrar petróleo, y
cuyo coste es de 3 millones. Se sabe que éste sondeo cuando hay petróleo lo
predice correctamente seis de cada 10 veces, mientras que si no lo hay,
acierta 8 de cada 10.
Dar la política óptima de estas decisiones, y dar el beneficio esperado de esa
política.
3. Dado que hay problemas de capital, se observa que la pérdida de 10
millones, y otros 3 si se encargó el sondeo previo, puede resultar muy grave
para la empresa. Por ello se plantea la posibilidad de sustituir los
beneficios/costes reales por utilidades de éstos. El dueño de la compañía da
la siguiente tabla de utilidades:
88 15/02/2008
MÉTODOS DE DECISIÓN
PROBLEMA 5
Hay dos restaurantes en competencia que tratan de determinar sus
presupuestos de propaganda para el próximo año. Las ventas combinadas de los
dos son de 240 millones de euros y pueden gastar 6 o 10 millones de euros en
propaganda. Si uno de ellos gasta más que el otro, tendrá ventas de 190 millones
de euros. Sin ambas empresas gastan lo mismo en propaganda, tendrán las
mismas ventas. Cada 10 euros de venta les produce 1 de ganancia. Si cada
restaurante busca maximizar la ganancia menos el gasto en propaganda, dar un
punto de equilibrio para este juego y comentar la solución.
PROBLEMA 6
Estados Unidos y la Ex-Unión Soviética “estaban” enzarzados en la carrera
armamentística. Supóngase que en un determinado momento cada nación tenía
dos estrategias posibles: construir un nuevo misil o no hacerlo. El coste de
construcción es de 10 unidades, y si una nación lo crea y la otra no, la que lo
crea “recibe 20 unidades” y la que no lo crea “paga 100 unidades”. Identificar
un punto de equilibrio para este juego.
PROBLEMA 7
Una empresa electrónica japonesa y una americana del mismo ramo están
pensando diseñar un superconductor. Si ambas compañías trabajan en el
superconductor tendrán que compartir el mercado y cada compañía
perder 10.000 millones de euros. Si sólo una trabaja en el superconductor, dicha
empresa ganará 100.000 millones de euros. Desde luego, si ninguna trabaja en
ello las ganancias de cada una serán de 0 euros. ¿Tiene algún punto de
equilibrio este juego?
Supóngase ahora que el gobierno japonés ofrece a la empresa japonesa una
subvención de 15.000 millones para crear el superconductor. ¿Tiene algún punto
de equilibrio el juego?
PROBLEMA 8
15/02/2008 89
I.6 BIBLIOTECA DE PROBLEMAS
Cadena 2
Cadena 1 Película del Oeste Telenovela Comedia
Película del Oeste 35 15 60
Telenovela 45 58 50
Comedia 38 14 70
PROBLEMA 9
Mad Max desea viajar de Nueva York a Dallas por la ruta más corta posible.
Puede viajar por las rutas que aparecen en la siguiente tabla.
Desafortunadamente, la Bruja Maldita puede bloquear una carretera que salga
de Atlanta y una que salga de Nashville. Mad Max no sabrá qué carreteras han
sido bloqueadas hasta que llegue a Atlanta o a Nashville. ¿Debe ir Mad Max a
Atlanta o a Nashville? ¿Qué rutas debe bloquear la Bruja Maldita?
PROBLEMA 10
Dos empresas competidoras deben determinar de forma simultánea cuánto
fabricar de un producto. La ganancia total de las dos empresas es siempre 1
millón de euros. Si la capacidad de producción de la empresa 1 es baja y la de la
empresa 2 también, la utilidad de la empresa 1 será de 500 mil euros. Si la
producción de la empresa 1 es baja y la de 2 es alta, las ganancias de la empresa
1 serán 400 mil euros. Si el nivel de producción de ambas empresas es alto la
utilidad de la empresa 1 es de 600 mil euros, pero si la de 1 es alta y la de 2 es
baja, la utilidad para la empresa 1 es de 300 mil euros. Determinar el valor y las
estrategias óptimas para ese juego.
90 15/02/2008
MÉTODOS DE DECISIÓN
PROBLEMA 11
El sindicato y la gerencia de una compañía negocian el nuevo contrato
colectivo. Por ahora las negociaciones están congeladas, pues la gerencia hace
una oferta “final” de un aumento salarial de 110 centieuros por hora y el
sindicato hace una demanda “final” de 160 centieuros por hora. Ambas partes
han acordado que un árbitro imparcial establezca el aumento en alguna
cantidad entre 110 y 160 centieuros por hora (inclusive).
El arbitraje ha pedido a cada lado que le presente una propuesta confidencial
de un aumento salarial económicamente razonable y justo (redondeando de 10
en 10 centieuros). Por experiencias anteriores, ambas partes saben que el
arbitraje casi siempre acepta la propuesta del lado que más cede respecto a su
cantidad “final”. Si ningún lado cambia su cantidad final o si ambos ceden en la
misma cantidad, el arbitraje suele establecer una cifra a la mitad (135 en este
caso).
Ahora cada parte necesita determinar qué aumento proponer para obtener
un beneficio máximo. Formular este problema como un juego de suma nula y
resolverlo.
PROBLEMA 12
Un total de 90.000 clientes acuden a los supermercados Superbarato y El
Chollo. Para animar a los clientes a entrar, cada almacén regala un artículo.
Cada semana, el artículo de regalo se anuncia en el periódico del lunes.
Naturalmente, ninguno de los almacenes conoce qué artículo va a regalar el otro
esa semana. Superbarato está pensando dar una caja de bebidas o 2 litros de
leche. El Chollo está pensando regalar un paquete de mantequilla o 2 litros de
zumo de naranja. Para cada elección de artículos, el número de clientes que
entrarán al almacén Superbarato durante esa semana aparece en la siguiente
tabla. Cada almacén desea elevar al máximo su número esperado de clientes
durante esa semana. Determinar una estrategia óptima para cada supermercado
y el valor del juego.
El Chollo
Mantequilla Zumo de naranja
Superbarato Bebidas 40000 50000
Leche 60000 30000
PROBLEMA 13
La dulce, frágil y rubia Caperucita lleva diariamente a su abuelita una bolsa
de 50 pastelillos, ya que la pobre está enferma, es de suponer que de diabetes, de
15/02/2008 91
I.6 BIBLIOTECA DE PROBLEMAS
tanto pastelito. Pero en el camino puede encontrarse con “El Lobo”, apodo con
que es conocido cierto individuo, feroz devorador de pastelitos y tortilla de
patatas, que se dedica a quitar pastelitos a las mocosas de 10 a 30 años que se
adentran en el bosque.
Para evitar tan indeseado encuentro Caperucita puede ir por un sendero
llano o cruzando montes, y si así lo desea, puede hacerse acompañar por su
novio, por una u otra ruta.
“El Lobo” puede hacer lo mismo (lo del sendero o el monte, no lo del novio)
y puede ir a pie o en bicicleta (arriesgando los dientes si va por el monte). La
cantidad de pastelillos que “El Lobo” puede llegar a capturar en las diversas
situaciones posibles, se refleja en la tabla siguiente. La cantidad negativa que
aparece se debe a que el novio de Caperucita, si bien un poco distraidillo, es una
mala bestia de 120 kilos que parte piñones con los bíceps y que en esas
circunstancias logra agarrar a “El Lobo” para después de convertirlo en “La
Oveja” mediante una soberana paliza, aligerarle de lo que lleva en la mochila.
Caperucita
“El Lobo” Sola por Sola por monte Con novio por Con novio por
sendero sendero monte
En bici por 10 0 5 0
sendero
En bici por 0 5 0 40
monte
A pie por 30 0 -20 0
sendero
A pie por 0 15 0 50
monte
¿Cómo tienen que elegir sus rutas Caperucita y “El Lobo” para sacar el
mayor partido de sus encuentros desde el punto de vista de tener la mayor
cantidad de pastelitos? ¿Cuántos dulces por encuentro espera conseguir “El
Lobo”?
PROBLEMA 14
Dos compañías comparten el grueso del mercado para cierto tipo de
producto. Cada una está haciendo nuevos planes de comercialización para el
próximo año con la intención de arrebatar parte de las ventas a la otra
compañía (las ventas son más o menos fijas, así que se puede suponer que sólo
se incrementan para una si disminuyen las de la otra). Cada una considera tres
opciones: 1) un mejor empaquetado del producto, 2) un aumento en publicidad,
92 15/02/2008
MÉTODOS DE DECISIÓN
3) una pequeña reducción en el precio. Los costes de las tres opciones son
comparables y lo suficientemente grandes como para que cada compañía elija
sólo una. El efecto estimado de cada combinación de alternativas sobre el
aumento en el porcentaje de las ventas para la compañía 1 sería del 4% si
ambas compañías eligen la primera opción; del 3% si la compañía 2 elige la
primera opción y la compañía 1 la tercera, o la compañía 2 elige la tercera y la
compañía 1 la segunda opción; del 2% si la compañía 2 elige la segunda opción y
la compañía 1 la primera o tercera opción; perdería un 2% si ambas eligen la
tercera opción, y perdería un 3% si la compañía 2 elige su tercera opción y la
compañía 1 su primera opción. En el resto de posibilidades los porcentajes del
mercado no varían respecto a los actuales.
PROBLEMA 15
Dos jugadores deciden jugar al siguiente juego: el jugador 1 escribe un
número entero entre 1 y 20 en una hoja de papel. Sin mostrar el papel al
jugador 2, le dice lo que ha escrito. El jugador 1 puede mentir o decir la verdad.
Entonces el jugador 2 debe adivinar si el jugador 1 ha dicho la verdad o no. Si
descubre que es mentira el jugador 1 paga al jugador 2 mil euros. Si la
acusación de mentir es falsa, el jugador 2 paga al 1 quinientas. Si el jugador 1
dice la verdad y el jugador 2 lo acierta, entonces el jugador 1 paga cien al
jugador 2. Si el jugador 1 miente y el jugador 2 no lo adivina, entonces el
jugador 2 paga quinientas al jugador 1.
PROBLEMA 16
La empresa HeladoSA desea lanzar un nuevo producto al que permita
introducirle en nuevos mercados. En la siguiente tabla se muestra los beneficios
(o pérdidas en su caso) esperados de los tres productos candidatos dependiendo
del impacto de la campaña publicitaria.
15/02/2008 93
I.6 BIBLIOTECA DE PROBLEMAS
PROBLEMA 17
Dos aerolíneas, AC y AP, se disputan el transporte aéreo de pasajeros,
siendo un total de 40.000 pasajeros diarios. Las dos aerolíneas tienen varias
opciones; la aerolínea AC puede poner vuelos en todo el territorio, en el centro y
norte, o sólo en el norte. La aerolínea AP puede poner vuelos en todo el
territorio o sólo en centro y sur. Los pasajeros que captaría la aerolínea AC
según las estrategias a seguir se estiman así:
Aerolínea AP
Todo territ. Centro y Sur
Todo territ. 15000 25000
Aerolínea AC Norte 15000 20000
Centro y Norte 20000 25000
PROBLEMA 18
Hay un concurso de televisión que funciona como sigue: primero se me
pregunta algo acerca de Stupid Videos. Si contesto bien gano 10000 euros. Creo
tener una probabilidad de 0.8 de contestar bien esa pregunta. Si la contesto mal,
se acabó y no gano nada. Si contesto bien me puedo quedar las 10000 euros o
proseguir el juego y contestar alguna pregunta de Stupid TV Shows. Si contesto
bien gano otras 30000 euros, pero si contesto mal pierdo lo anterior. Creo poder
responder bien con una probabilidad de 0.6. Si la contesto bien, puedo irme con
mi ganancia o proseguir y responder a una pregunta de Estadística. Si la
contesto bien gano otras 50000 euros, pero si contesto mal pierdo todo lo
94 15/02/2008
MÉTODOS DE DECISIÓN
PROBLEMA 19
Una empresa de suministros, “Sumis, S.A.” desea analizar varias opciones de
expansión de la empresa, fundamentalmente asociadas a su proceso productivo.
Por una parte, tiene la opción de mejorar el material que está utilizando
haciendo una fuerte inversión en investigación sobre materiales, logrando un
mayor beneficio unitario posterior de los productos. Por otra parte, tiene la
opción de ampliar la capacidad de producción haciendo una ampliación de la
planta de producción ya existente. Además tiene otra posibilidad para ampliar
la capacidad que consiste en abrir una nueva planta de producción. El
presupuesto disponible no le permite abordar varias estrategias de expansión a
la vez, de modo que ha de elegir una de las alternativas.
Por otra parte, las consecuencias derivadas de cada una de las decisiones son
distintas según sea la coyuntura que rodee al momento de la expansión. Así,
pueden darse distintos escenarios de demanda de los suministros en función
fundamentalmente de lo que una empresa competidora, “Multi” pueda hacer. La
otra empresa puede construir una nueva fábrica en el país, construir una nueva
fábrica fuera del país, o no aumentar su producción.
Los beneficios que considera la empresa para cada una de sus opciones según
se den las opciones de la otra empresa se recogen en la siguiente tabla, donde las
filas representan las opciones de la empresa “Sumis, S.A.” y los números su
beneficio.
Nueva fábrica en Nueva fábrica fuera de No hace
país país nada
Nuevo 10 -1 10
material
Amplía planta 0 3 10
Nueva planta 5 -2 6
No hace nada -15 2 5
15/02/2008 95
I.6 BIBLIOTECA DE PROBLEMAS
PROBLEMA 20
Dado el planteamiento del ejemplo de Aranceles y Competencia Internacional
Imperfecta, resolver si el coste de producción de una empresa es doble que el de
la otra. Hacerlo si además el precio de venta es el doble en el país de producción
más caro.
PROBLEMA 21
Obtener las estrategias en equilibrio para el planteamiento del duopolio de
Cournot, pero con costes desiguales.
PROBLEMA 22
En un sistema de mercado, se dice que hay competencia perfecta si los jugadores
disponen de información completa, y además ningún agente puede modificar los
precios por sí mismo. Obviamente, el caso del duopolio de Cournot es un caso
de competencia no perfecta o imperfecta. Analizar las estrategias en equilibrio
en un planteamiento como el de Cournot, pero con n jugadores, y analizar cuál
sería el precio resultante si el valor de n tiende a infinito, que sería el caso de
competencia perfecta (que haya infinitos jugadores o que se pueda aproximar la
situación a ésta).
PROBLEMA 23
Considérese un mercado en el que intervienen tres compañías. La demanda
solicitada a cada una de las compañías resultará una función que depende de los
precios que determinen todas ellas. La relación demanda-precio de cada
producto es:
96 15/02/2008
MÉTODOS DE DECISIÓN
Los costes de producción vamos a considerar que son todos iguales a cero.
a) Si los precios se determinan a la vez mediante subasta, ¿qué cantidad
deberá producir cada una? ¿qué precio pondrá cada una al producto?
¿qué beneficio obtendrá cada una? ¿Cómo se modificaría la solución si
fuera una única empresa que controla las tres unidades de oferta y pueden
actuar conjuntamente?
b) Si los precios se determinan por las empresas haciendo público el nuevo
precio, siendo la empresa 1 la primera que anuncia, luego la 2, y por
último la 3, ¿qué cantidad deberá producir cada una? ¿qué precio pondrá
cada una al producto?
c) ¿Cuál sería una estrategia disparador si se repitiera el proceso
semanalmente?
d) Supóngase que pueden adoptar acuerdos entre ellas y repartir
posteriormente la cantidad ganada, ¿qué cantidad debería llevarse cada
una? ¿qué poder tienen en el mercado cada una de las empresas?
PROBLEMA 24
Dos empresas comparten el mercado de un cierto producto. Cada empresa tiene
que decidir qué cantidad va a producir de ese producto, teniendo en cuenta que
ambas tienen un coste de producción de 10€ por unidad. El precio de venta
unitario del producto cambia según sea la oferta, siendo de 100€ menos la mitad
del total producido. Responder:
a) Si la empresa 1 sólo se plantea producir 50 unidades o producir 80
unidades, y la empresa 2 sólo se plantea producir 60 unidades o producir
80 unidades, ¿cuál será la cantidad que debería producir cada una para
maximizar sus beneficios?
b) Si pueden elegir cualquier cantidad de producción ¿cuál será la cantidad
óptima que debe producir cada una de ellas?
PROBLEMA 25
El gestor de las líneas de ferrocarril de un país desea instalar un sistema de
seguridad en una nueva línea férrea en construcción. Para ello ha recibido la
oferta de 5 empresas. Cada una de las ofertas está compuesta por tres partes: la
oferta técnica, la oferta económica y el plan de desarrollo. Cada oferta es
evaluada por expertos, y tras un análisis en que se considera que la oferta de la
15/02/2008 97
I.6 BIBLIOTECA DE PROBLEMAS
PROBLEMA 26
La planificación energética se ha venido realizando tradicionalmente, en función
de los costes del productor. Sin embargo, la asignación de recursos en base a
este criterio no siempre es eficiente, ya que existen otros costes asociados a las
distintas opciones, que no aparecen reflejados en el coste de generación.
Este es el caso de los costes medioambientales. La generación eléctrica
conlleva unos impactos sobre el medio ambiente que, sin embargo, no son
tenidos en cuenta a la hora de asignar eficientemente los recursos, desde un
punto de vista social. Esta ineficiencia hace que la alteración del medio se siga
produciendo, a pesar de la cada vez mayor sensibilización por parte de la
opinión pública, sin que las fuerzas del mercado sean capaces de impedirlo.
98 15/02/2008
MÉTODOS DE DECISIÓN
15/02/2008 99
I.6 BIBLIOTECA DE PROBLEMAS
Las tecnologías consideradas para estimar las emisiones son, para el carbón,
combustión con combustible pulverizado, para el gas natural, un ciclo
combinado, y para la biomasa, combustión en lecho fluidizado. En este último
caso, aunque hay emisiones de CO2 en la combustión, las emisiones netas se
consideran nulas debido a la fijación previa del CO2 por los cultivos energéticos
empleados para la producción de electricidad.
100 15/02/2008
MÉTODOS DE DECISIÓN
15/02/2008 101
I.7 RESULTADOS DE LA BIBLIOTECA DE PROBLEMAS
102 15/02/2008
MÉTODOS DE DECISIÓN
Como juego de suma nula considerar 135 (el punto medio) y para cada
cantidad que se fijaría restarle 135, siendo éste el pago para el sindicato. El
resultado de la negociación es que el sindicato debe proponer 140 centieuros y la
gerencia 130, siendo el valor del juego 0, es decir, se fija en 135.
15/02/2008 103
I.7 RESULTADOS DE LA BIBLIOTECA DE PROBLEMAS
104 15/02/2008