Estrategias Mix

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 34

Teoría de juegos

Andrés Ramos
http://www.iit.comillas.edu/aramos/
[email protected]
Contenido
1. Introducción

2. Juegos bipersonales de suma 0 con estrategias puras

3. Juegos bipersonales de suma 0 con estrategias mixtas

4. Equilibrios de Cournot y de Bertrand

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 2
Introducción
Juegos bipersonales de suma 0 con estrategias puras
Juegos bipersonales de suma 0 con estrategias mixtas
Equilibrios de Cournot y de Bertrand

Introducción
Introducción
• Contrapuesta a análisis de decisión

• Situaciones de conflicto y competencia entre decisores

• La consecución de objetivos no sólo depende de decisiones


propias y del azar sino de las decisiones de los competidores

• Criterios racionales de selección de estrategias para su propio


beneficio

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 4
Clasificación teoría de juegos (i)
• Número de jugadores
– Bipersonal
– N-personales
• Número de estrategias
– Finito
– Infinito
• Evolución temporal
– Estática
– Dinámica
• Intercambio de información entre jugadores
– Cooperativo
– No cooperativo

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 5
Clasificación teoría de juegos (ii)
• Variación de la riqueza
– Suma constante
– Suma no constante
• Cantidad de información de otros jugadores de que disponen
– Completa
– No completa
• Cantidad de información que adquieren en el desarrollo del
juego
– Perfecta
– Imperfecta

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 6
Matriz de pagos
• X conjunto de estrategias del jugador 1 (finitas)
• Y conjunto de estrategias del jugador 2 (finitas)
• M1(x,y) utilidad o pago que recibe el jugador 1
• M1(x,y) utilidad o pago que recibe el jugador 2
J2
 ( a11 , b11 ) 
J1  ( aij , bij ) 
matriz de pagos
 
 ( amn , bmn ) 

• aij pago que recibe el jugador 1 si elige la i-ésima estrategia y
el jugador 2 elige la j-ésima estrategia
• bij pago que recibe el jugador 2 si elige la j-ésima estrategia y
el jugador 1 elige la i-ésima estrategia

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 7
Dilema del prisionero
• Juego bipersonal, finito, estático, no cooperativo, de suma no
constante

• Dos delincuentes son detenidos y acusados de cometer un


delito conjuntamente. Los delincuentes están incomunicados
y pueden delatar o no al otro. Si ambos delatan les caen 5
años de prisión a cada uno. Si uno delata y el otro no le caen
20 años para el delatado y 0 para el delator. Si ninguno delata
les caen 1 año a cada uno.
J2
Delatar No Delatar
J1 Delatar (-5,-5) (0,-20)
No Delatar (-20,0) (-1,-1)

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 8
Estrategias de equilibrio (Nash)
• (x*,y*) es un par de estrategias de equilibrio si y sólo si ningún
jugador quiere cambiar de estrategia de forma unilateral.
• En el dilema del prisionero (Delatar, Delatar) es la estrategia
de equilibrio. Si el juego fuera cooperativo (paso de
información entre jugadores) la estrategia de equilibrio sería
la (No Delatar, No Delatar).
• No siempre existen estrategias de equilibrio únicas. Equilibrios
correlacionados.
Mujer
Fútbol Telenovela
Hombre Fútbol (2,1) (0,0)
Telenovela (-1,-1) (1,2)

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 9
Introducción
Juegos bipersonales de suma 0 con estrategias puras
Juegos bipersonales de suma 0 con estrategias mixtas
Equilibrios de Cournot y de Bertrand

Juegos bipersonales de suma 0 con


estrategias puras
Resolución de un juego bipersonal de suma nula
1. Buscar estrategias puras en equilibrio. Si existe es la
solución, si no ir a punto 2.

2. Resolver el problema con estrategias mixtas por LP

• En cualquier momento se puede reducir la matriz de pagos


eliminando estrategias dominadas.

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 12
Juegos bipersonales de suma 0
• Por naturaleza son no cooperativos.
• Basta con dar la matriz de pagos de un jugador.
• Cada jugador debe esperar lo peor del otro.
• Matriz de pagos vista como pagos al jugador 1.
• El punto de equilibrio es el punto óptimo del juego.

J2
E1 E2 E3
E1 1 2 4
J1 E2 1 0 5
E3 0 1 -1

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 13
Eliminación de estrategias dominadas (i)
• Estrategia dominada
• Estrategia de un jugador que independientemente de lo que
haga el otro jugador siempre es igual o peor que otra.
• Ejemplo: se elimina estrategia E3 del jugador 1
J2
E1 E2 E3
E1 1 2 4
J1 E2 1 0 5

• Se elimina estrategia E3 del jugador 2


J2
E1 E2
E1 1 2
J1 E2 1 0

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 14
Eliminación de estrategias dominadas (ii)
• Se elimina estrategia E2 del jugador 1
J2
E1 E2
E1 1 2
J1

• Se elimina estrategia E2 del jugador 2


J2
E1
E1 1
J1

• Estrategia óptima E1 de jugador 1 y E1 de jugador 2

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 15
Valor del juego y juego justo
• Valor del juego
– Pago al jugador 1 cuando ambos jugadores lo hacen de manera
óptima.
– Ejemplo: valor del juego es 1

• Juego justo
– Cuando el valor del juego es 0

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 16
Criterio minimax
• Minimizar la pérdida máxima (criterio de aversión al riesgo)
J2 Min
E1 E2 E3
E1 -3 -2 6 -3
J1 E2 2 0 2 0 maximin
E3 5 -2 -4 -4
Mínimos
Máximos 5 0 6
minimax

• Maximin: máximo de los pagos mínimos para el jugador 1


• Minimax: mínimo de los pagos máximos para el jugador 2
• Si minimax y maximin coinciden en una estrategia entonces la
solución es estable, se trata de un punto de equilibrio.
Instituto de Investigación Tecnológica
Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 17
Solución inestable

J2 Min
E1 E2 E3
E1 0 -2 2 -2 maximin
J1 E2 5 4 -3 -3
E3 2 3 -4 -4

Max 5 4 2
minimax

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 18
Introducción
Juegos bipersonales de suma 0 con estrategias puras
Juegos bipersonales de suma 0 con estrategias mixtas
Equilibrios de Cournot y de Bertrand

Juegos bipersonales de suma 0 con


estrategias mixtas
Juegos con estrategias mixtas (i)
• A cada posible estrategia de cada jugador éste le asigna una
probabilidad.
– xi probabilidad de que el jugador 1 use la estrategia i, i=1,...,m
m

∑x
i =1
i =1

– yj probabilidad de que el jugador 2 use la estrategia j, j=1,...,n


n

∑y
j =1
j =1

– pij pago para el jugador 1 si éste utiliza la estrategia i y el jugador


2 utiliza la j m n

• Pago esperado para el jugador 1 ∑∑


i =1 j =1
xi y j pij

• v valor del juego


• v maximin para jugador 1
• ̅ minimax para jugador 2
Instituto de Investigación Tecnológica
Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 20
Juegos con estrategias mixtas (ii)
• Criterio minimax para estrategias mixtas
– Un jugador debe elegir la estrategia mixta que minimice la
máxima pérdida esperada.

• Teorema minimax
– Si se permiten estrategias mixtas, las estrategias óptimas según
el criterio minimax proporcionan solución estable si v = v = v de
manera que ningún jugador quiere cambiar unilateralmente su
estrategia.

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 21
Solución por programación lineal
m n
• Pago esperado para el jugador 1 ∑∑ x y i j pij
i =1 j =1

• Para cualquier estrategia pura del competidor


m

∑x p
i =1
i ij ≥v ∀j = 1,…, n

• La suma de las probabilidades es 1


m

∑x
i =1
i =1 xi ≥ 0 ∀i = 1,…, m

• Maximizar el pago del jugador 1


max v

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 22
Visión del jugador 2 en función de decisiones del 1
• Maximización de la mínimas pérdidas. Mayor menor de las
pérdidas

max v
m

∑x p
i =1
i ij ≥ v ∀j = 1,…, n
m

∑x
i =1
i =1

xi ≥ 0 ∀i = 1,…, m

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 23
Visión del jugador 1 en función de decisiones del 2
• Minimización de la máximas ganancias. Menor mayor de los
pagos

min w
n

∑y
j =1
j pij ≤ w ∀i = 1,…, m

∑y
j =1
j =1

y j ≥ 0 ∀j = 1,…, n

• Son problemas duales, es suficiente con resolver uno. En el


óptimo v*=w*

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 24
Ejemplo juego de 2 jugadores de suma nula
• No hay estrategias dominadas. No tiene punto de equilibrio en
estrategias puras.
J2 Min
Papel Piedra Tijeras
Papel 0 1 -1 -1
J1 Piedra -1 0 1 -1
Tijeras 1 -1 0 -1

Max 1 1 1

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 25
Problema de optimización del jugador 2
min w
y2 − y3 ≤w
− y1 + y3 ≤w ( y1* , y2* , y3* ) = (1 3,1 3,1 3)
y1 − y2 ≤w (π 1* , π 3* , π 3* ) = (−1 3, − 1 3, −1 3)

y1 + y2 + y3 =1
yi ≥ 0

• Se cambia el signo de las variables duales ( x1* , x2* , x3* ) = (1 3,1 3,1 3)

• Valor del juego 0

• Para cada jugador la estrategia óptima es sacar cualquier


elemento con igual probabilidad.
Instituto de Investigación Tecnológica
Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 26
Introducción
Juegos bipersonales de suma 0 con estrategias puras
Juegos bipersonales de suma 0 con estrategias mixtas
Equilibrios de Cournot y de Bertrand

Equilibrios de Cournot y de
Bertrand
Modelo de equilibrio de Cournot (i)
• Dos empresas compiten en un mercado por un producto
homogéneo (i.e., no hay diferencia en quién lo produce). Las
empresas no pueden cooperar
• El proceso se realiza sólo una vez (juego estático)
• Precio del producto es elástico
a − Q Q < a
P (Q) = 
 0 Q>a

• Coste de producción unitario igual para las dos empresas.


Coste total función de la cantidad producida C (qi ) = cqi
y menor que el precio máximo de venta c < a
• La cantidad total a producir es Q = q1 + q2
• a tamaño del mercado
• -1 (coeficiente de Q) sensibilidad del consumidor al precio

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 28
Modelo de equilibrio de Cournot (ii)
• Espacio de estrategias de cada empresa X i = [0, ∞)
• Función de pagos (beneficios netos)
π i (qi , q j ) = qi [ P ( qi + q j ) − c ] = qi [ a − ( qi + q j ) − c ]

• Queremos maximizar la función de pagos


max π i (qi , q j ) = max qi [a − (qi + q j ) − c]
* *
qi ≥ 0 qi ≥ 0

• Para la* empresa i


∂π i (qi , q j ) 1
= a − 2qi − q*j − c = 0 ⇒ qi* = ( a − q*j − c)
∂qi 2
• Punto de equilibrio, cantidad total y precio
a−c 2 2 a + 2c
q1* = q2* = Q* = ( a − c ) P (Q ) = a − ( a − c ) =
3 3 3 3
• Beneficio neto conjunto
2(a − c) 2
(q1 + q2 )( P − c) =
9

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 29
Modelo de equilibrio de Cournot (iii)
• ¿Y si las empresas pueden cooperar entre ellas, actúan como
una única (monopolio)?
• Maximiza max π (Q ) = max Q[a − Q − c]
Q≥0 Q≥0
a−c a−c a+c
• Punto de equilibrio y precio Q* = P (Q ) = a − =
2 2 2
• Beneficio neto conjunto (a − c)2
Q( P − c) =
4
• La producción es mayor en un duopolio 2(a-c)/3 que en un
monopolio (a-c)/2.
• El precio es menor en un duopolio (a+2c)/3 que en un
monopolio (a+c)/2.
• Incentivo a coludir (formar un cartel) (a-c)2/36
• Dado que los carteles normalmente son ilegales, los agentes tratan de
coludir tácitamente usando estrategias de reducción de producción
autoimpuestas que tendrán un efecto de subida de precios y por
consiguiente un aumento en los beneficios de los agentes participantes.
Instituto de Investigación Tecnológica
Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 30
Colusión entre empresas lácteas (3-marzo-2015)

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 31
Demanda de energía eléctrica del 29-nov-2012

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 32
Modelo de equilibrio de Bertrand (i)
• Las empresas producen artículos diferenciados
• Pueden elegir el precio de venta: pi precio para la empresa i
• La demanda de un producto es elástica qi ( pi , p j ) = a − pi + bp j
• Coste de producción unitario c igual para las dos empresas

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 33
Modelo de equilibrio de Bertrand (ii)
• Espacio de estrategias de cada empresa X i = [0, ∞)
• Función de pagos (beneficios netos)
π i ( pi , p j ) = qi ( pi , p j )[ pi − c ] = (a − pi + bp j )( pi − c)
• Maximizar la función de pagos
max π i ( pi , p*j ) = max ( a − pi + bp*j )( pi − c)
pi ≥ 0 pi ≥ 0

• Para la empresa i
∂π i ( pi , p*j ) 1
= − pi + c + a − pi + bp*j = 0 ⇒ pi* = (a + bp*j + c)
∂pi 2
• Punto de equilibrio
a+c
p1* = p2* = (b < 2)
2−b

Instituto de Investigación Tecnológica


Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos 34
Andrés Ramos
http://www.iit.comillas.edu/aramos/
[email protected]

Instituto de Investigación Tecnológica


Santa Cruz de Marcenado, 26
28015 Madrid
Tel +34 91 542 28 00
Fax + 34 91 542 31 76
[email protected]

www.comillas.edu

También podría gustarte