Jogos Dinâmicos
Jogos Dinâmicos
Jogos Dinâmicos
movimento
de A
movimento de B
Jogador B
Jogador A
ramo
ramo
n terminal
n inicial ou
n raiz
Um n que no terminal um n de deciso.
Uma rvore de jogos possui uma orientao que definida pelas setas dos ramos.
Nesse caso a orientao da esquerda para a direita. Tambm so comuns
orientaes de cima para baixo, mas nada impede uma orientao da esquerda para a
direita ou de baixo para cima. O importante manter a clareza na apresentao.
Um caminho uma sucesso possvel de ns e ramos.
Regras para a construo de rvores de jogos
Regra 1: todo n precedido por, no mximo, outro n.
O nico n que no precedido por outro o n inicial ou raiz.
Regra 2: nenhum caminho em uma rvore liga um n de deciso a si mesmo.
Regra 3: todo n sucessor de um nico n inicial.
Regra 4: toda rvore de jogo tem exatamente um n inicial (o n raiz).
Todo jogo pode ser representado na forma de uma rvore de jogo, mesmo um jogo
simultneo. Isso demanda uma definio da informao em um jogo.
Um jogador possui informao perfeita se ele sempre souber onde ele se localiza na
rvore de jogo quando for fazer o seu movimento. Exemplos: um jogador de xadrez
possui o histrico completo das movimentaes e da ordem destas, portanto, possui
informao perfeita; em um jogo de duoplio de Cournot cada jogador faz o seu
movimento sem saber do movimento do outro, portanto, cada empresa possui
informao imperfeita.
Um jogo ser de informao perfeita sempre que todos os jogadores possurem
informao perfeita. Um jogo ser de informao imperfeita se ao menos um dos
jogadores possuir informao imperfeita.
coopera
Empresa B
coopera
no coopera
Empresa A
coopera
no coopera
Empresa B
no coopera
coopera
Empresa B
coopera
no coopera
Empresa A
coopera
no coopera
Empresa B
no coopera
Simples
$900000
$200000
$100000
$800000
$1000000 $1000000
$430000
$800000
Simples
$900000
$200000
$50000
$400000
$950000
$600000
Custo da propaganda
- $570000
- $200000
$380000
$400000
$0
$0
$50000
$400000
$50000
$400000
Custo da propaganda
- $300000
- $ 300000
- $250000
$100000
entrar
($380000, - $250000)
Microcorp
elegante
ficar
fora
($430000, $0)
Microsoft
simples
entrar
($400000, $100000)
ficar
fora
($800000, $0)
Microcorp
entrar
ficar fora
Simples
$0, 800000*
Nesse caso seramos levados a pensar que existe um nico equilbrio de Nash nesse
jogo e que, portanto, o resultado racional est univocamente determinado.
Simples
- $250000, $380000
$0, $800000*
*$0, $430000*
*$100000, $400000
*$0, $430000
$0, $800000*
nesse caso temos dois equilbrios de Nash, dois possveis resultados que so
racionais. H alguma forma de determinar qual ser o escolhido?
No h na teoria dos jogos nenhum conceito de soluo entre dois ou mais equilbrios
de Nash com a mesma aceitao virtualmente universal que o equilbrio de Nash
possui. O equilbrio de Nash evidencia uma situao que racional segundo a teoria
da tomada de deciso e a racionalidade um fenmeno que pode ocorrer em mais de
uma situao. Situaes onde no ocorre racionalidade podem ser oriundas no
apenas de dificuldade de processamento e computao dos dados (em problemas
extensos ou complicados) e de violaes dos pressupostos de racionalidade (como
aes instintivas, por exemplo), um resultado no racional pode ocorrer por azar e isso
nenhuma racionalidade pode evitar. Em jogos dinmicos como o apresentado, porm,
existem alguns procedimentos para tentar simplificar o jogo e evidenciar um equilbrio
em particular. Tomemos o caso da induo retroativa ou induo reversa.
Siga o seguinte algoritmo:
1) Comece pelos ns terminais do jogo e trace o caminho de cada um at o seu n
predecessor imediato, que ser um n de deciso de algum jogador. Esses ns de
deciso podem ser triviais no bsicos, triviais bsicos ou complexos. Um n
4) Agora voc tem uma rvore de jogo mais simples do que a original. Se na etapa 1
voc chegou raiz da rvore, ento o seu trabalho acabou.
5) Se voc ainda no chegou raiz, volte etapa 1 e comece tudo de novo. Desse
modo voc avana etapa por etapa em direo raiz.
6) Para cada jogador, rena as decises timas em cada um dos ns de deciso
dele. Essa coleo de decises constitui a estratgia tima desse jogador para o
jogo.
n bsico trivial
jogador X
n bsico no trivial
jogador X
n complexo
jogador X
jogador Y
n de deciso bsico
no trivial
entrar
($380000, - $250000)
Microcorp
elegante
ficar
fora
($430000, $0)
Microsoft
simples
entrar
($400000, $100000)
ficar
fora
($800000, $0)
Microcorp
n de deciso bsico
no trivial
entrar
($380000, - $250000)
Microcorp
elegante
ficar
fora
($430000, $0)
Microsoft
simples
entrar
($400000, $100000)
ficar
fora
($800000, $0)
Microcorp
n bsico trivial
n bsico no
trivial
Microcorp
elegante
ficar
fora
($430000, $0)
Microsoft
simples
entrar
Microcorp
n bsico trivial
($400000, $100000)
Microcorp
elegante
ficar
fora
($430000, $0)
Microsoft
simples
entrar
Microcorp
Microsoft
elegante
($400000, $100000)
ficar
fora
Microcorp
($430000, $0)
entrar
($380000, - $250000)
Microcorp
elegante
ficar
fora
($430000, $0)
Microsoft
simples
entrar
($400000, $100000)
ficar
fora
($800000, $0)
Microcorp
Simples
- $250000, $380000
$0, $800000*
*$0, $430000*
*$100000, $400000
*$0, $430000
$0, $800000*
acima
rpido
(10, 100)
jogador B
abaixo
(12, 200)
jogador A
acima
devagar
(10, 200)
jogador B
abaixo
jogador A
frear
acelerar
(15, 25)
(0, 50)
acima
rpido
(10, 100)
jogador B
abaixo
(12, 200)
jogador A
acima
devagar
(10, 200)
jogador B
abaixo
jogador A
frear
(15, 25)
rpido
jogador B
abaixo
(12, 200)
jogador A
acima
devagar
rpido
jogador B
jogador B
abaixo
jogador A
(10, 200)
(12, 200)
Jogador A
*10, 100
10, 100
*12, 200*
12, 200*
(rpido, frear)
*10, 100
10, 100
[*12, 200*]
12, 200*
(devagar, acelerar)
*10, 200*
0, 50
10, 200*
0, 50
(devagar, frear)
*10, 200*
0,50
10, 200*
0, 50
Ameaas:
Jogadores podem tentar influenciar o comportamento do jogador que antecede a
as tomada de deciso atravs de uma ameaa. Uma ameaa pode ser crvel ou
ser uma conversa fiada.
Uma ameaa crvel existe somente se for do interesse do prprio jogador levar a
cabo a ameaa dada a opo. Ameaas que no so crveis (conversa fiada) so
ignoradas por todos os jogadores racionais.
Outra forma de ameaa a ameaa vinculadora. Nesse caso uma vez feita a
ameaa no possvel voltar atrs, como em um contrato, por exemplo.
(-250, 380)
Microsoft
(100, 400)
(-250, 380)
Microsoft
(0, 800)
Microcorp
(0, 430)
Microsoft
(100, 400)
(0, 430)
Microsoft
(0, 800)
(-250, 380)
Microsoft
(100, 400)
(-250, 380)
Microsoft
(0, 800)
Microcorp
(0, 430)
Microsoft
(100, 400)
(0, 430)
Microsoft
(0, 800)
Microsoft
Microsoft
simples
simples
(100, 400)
(0, 800)
Microcorp
Microsoft
Microsoft
elegante
simples
(0, 430)
(0, 800)
Microsoft
Microsoft
simples
simples
(100, 400)
(0, 800)
Microcorp
Microsoft
Microsoft
Microcorp
entrar, entrar
Microsoft
elegante
simples
simples
(0, 430)
(0, 800)
(100, 400)
Note que o resultado era diferente quando a Micorsoft era a primeira a se mover:
Macrosoft
Elegante
(entrar, entrar)
Microcorp
Simples
- $250000, $380000
$0, $800000*
*$0, $430000*
*$100000, $400000
*$0, $430000
$0, $800000*
2) O n inicial de
uma sub-raiz de
e a rvore do jogo de
composta por
so idnticas quelas
Subjogo que
comea na
sub-raiz D2
entrar
($380000, - $250000)
D2
Microcorp
elegante
ficar
fora
D1
($430000, $0)
Microsoft
simples
D3
entrar
($400000, $100000)
ficar
fora
($800000, $0)
Microcorp
D1
Microsoft
D2
D3
Microcorp
Microcorp
D4
D5
Microsoft
(400, 0)
compartilhar
Microsoft
(500, 0)
compartilhar
combater
combater
(170, -50)
(150, 50)
(250, 150)
(230, 90)
D1
Microsoft
D2
D3
Microcorp
Microcorp
D4
D5
Microsoft
(400, 0)
compartilhar
Microsoft
(500, 0)
compartilhar
combater
combater
(170, -50)
(150, 50)
(250, 150)
(230, 90)
D1
Microsoft
D2
D3
Microcorp
Microcorp
D4
D5
Microsoft
(400, 0)
compartilhar
Microsoft
(500, 0)
compartilhar
combater
combater
(170, -50)
(150, 50)
(250, 150)
(230, 90)
D1
Microsoft
D2
D3
Microcorp
Microcorp
D4
D5
Microsoft
(400, 0)
compartilhar
Microsoft
(500, 0)
compartilhar
combater
combater
(170, -50)
(150, 50)
(250, 150)
(230, 90)
D1
Microsoft
D2
D3
Microcorp
Microcorp
D4
D5
Microsoft
(400, 0)
compartilhar
Microsoft
(500, 0)
compartilhar
combater
combater
(170, -50)
(150, 50)
(250, 150)
(230, 90)
D1
Microsoft
D2
D3
Microcorp
Microcorp
D4
Microsoft
D5
(400, 0)
Microsoft
(500, 0)
compartilhar
combater
(170, -50)
(250, 150)
D1
Microsoft
D2
D3
Microcorp
Microcorp
D5
Microsoft
(400, 0)
compartilhar
(250, 150)
D1
Microsoft
D2
Microcorp
(400, 0)
O perfil de estratgias para esse equilbrio {(quarentena, combater,
compartilhar), (ficar fora, entrar)}
Duoplio de Stackelberg
O que aconteceria se um duoplio de Cournot fosse modificado de modo que ao
invs de considerarmos que as duas empresas tomam a deciso de quanto
produzir ao mesmo tempo uma das empresas decidisse antes. Podemos
modelar esta situao como um jogo sequencial, mas esta estrutura de
mercados foi proposta antes da gnese da teoria dos jogos por Stackelberg em
1934.
Vejamos um exemplo com a linguagem da teoria dos jogos:
Temos duas empresas que ofertam um produto homogneo, garrafas de gua
mineral sem gs de 500 ml. A empresa SW possui uma gerncia mais eficiente
de modo que ela consegue determinar antes a quantidade a produzir. SW
chamada de empresa lder. A empresa CW a empresa seguidora e toma a sua
deciso de quanto produzir observando a tomada de deciso de SW.
A funo de demanda inversa dada por:
, em equilbrio de Nash
Essa funo de melhor resposta a estratgias de CW, ela informa todas as suas
tomadas de deciso para todos as tomadas de deciso de SW (lembrando sempre que
zero domina estritamente quantidades negativas e acima de 7).
SW toma a sua deciso considerando a estratgia tima de CW (por induo
retroativa).