Teoria de Jogos KK

Fazer download em docx, pdf ou txt
Fazer download em docx, pdf ou txt
Você está na página 1de 13

Teoria de jogos

A teoria dos jogos é uma teoria matemática criada para se modelar fenómenos que
podem ser observados quando dois ou mais “agentes de decisão” interagem entre si.
Ela fornece a linguagem para a descrição de processos de decisão conscientes e
objetivos envolvendo mais do que um indivíduo. (Sartini & et al, 2004, p. 1)

A Teoria dos Jogos é, segundo (HARSANYI e SELTEN, 1988) apud (HANEKE e


SADDI, 1995), um método para analisar situações de conflito e de cooperação que
dependem do comportamento estratégico, onde as ações dos jogadores são
parcialmente dependentes do que os outros jogadores poderão fazer.

Teoria dos Jogos é a ciência e técnica da tomada de decisões em situações de


interdependência. Ao contrário de uma decisão unilateral, aqui se trata de decidir
levando-se em conta decisões de outro(s), envolvido(s) num mesmo problema de
decisão.

A teoria dos jogos é usada para se estudar assuntos tais como eleições, leilões, balança
de poder, evolução genética, etc. Ela é também uma teoria matemática pura, que pode
e tem sido estudada como tal, sem a necessidade de relacioná-la com problemas
comportamentais ou jogos per se. (Sartini & et al, 2004, p. 1).

O elemento básico em um jogo é o conjunto de jogadores que dele participam. Cada


jogador tem um conjunto de estratégias. Quando cada jogador escolhe sua estratégia,
temos então uma situação ou perfil no espaço de todas as situações (perfis) possíveis.
(Sartini & et al, 2004, p. 4)

Em 1928, John von Newmann demonstrou que todo jogo finito de soma zero com duas
pessoas possui uma solução em estratégias mistas. Em 1937, ele forneceu uma nova
demonstração baseada no teorema do ponto fixo de Brouwer. (Sartini & et al, 2004,
pp. 2-3)

A Teoria dos Jogos abrange jogos com dois ou mais jogadores, cooperativos ou não.
Entre os tipos de jogos possíveis estão os recreativos, tais como pôquer, monopólio e
jogo da velha, os jogos de tabuleiro, como xadrez, damas, gamão, e os problemas
econômicos, políticos e sociológicos. Os jogos podem ser representados de forma
extensiva, através de uma árvore, ou em forma normal, usando matrizes de payoff
(pagamento, recompensa). Alguns jogos possuem informação perfeita, ou seja, a cada
jogada todos os jogadores têm conhecimento das jogadas anteriores (ex.: jogo da
velha), enquanto que outros apresentam informação imperfeita; num jogo como
pôquer, por exemplo, um jogador não sabe se o outro está blefando. (HARSANYI e
SELTEN, 1988) apud (HANEKE e SADDI, 1995).

Jogo

O jogo é uma situação em que os jogadores tomam decisões estratégicas, ou seja,


levam em consideração as atitudes e as respostas dos outros. (Pindyck & Rubinfield,
2006, p. 407)

De acordo com (Emilio Jose Rocha Coutinho, B.D.A.P.J.B.F.A.E.F.N.J., 2014) um


jogo é um modelo teórico de conflitos de interesse, e nele estão definidos os possíveis
resultados e decisões para cada jogador. Um indivíduo participante de um jogo deve
escolher uma entre várias alternativas, de acordo com sua preferência. Entretanto,
como a escolha também depende dos outros jogadores, que em geral possuem outras
preferências (caracterizando conflito de interesse), é preciso considerar todas as
preferências para obter o melhor resultado possível. Um jogo é uma situação entre N
pessoas ou grupos, chamados jogadores, que é conduzido por um conjunto prévio de
regras com conhecida recompensa. As regras definem actividades elementares, ou
lances, do jogo. Jogadores diferentes podem realizar lances diferentes, mas cada um
conhece os lances realizados pelos outros.

A Teoria dos Jogos trata com situações de tomada de decisão em que dois ou mais
oponentes possuem objectivos conflituantes. Exemplos típicos são:

1. Campanhas publicitárias para produtos concorrentes;


2. Planejamento de estratégias de guerra para exércitos inimigos.

Pay-Off

Pay-off são resultados que acarretam recompensas ou benefícios, por exemplo para as
empresas que estabelecem preços, os pay-offs são os lucros. (Pindyck & Rubinfield,
2006, p. 408)
O resultado de um jogo é obtido a partir de uma seqüência de tomadas de decisão, ou
seja, a cada jogada (decisão) o jogador deve escolher uma estratégia (entre as várias
disponíveis, escolher uma é tomar uma decisão estratégica), que ele considera a melhor
para atingir seus objetivos, considerando também, e principalmente, a estratégia
escolhida pelo(s) seu(s) oponente(s). No entanto, a elaboração de estratégias ocorre
com base em informações sobre as ações do(s) oponente(s), de acordo com os
objetivos procurados por todos os jogadores. Segundo COSTA (2000), as dificuldades
práticas da Teoria dos Jogos são: especificar, precisamente, os conjuntos de estratégias
disponíveis para todos os jogadores, devido à dinâmica microeconômica das inovações
tecnológicas e financeiras e aos choques exógenos que alteram o contexto
macroeconômico, durante o processo do jogo. Introduzir o tempo para verificar a
resultante das diversas decisões, fato que tende a causar dificuldades práticas
insuperáveis, pois as estratégias possíveis se multiplicam.

Estratégia

Estratégia é o plano de acção ou regra para participar de um jogo. Ex: Manter o Preço
alto enquanto os concorrentes também o fizerem, e quando um deles baixar, baixar o
nosso ainda mais. (Pindyck & Rubinfield, 2006, p. 408).

Tipos de Estratégia

Estratégia óptima é aquela que maximiza o pay-off esperado do jogador. (Pindyck &
Rubinfield, 2006).

Estratégia Dominante é aquela que é óptima independentemente do que o oponente


faça.

Solução de um jogo é uma prescrição ou previsão sobre o resultado do jogo.


Equilíbrio de estratégias dominantes é o resultado de um jogo em que cada empresa
faz o melhor que pode independentemente das escolhas feitas pelos seus concorrentes.
(Pindyck & Rubinfield, 2006, p. 410).
Natureza dos jogos

Jogos cooperativos são aqueles em que os jogares podem negociar contratos


vinculativos que lhes permitam planejar estratégias em conjunto. Ex: Duas empresas
podem combinar esforços para investir em uma nova tecnologia e partilharem os
lucros que advierem desse investimento. (Pindyck & Rubinfield, 2006, p. 408)

Jogos não cooperativos são aqueles no qual a negociação e o cumprimento de


contratos vinculativos não são possíveis.

Apresentacao de um jogo

Usaremos o jogo mais conhecido fundado em 1950, que é o Dilema do Prisioneiro. De


acordo com (Sartini & et al, 2004) dois ladrões, Al e Bob, são capturados e acusados
de um mesmo crime. Presos em selas separadas e sem poderem se comunicar entre si,
o delegado de plantão faz seguinte proposta: cada um pode escolher entre confessar ou
negar o crime. Se nenhum deles confessar, ambos serão submetidos a uma pena de 1
ano. Se os dois confessarem, então ambos terão pena de 5 anos. Mas se um confessar e
o outro negar, então o que confessou será libertado e o outro será condenado a 10 anos
de prisão.

Dilema do prisoneiro

Nos referimos que um dos problemas do equilíbrio de Nash é que ele não gera
necessariamente um óptimo de Pareto, vejamos o jogo apresentado na tabela 1. Este
jogo é conhecido pelo nome de dilema dos prisioneiros.

O jogo referia-se, inicialmente, a uma situação em que dois prisioneiros, que tinham
participado do mesmo crime, eram interrogados em salas separadas. Cada prisioneiro
podia confessar o crime, denunciando deste modo o cúmplice, ou não confessar o
crime.

Se um dos prisioneiros confessasse o crime e o outro não, o primeiro ficaria livre e o


que não confessou ficaria 6 meses na prisão.
Se ambos negassem o crime em que estavam envolvidos, então cada um ficaria apenas
1 mês na prisão, e se ambos confessassem, seriam condenados a 3 meses de prisão.

A matriz de resultados para este jogo é dada pela tabela 1. As entradas em cada célula
da matriz representam a utilidade que cada um dos jogadores (A e B) atribui aos vários
tipos de enclausuramento que por questão de simplicidade, consideramos como o
negativo do tempo de prisão.

Agora, como vamos encontrar uma solução para o dilema do jogador A e B? isto é, que
estratégias são plausíveis se os dois prisioneiros querem minimizar o tempo de prisão?
Se analisarmos o jogo sob ponto de vista do jogador A, ele pode raciocinar da seguinte
maneira:

“Duas coisas podem acontecer: B pode confessar ou B pode não confessar, se B


confessar, então é melhor para mim confessar também, porque ficaremos juntos
presos durante 3 meses enquanto que se não confesso ficarei 6 meses preso e ele livre.
Se B não confessar, então o melhor para mim é confessar porque ficarei livre. Em
qualquer um dos casos, é melhor para mim confessar.

Então, eu confessarei.”

Se analisarmos o jogo do ponto de vista de B, podemos aplicar a mesma linha de


raciocínio e concluir que B também irá confessar. Assim ambos confessarão e ficarão
3 meses presos.

Coloque-se no lugar do jogador A. Se o jogador B não confessar o crime, então é


melhor para si confessar, pois fica em liberdade. De igual modo, se B confessar, então
é melhor para si confessar porque apanha apenas 3 meses de prisão, em vez de 6.
Assim qualquer que seja a decisão de B, é sempre melhor que A confesse.

O mesmo vale para o jogador B, também ele tem sempre a ganhar se confessar. Em
consequência, o único equilíbrio de Nash verifica-se quando ambos jogadores
confessam.

Na realidade, este equilíbrio não é apenas de Nash, é também de um equilíbrio com


estratégias dominantes uma vez que cada jogador tem sempre a mesma escolha
óptima independentemente daquilo que o outro faça.
Jogador B
Confessa Não confessa
Confessa -3, -3 0, -6
Jogador A
Não confessa -6, 0 -1, -1
Tabela 1 O dilema do Prisioneiro

No entanto, se os dois decidissem não confessar o crime, cada um deles ficaria melhor
do que se tivesse confessado! Se cada um tivesse a certeza de que o outro não
confessava e ambos acordassem nessa estratégia, o resultado de cada jogador seria
igual -1, o que seria melhor para qualquer deles. A estratégia (não confessar, não
confessar) é um óptimo à Pareto – não existe outra estratégia que sirva melhor para
cada um dos jogadores – enquanto a estratégia (confessar, confessar) é ineficiente à
Pareto.

O problema é o de que não existe forma de os dois prisioneiros coordenarem as suas


estratégias.

Aplicacao na Economica

O equilíbrio de Nash é um equilíbrio não cooperativo: cada empresa toma as suas decisões
visando obter o maior lucro possível, dada as acções dos concorrentes, mas se a
cooperação pode conduzir a
lucros mais elevados, então as empresas poderiam cooperar entre si sem firmar um acordo
explicito. Então, nesse sentido ambas, empresas poderiam determinar uma estimativa
deste preço que maximiza o lucro e toma-lo e esperar que a outra faça mesmo, e assim
as duas poderiam auferir lucros maiores. O problema e que o concorrente
provavelmente não optaria por fixar seu preço em um nível compatível com o acordo,
porque o concorrente estaria fazendo um melhor negócio ao optar por um preço mais
baixo, mesmo que soubesse que a outra empresa praticaria o preço do acordo.

Atentemos ao caso: duas empresas que se encontram nesta situação e tem alternativas
de preços com os seus respectivos resultados. Durante o processo de tomada de
decisão sobre o preço a ser cobrado, as duas empresas estarão praticando um jogo não
cooperativo: cada uma, independentemente, estará fazendo o melhor que pode para si,
levando em consideração estratégias de seu concorrente. A tabela 2 mostra os
resultados ou ganhos que cada uma das empresas terá adoptando determinada
estratégia, ou seja, o lucro que cada empresa obterá em função de sua decisão e da
decisão de seu concorrente.

Empresa B
Cobra 4MT Cobra 6MT
Empresa A Cobra 4MT 12MT, 12MT 20MT, 4MT
Cobra 6MT 4MT, 20MT 16MT, 16MT
Tabela 2 Matriz de Pay-off do Jogo de determinação de Preço

O canto superior esquerdo da matriz de resultados nos informa que, se ambas as


empresas cobrarem 4 meticais, cada uma obterá lucros de 12 meticais. O canto
superior direito indica que, se a empresa A cobrar 4 meticais e a empresa B cobrar 6
meticais, a empresa A alcançará lucros de 20 meticais e a empresa B, lucros de 4
meticais.

Essa matriz responde ao amago da questão de por que as empresas não se comportam
cooperativamente, podendo assim obter lucros mais altos, mesmo não entrando em um
acordo explicito. Neste caso, a cooperação significaria que ambas as empresas estariam
cobrando 6 meticais ao invés de 4, obtendo, portanto, lucros de 16 meticais, invés de
12 meticais.

O problema é que cada uma delas sempre fará melhor negócio ao vender por 4
meticais, não importando o que venha fazer a sua concorrente.

Como mostra a matriz de resultados, se a empresa B cobrar 4 meticais, a empresa A


estará melhor cobrando 4 meticais. Se a empresa B cobrar 6 meticais, a empresa A
ainda estará melhor cobrando 4 meticais. Da mesma forma, a empresa B sempre estará
melhor ao cobrar 4 meticais, não importando o que possa fazer a empresa A.
Consequentemente, a menos que ambas as empresas possam assinar um contracto que
as obriga a fixar um preço de 6 meticais, nenhuma das duas pode esperar que a sua
concorrente assim proceda, de tal modo que ambas cobrarão 4 meticais.

Em conclusão e que a estratégia de cobrar o preço de 4 seria o óptimo ineficiente a


Pareto, porque existe uma opção melhor, que é o óptimo de Pareto onde ambos
praticam o preço de 6MT.

Guerra dos Sexos


Um casal pretende sair e tem que decidir onde irá se encontrar e qual será o programa
que farão para ficarem juntos em parte de uma noite no final de semana. Ambos estão
ansiosos por este momento e valorizam este momento mais do que qualquer outra
alternativa de entretenimento. O Simeão prefere ir ao Show de jazz alusivo ao dia
internacional do jazz enquanto sua namorada Mindinha prefere ir ao show da
Shekhina, ambos no dia 30 de Abril a mesma hora.

O problema é que o celular de um deles ficou descarregado e eles ficaram sem poder se
comunicar. Assim ambos têm de tentar se encontrar em um desses dois eventos.

Na formulação da batalha dos sexos pela teoria dos jogos cada um deles poderá ir ao
show de jazz ou ao show da Shekinah sendo possível o estabelecimento de 4
alternativas: S = {(show de jazz, show de jazz), (show de jazz, Shekinah), (show da
Shekinah, show de jazz), (show da Shekinah, show da Shekinah)}. Esta situação
também pode ser modelada como um jogo estratégico: G =

{Simeão, Mindinha}, SSimeão = {show de jazz, show da shekinah}, SMindinha = {show de


jazz, show da Shekinah}.

Se eles forem juntos ao show de jazz, então o Simeão tem satisfação maior que da
Mindinha. Por outro lado, se eles forem juntos ao show da Shekinah, então a Mindinha
tem satisfação maior que o Simeão. Finalmente, se eles saírem sozinhos, ambos ficam
igualmente insatisfeitos. As duas funções utilidade podem ser representadas pela
seguinte matriz de payoff:

Mindinha
jazz Shekinah
Simeão Jazz (10,5) (0,0)
shekinah (0,0) (5,10)
Os jogadores, o Simeão e a Mindinha obterão a maior recompensa caso escolham o
mesmo programa e consigam se encontrar, ainda que o Simeão prefira ir ao Show de
Jazz e a Mindinha ao show da Shekinah.

Aplicacao do problema de guerra dos sexos


Para empresas que estabelecem preços, os payoffs são os lucros. Dado que a guerra dos
sexos representa um jogo cooperativo na medida em que os participantes podem
negociar contractos vinculativos que lhes permitam planejar estratégias em conjunto,
um exemplo prático seria o caso das empresas TDM e MCEL que pela dificuldade de
obter sucesso sozinhas negociaram um contracto entre si, dividindo os lucros
decorrentes do investimento conjunto tornando possível um resultado cooperativo que
beneficiará ambas as partes.

Um outro exemplo seria os leilões que são feitos no mercado aberto entre diferentes
instituições monetárias em que o Banco Central de Moçambique leva em conta o
comportamento de outros bancos para escolher uma taxa de juro baixa (em relação a
taxa de juro máxima de corte, em casos de operações de operações de absorção de
liquidez) ou uma taxa de juro alta (em relação a taxa de juro mínima de corte em casos
de operações de cedência de liquidez), sabendo-se de antemão que caso não ocorra
nenhuma transacção no leilão, nenhuma das partes (o banco central e o banco
comercial) alcançará o seu objectivo

Equilibrio de Nash

O equilíbrio de Nash é uma combinação de estratégias em que cada jogador faz o


melhor que pode em função das estratégias dos demais jogadores. O equilíbrio em
estratégias dominantes é um caso especial de equilíbrio de Nash; uma estratégia
dominante é ótima independentemente do que possam fazer os demais jogadores. O
equilíbrio de Nash baseia-se na racionalidade de cada jogador. A estratégia maximin é
mais conservadora, pois maximiza o resultado mínimo possível.

Alguns jogos não apresentam equilíbrios de Nash com estratégias puras, mas possuem
um ou mais equilíbrios quando são utilizadas estratégias mistas. A estratégia mista é
aquela em que cada jogador faz uma opção aleatória entre duas ou mais ações
possíveis, com base em um conjunto de probabilidades escolhidas.

. O equilíbrio de Nash também pode ser aplicado a mercados em que as empresas


produzem bens substitutos e competem por meio de preços. Em equilíbrio, cada uma
delas maximiza os lucros, em função dos preços dos concorrentes, e desse modo não
têm qualquer estímulo para alterar o preço.
De novo, em um equilíbrio de Nash, cada empresa obtém o maior lucro possível em
função dos preços praticados pelos concorrentes e, portanto, não tem nenhum incentivo
para alterar o próprio preço. Será útil compararmos o conceito de um equilíbrio de
Nash com o do equilíbrio em estratégias dominantes:
Estratégias dominantes: Eu estou fazendo o melhor que posso, não importa o que
você esteja fazendo. Você está fazendo o melhor que pode, não importa o que eu esteja
fazendo.

Equilíbrio de Nash: Eu estou fazendo o melhor que posso, em função daquilo que
você está fazendo. Você está fazendo o melhor que pode, em função daquilo que eu
estou fazendo.

Jogos de Soma Nula

São aqueles em que o ganho de um jogador representa necessariamente a perda do


outro considerando que os dois jogadores podem ter um número finito ou infinito de
estratégias associadas, cada uma, a um payoff que um jogador paga ao seu adversário.

O somatório dos pagamentos efectuados a todos os jogadores (payoff’s) é nulo, não


importa a estratégia adoptada por cada um dos jogadores, o que um jogador ganha é
exactamente ao que um jogador perde.

Os payoffs podem ser negativos (perder e o outro jogador ganhar), ou positivos


(ganhar e o outro jogador perder). Assim sendo, não faz sentido um jogador cooperar
com o outro pois é uma competição pura, onde um ganha e o outro automaticamente
perde.

Considerando que os dois jogadores são Y e Z, com m e n estratégias, respectivamente,


o jogo pode ser representado por uma matriz de payoff para o jogador Y:

Z1 Z2 Z3 Z4

a11 a12 ... a1m


a21 a22 ... a2m
⁞ ⁞ ⁞ ⁞
am1 am2 am3 amm

A representação matricial acima indica que se Y usa uma estratégia i e Z usa uma
estratégia j, o payoff para Y é pij e consequentemente o payoff para Z é -pij.

Solucao optima em jogos de soma nula

A solução óptima de um jogo de soma nula é aquela em que se selecciona uma ou mais
estratégias para cada jogador, de tal forma que qualquer mudança na estratégia
escolhida, o payoff do outro jogador não melhorará. Estas soluções podem estar na
forma de uma única estratégia, ou várias estratégias misturadas, conforme as
probabilidades pré-determinadas

Jogos de soma nula com estrategias mistas

Seja Sjogador L= {1, 2, ..., m} e Sjogador C= {1, 2, ..., n}.

Em termos de estratégias mistas, se p=(p1,...,pm) ϵ Δm é uma distribuição de


probabilidades para as estratégias puras do jogador L. Se q=(q1,...,qn) ϵ Δn é uma
distribuição de probabilidades para as estratégias puras do jogador C.
Então o payoff esperado para o jogador L será UL(p,q)= pTAq onde A é o conjunto de
resultados dadas estratégias do jogador L. O payoff esperado para o jogador C será
UC(p,q)= pTBq onde B é o conjunto de resultados dadas estratégias do jogador C.

Ex.: considerar dois jogadores, cada um com duas alternativas de escolha: par ou
ímpar. Dependendo da combinação de escolhas dos dois, os jogadores obtêm ganho
(representado por 1) ou perda (-1). O jogador Par obterá ganho se ambos fizerem a
mesma escolha, e neste caso o Ímpar receberá -1. Se as escolhas forem diferentes, os
ganhos invertem-se.

Matriz do payoff
B1 B2
A1 1 -1
A2 -1 1

Os jogadores podem usar duas estratégias, pois o payoff mínimo para cada uma é -1.
Existe ainda uma terceira estratégia possível, envolvendo aleatoriedade. No caso de
estratégias mistas um jogador pode variar sua escolha seguindo probabilidades
aplicadas a cada uma das opções. Na matriz acima verificamos duas estratégias puras -
par e ímpar - e uma série de estratégias mistas correspondendo às variações de
probabilidade possíveis.

O teorema minimax garante uma solução para jogos de soma nula, seja em estratégia
pura ou mista. Neste caso, a solução é jogar aleatoriamente par e ímpar com
probabilidades iguais de 0,5, pois esta estratégia maximiza o payoff mínimo sobre
todas as outras estratégias, puras ou mistas. O cálculo do payoff envolvendo estratégias
mistas leva em conta o percentual associado a cada estratégia, os quais são
representados em n-duplas, sendo n o número de estratégias puras que o jogador
dispõe. O somatório de todos os percentuais logicamente deve totalizar 1, equivalente
a 100%. Para encontrar a estratégia mista óptima, maximizando o payoff do jogador, é
preciso obter as percentagens óptimas para cada estratégia.

Soma não nula

Em contraste com os jogos de soma nula, os jogos de soma não nula são aqueles em
que a soma dos payoffs dos jogadores em todas as combinações de estratégias
possíveis não é igual a zero. Nesses jogos, as preferências dos jogadores podem
divergir, e há possibilidade de ganhos e perdas diferentes entre os participantes. Aqui
estão dois exemplos de jogos de soma não nula:

1. Jogo do Mercado de Ações:


 Dois investidores estão considerando investir em uma determinada ação.
 Se ambos investirem, o preço da ação pode subir ou cair, dependendo das
condições do mercado.
 Se apenas um investir e o outro não, o investidor que investiu pode obter
um lucro ou prejuízo, novamente dependendo das condições do mercado.
 Se nenhum deles investir, não há ganhos ou perdas.
Nesse jogo, a soma dos payoffs não é zero, uma vez que as flutuações do mercado
podem resultar em diferentes ganhos ou perdas para cada investidor. Além disso, as
preferências e estratégias dos investidores podem ser diferentes, o que leva a resultados
não equitativos.

Você também pode gostar