Introducao A Teoria Dos Jogos
Introducao A Teoria Dos Jogos
Introducao A Teoria Dos Jogos
Resumo: O presente texto tem por objetivo apresentar de forma sucinta os fundamentos ele-
mentares da teoria dos jogos e demonstrar o teorema de equilı́brio de Nash cuja demonstração
utiliza o teorema do ponto fixo de Brouwer.
Sumário
1 Introdução 26
2 Definição de jogo 28
3 Exemplos de jogos 28
4 Dominância 31
1. Introdução
A teoria dos jogos é a teoria matemática que procura modelar fenômenos em que se pode
observar conflito, isto é, quando dois ou mais agentes interagem com objetivos contrários.
Assim, a teoria dos jogos pode ser definida como a teoria dos modelos matemáticos que
estuda a escolha de decisões ótimas sob condições de conflito.
A origem da teoria do jogos pode ser situada no século XVIII, até onde se tem co-
nhecimento, por meio de correspondências entre Nicolas Bernoulli e James Waldegrave,
este último analisa um jogo e fornece uma solução no sentido que veremos mais adiante.
No século XIX, Zermello e Borel, separadamente, publicaram diversos trabalhos sobre jo-
gos. Borel achava que a guerra e a economia podiam ser estudadas por meio de jogos
estratégicos.
Em 1928 o matemático John von Neumann demonstrou importantes resultados, em 1944,
junto com o economista Oscar Morgenstern, publicou o livro “The theory of games and
economic behaviour”. O grande salto ocorreu em 1950 com John Forbes Nash Junior, em
1994, juntamente com outros receberam o prêmio Nobel por suas contribuições à teoria dos
jogos.
Os primeiros registros de estudos de um jogo por estratégia mista datam de 1713 no
estudo do jogo Le her (jogo de baralho com um deck de 52 cartas) realizado por James
Waldegrave e descrito por ele em uma carta destinada a Pierre Rémond de Montmort. Em
1838, Augustin Cournot analisou um caso especı́fico de duopólio e ele definiu conceito de
equilı́brio de mercado como a situação em que ambas as empresas agem de forma ótima à
decisão da empresa concorrente.
A Teoria dos Jogos só vai chamar a atenção das ciências sociais em 1944 (em plena
Segunda Guerra Mundial) com o livro Teoria dos Jogos e Comportamento econômico de John Von
Neumann e Oscar Morgenstern. Nessa obra, eles detalharam e especificaram a formulação
de problemas econômicos e a aplicação da teoria dos jogos à economia
Para prosseguirmos com nossa explanação, voltemos a meados do século XVIII quando
Adam Smith publica a obra A Riqueza das Nações. Considerado o pai do liberalismo e
Introdução à teoria dos Jogos 27
2. Definição de jogo
Note que ui (s) associa a cada perfil de estratégias puras um ganho (payoff ) do jogador gi
quando os jogadores utilizaram as suas estretégias puras apresentadas em s.
3. Exemplos de jogos
Este é um dos exemplos mais conhecidos, foi formulado por Albert W. Tucker em 1950.
Dois ladrões, Al e Bob, são capturados e acusados do mesmo crime. Presos em selas
separadas e sem comunição entre si, o delegado faz a eles a seguinte proposta: cada um
pode escolher entre confessar e negar o crime. Se nenhum deles confessar, então ambos
Introdução à teoria dos Jogos 29
terão uma pena de um ano de prisão. Se os dois confessarem, então ambos terão pena de
cinco anos. Mas se um confessar e o outro negar, então o que confessou será libertado e o
outro será condenado a dez anos de prisão.
Neste exemplo, temos:
Jogadores Estratégias
Al S1={confessar, negar}
Bob S2={confessar, negar}
u Al : S → R, u Bob : S → R
(c, c) 7→ −5 (c, c) 7→ −5
(c, n) 7→ 0 (c, n) 7→ −10
(n, c) 7→ −10 (n, c) 7→ 0
(n, n) 7→ −1 (n, n) 7→ −1
BOB
confessar negar
AL confessar (-5,-5) (0,-10)
negar (-10,0) (-1,-1)
Vamos analisar este jogo do ponto de vista do Al. Duas situações podem ocorrer com
relação ao Bob: confessa ou não confessa. Se Bob confessa, então é melhor Al confessar
também. Se Bob não confessa, então Al ficará livre se confessar. Em qualquer caso, é
melhor Al confessar.
30 Doherty Andrade (FEITEP) & Thiago Zanko (UEM)
Do mesmo modo, vamos alisar o jogo do ponto de vista de Bob. Duas situações podem
ocorrer com relação ao Al: confessa ou não confessa. Se Al confessa, então é melhor Bob
confessar também. Se Al não confessa, então Bob ficará livre se confessar. Em qualquer
caso, é melhor Bob confessar.
Pensando assim, ambos ficarão presos por cinco anos.
Um casal deseja sair para passear. O homem prefere assitir a um jogo de futebol enquanto
a mulher prefere ir ao cinema. Ambos indo ao futebol ou ao cinema, apenas um deles terá
maior satisfação; mas se sairem sozinhos então ambos ficarão igualmente insatisfeitos.
Esta situação se adequa ao um jogo estratégico em que o conjunto de jogadores é
G = {homem, mulher}, as estratégias do homem S H = {futebol, cinema} e as estratégias
da mulher S M = {futebol, cinema}. Assim, o conjunto S das estratégias é
As duas funções utilidade u H e u M estão descritas pela seguinte matriz dos payoffs
Mulher
futebol cinema
Homem futebol (10,5) (0,0)
cinema (0,0) (5,10)
Neste jogo, dois jogadores exibem, ao mesmo tempo, a moeda que cada um esconde na sua
mão. Se ambas apresentam cara ou coroa, o segundo jogador dá sua moeda ao primeiro
jogador. Se ambos forem distintas, isto é, uma apresenta cara e o outro coroa, o primeiro
jogador dá sua moeda ao segundo.
As duas funções utilidade estão descritas pela seguinte matriz dos payoffs
Introdução à teoria dos Jogos 31
g1
s21 s22
g2 s11 (1,-1) (-1,1)
s12 (-1,1) (1,-1)
Perfuradora XY
larga estreita
Perfuradora WZ larga (-5,-5) (-5,-1)
estreita (-1,-5) (-1,-1)
4. Dominância
Vamos denotar por s−i um perfil de estratégia em que a estratégia do jogador gi foi
retirada, isto é,
s−i = {s1j1 , s2j2 , . . . , s(i−1) ji−1 , s(i+1) ji+1 , . . . , snjn }S−i
32 Doherty Andrade (FEITEP) & Thiago Zanko (UEM)
Dizemos que uma estratégia pura sik do jogador gi é estritamente dominada pela es-
tratégia sik ′ se
ui (sik ′ , s−i ) > ui (sik , s−i ),
é um equilı́brio de Nash se
ui (si∗ , s−i
∗ ∗
) ≥ ui (siji , s−i )
Uma alternativa para estes casos é considerar o jogo de ponto de vista probabilı́stico,
isto é, ao invés de escolher um perfil de estratégia pura, o jogador deve escolher uma
distribuição de probabilidades sobre suas estratégias puras.
Uma estratégia mista pi para o jogador gi ∈ G é uma distribuição de probabilidades
sobre o conjunto Si de estratégias puras do jogador, isto é, pi é um elemento do conjunto
∆ mi ,
mi
X
mi
∆mi = {( x1 , x2 , . . . , xmi ) ∈ R ; x1 , ≥ 0, x2 , ≥ 0, . . . , xmi ≥ 0 e xk = 1}.
k=1
Note que ∆mi é um conjunto compacto e convexo.
O espaço de todos os perfis de estratégia mista é o produto cartesiano
p = (p1 , p2 , . . . , pn ) = ( p11 , p12 , . . . , p1n ; p21 , p22 , . . . , p2n ; . . . ; pn1 , pn2 , . . . , pnmn )
então
m2
m1 X mn n
!
X X Y
u i (p) = ··· pkjk ui (s1j1 , s2j2 , . . . , snjn .
j1 =1 j2 =1 jn =1 k=1
(0) (0)
Sejam Si = Si e ∆mi = ∆mi . Defina recursivamente,
(n) (n)
∆mi = {p = ( p1 , p2 , . . . , pmi ) ∈ ∆mi ; ∀k = 1, 2, . . . , mi , pk > 0 somente se sik ∈ Si },
onde ui (p, s−i ), por abuso de notação, representa o payoff esperado quando o jogador gi
escolhe a estratégia mista p e os demais jogadores escolhem as estratégias mistas corres-
pondentes as estratégias puras dadas por s−i . A interseção
∞
(∞) \ (n)
Si = Si
n=0
(∞) (∞)
∆mi = {p ∈ ∆mi ; 6 ∃p ′ ∈ ∆mi talque ∀s−i ∈ S−i ui (p ′ , s−i ) > ui (p, s−i )},
é um equilı́brio de Nash se
ui (pi∗ , p−i
∗ ∗
) ≥ ui (pi , p−i )
para todo pi ∈ ∆mi , isto é, nenhum jogador se sente motivação de trocar sua estratégia mista se os
demais jogadores são o fizerem.
• Exemplo 4.2
para todo p = (1 − p, p) ∈ ∆2 e
para todo q = (1 − q, q) ∈ ∆2 .
Note que este equilı́brio corresponde ao equilı́brio em estratégias
puras s∗ = (confessar, confessar).
5.1. Jogo com 2 jogadores e de soma constante. Um jogo com dois jogadores, gl cha-
mado jogador linha (com m estratégias) e gc chamado jogador coluna (com n estratégias) e
matriz de payoffs dado por
gc
1 2 ··· n
1 ( a11 , b11 ) ( a12 , b12 ) ( a1n , b1n )
gl 2 ( a21 , b21 ) ( a22 , b22 ) ( a2n , b2n )
.. .. .. ..
. . . ··· .
m ( am1 , bm1 ) ( am2 , bm2 ) ( amn , bmn )
para as estratégias puras do jogador coluna, então o payoff esperado para o jogador linha é
a11 a12 · · · a1n q1
m X n
X h i a21 a22 · · · a2n q2
ul (p, q) = pi q j aij = p1 p2 · · · pm = pT Aq.
· · · · · · · · · · · · ...
i=1 j=1
..
am1 am2 . amn qn
De modo análogo,
uc (p, q) = pT Bq.
Como o jogo tem soma constante,
5.2. Equilíbrio de Nash em estratégias puras. Dizemos que aij da matriz A é um ponto
de sela se ele for simultaneamente um mı́nimo em sua linha e um máximo em sua coluna.
Isto é,
aij ≥ ail , ∀l = 1, 2, . . . , n
aij ≥ akj , ∀k = 1, 2, . . . , m.
Introdução à teoria dos Jogos 37
Teorema 5.3 O elemento aij é um elemento de sela de A se, e somente se, o par (i, j) é um equilı́brio
de Nash em estratégias puras para o jogo.
Demonstração: Suponha que o ponto aij seja um ponto de sela de A. Como aij é um máximo
na coluna, tem-se
ul (i, j) = aij ≥ akj = ul (k, j), ∀k = 1, 2, . . . , m.
Isto é, o jogador linha não pode aumentar o seu payoff se o jogador coluna mantiver a
estratégia.
Por outro lado, como aij é mı́nimo em sua linha, vale que
para todo l = 1, 2, . . . , n. Isto é, o jogador coluna não pode aumentar o seu payoff se o
jogador linha mantiver a estratégia.
Se (i, j) é um equilı́brio de Nash para o jogo, é fácil ver que aij é uma máximo em sua
coluna e um mı́nimo em sua linha e portanto, é um ponto de sela.
Teorema 5.4 Se aij e ars são pontos de sela de A, então ais e arj também são pontos de sela e além
disso,
aij = ars = ais = arj .
Demonstração: Considere a matriz dos payoffs A = [ aij ]. Como aij e ars são selas segue que
e
aij ≥ arj ≥ ars .
Defina
Teorema 5.6 Uma matriz A tem ponto de sela, se e somente se, vl ( A) = vc ( A).
Demonstração: Suponha que aij seja ponto de sela da matriz A. Então, aij = min ail = ai .
1≤l ≤n
como vl ( A) = max ak segue quevl ( a) ≥ ai = aij .
1≤k≤m
Po outro lado, aij = max akj = a j e como vc ( A) = min −1 ≤ l ≤ nal segue que
a≤k≤m
vc ( A) ≤ a j ≤ aij .
Assim, em um jogo de dois jogadores e com soma constante dado por uma matriz de
payoffs A do jogador linha tem um equilı́brio de nash em estratégias puras se, e somente
se, vl ( A) = vc ( A).
Introdução à teoria dos Jogos 39
pT Aq ≥ min pT Ay.
y∈ ∆ m
Assim,
max pT Aq ≥ max min pT Ay = vl ( A).
p∈ ∆ m p∈ ∆ m y∈ ∆ m
Consequentemente,
Teorema 6.2 Um perfil de estratégias mistas (p∗ , q∗ ) é um equilı́brio de Nash de um jogo com dois
jogadoes e com soma constante definido pela matriz de payoffs do jogador linha se, e somente se,
tem-se vl ( A) = vc ( A) = p∗ T Aq∗ .
p∗ T Aq = c − uc (p∗ , q∗ ) ≤ c − uc (p∗ , q) = p∗ T Aq
para todo y ∈ ∆n .
Deste modo,(p∗ , q∗ ) é um equilı́brio de Nash do jogo.
Introdução à teoria dos Jogos 41
O próximo teorema estabelece que, para jogos de dois jogadores e com soma zero, sem-
pre vl ( A) = vc ( A). Sendo assim, pelo teorema 6.2, para esta classe de jogos, existe sempre
ao menos um equilı́brio de Nash em estratégias mistas. Além disso, o teorema a seguir dá
um método para determinar o equilı́brio de Nash.
Teorema 7.1 (MiniMax de von Neumann) Para todo jogo de soma zero com dois jogadores, re-
presentado pela matriz de payoffs de A do jogador linha, sempre existe um perfil de estratégia mista
(p∗ , q∗ ) ∈ ∆m × ∆n satisfazendo
Teorema 7.2 (dualidade) O problema primal possui solução se, e somente se, o problema dual
possui solução. Além disso, se y∗ é solução do problema primal e x ∗ é solução do problema dual,
então ambos os problemas possuem o mesmo valor ótimo, isto é, c T x ∗ = b T y∗ .
42 Doherty Andrade (FEITEP) & Thiago Zanko (UEM)
Θ = c T x ∗ = b T y∗ > 0.
x∗ T A ≥ b T ⇒ x∗ T Ay∗ ≥ b T y∗ = Θ
Ay∗ ≤ c ⇒ x∗ T Ay∗ ≤ c T x ∗ = Θ.
assim, o jogador linha não pode aumentar o seu payoff esperado trocando p∗ por p se o
jogador coluna não mudar a sua estratégia.
Por outro lado, como o jogo é de soma zero
assim o jogador coluna não aumenta o seu payoff quando troca q∗ por q se o jogador linha
mantiver p∗ .
Logo,(p∗ , q∗ ) é um equilı́brio de Nash.
O governo deseja vacinar seus cidadãos contra um certo tipo de virus da gripe. Este virus
possui dois sorotipos, sendo que é desconhecida a proporção na qual os dois sorotipos
ocorrem na população di virus. Foram desenvolvidos duas vacinas em que a eficácia da
44 Doherty Andrade (FEITEP) & Thiago Zanko (UEM)
vacina 1 é 85% contra o sorotipo I e de 70% contra o sorotipo II. A eficácia da vacina 2 é de
60% contra o sorotipo I ede 90% contra o sorotipo II. Que polı́tica de vacinação deveria ser
tomada pelo governo?
A situação pode ser modelada como um jogo de soma zero com dois jogadores, o nde
o jogador linha, que é o governo, deseja fazer a compensação (a fração dos cidadãos resis-
tentes ao virus ) o maior possı́vel e o jogador coluna (o virus) deseja fazer a compensação a
menor possı́vel. A matriz dos payoffs é a seguinte:
Virus
Sorotipo I Sorotipo II
Governo Vacina I (0.85, −0.85) (0.70, −0.70)
Vacina II (0.60, −0.60) (0.90, −0.90)
Maximizar (y1 + y2 )
" #" # " #
0.85 0.70 y1 1
sujeito a ≤
0.60 0.90 y2 1
y1 ≥ 0
y2 ≥ 0
Minimizar ( x1 + x2 )
" #
h i 0.85 0.70 h i
sujeito a x1 x2 ≥ 1 1
0.60 0.90
Introdução à teoria dos Jogos 45
x1 ≥ 0
x2 ≥ 0
Na seção anterior provamos o teorema minimax de von Neumann que dá a existência
de um equilı́brio de Nash para jogos de soma zero com dois jogadores. Mas este resultado
é geral: todo jogo definido por uma matriz de payoffs possui um equilı́brio de Nash em
estratégias mistas.
46 Doherty Andrade (FEITEP) & Thiago Zanko (UEM)
zij : ∆ → R
p 7→ zij ( p) = ui (sij , p−i ) − ui ( pi , p−i ),
que mede o ganho ou perda do jogador gi quando ele troca a distribuição de probabilidade
pi pela estratégia pura sij .
Teorema 8.2 Seja p∗ ∈ ∆. Temos que p∗ é um equilı́brio de Nash se, e somente se, zij ( p) ≤ 0, para
cada i = 1, ..., n e j = 1, ..., mi .
∗ ∗
ui (e j , p−i ) = ui (sij , p−i ) ≤ ui ( pi∗ , p−i
∗
),
∗
ui ( pi , p−i ) ≤ ui ( pi∗ , p−i
∗
).
mi mi
!
X X
∗ ∗ ∗
ui ( pi , p−i ) = ui pik · ek , p−i = pik · ui (ek , p−i )
k=1 k=1
mi
X mi
X
≤ pik · ui ( pi∗ , p−i
∗
) = ui ( pi∗ , p−i
∗
)· pik ,
k=1 k=1
Pm i
onde, na última igualdade, usamos o fato de que k=1 pik = 1, dado que pi ∈ ∆mi .
gij : ∆ → R
p 7→ gij ( p) = max{0, zij ( p)}
Corolário 8.3 Seja p∗ ∈ ∆. Temos que p∗ é um equilı́brio de Nash se, e somente se, gij ( p∗) = 0,
para cada i = 1, ..., n e j = 1, ..., mi .
Definimos a aplicação
pij + gij ( p)
yij ( p) = Pm .
1 + k=i 1 gik ( p)
8.1. A demonstração.
Teorema 8.4 Seja p∗ ∈ ∆. Temos que p∗ é um equilı́brio de Nash se, e somente se, F ( p∗ ) = p∗ .
mi mi
! Pm i Pm
X X pik + gik ( p) pik + k=i 1 gik ( p)
k=1
yik ( p) = Pm = Pm
1 + k=i 1 gik ( p) 1 + k=i 1 gik ( p)
k=1 k=1
Pm
1 + k=i 1 gik ( p)
= Pm = 1,
1 + k=i 1 gik ( p)
ou seja, mostramos que F (∆) ⊂ ∆.
Seja p∗ um equilı́brio de Nash, então gij ( p∗ ) = 0 para cada i = 1, ..., n e j = 1, ..., mi .
Deste modo, yij ( p∗ ) = p∗ para cada i = 1, ..., n e j = 1, ..., mi , isto é, yi ( p∗ ) = pi∗ para cada
i = 1, ..., n, ou ainda, F ( p∗ ) = p∗ .
Reciprocamente, se p∗ ∈ ∆ é um ponto fixo do operador F : ∆ → ∆, isto é,
pij∗ + gij ( p∗ )
pij∗ = Pm ,
1 + k=i 1 gik ( p∗ )
para todo i = 1, ..., n e j = 1, ..., mi . Segue que
mi
X
∗
gij ( p ) = pij∗ gik ( p∗ ). (1)
k=1
Pm i
Definimos α = k=1 gik ( p∗ ) para cada i = 1, ..., n e j = 1, ..., mi . Queremos mostrar que
α = 0, de modo que gik ( p∗ ) = 0 para todo i = 1, ..., n e k = 1, ..., mi . Suponhamos, por
absurdo, que α > 0, vemos por (1) que
mi
X
pi∗ = ∗
pik ek ,
k=1
onde ei é o i-ésimo vetor da base canônica de R mi . Como gik ( p∗ ) > 0 para k = 1, ..., l, temos
0 < gik ( p∗ ) = zik ( p∗ ), ou seja
ui ( pi∗ , p−i
∗ ∗
) < ui (ei , p−i ),
Introdução à teoria dos Jogos 49
um absurdo. Isto demonstra que gij ( p∗ ) = 0, para todo i = 1, ..., n e j = 1, ..., mi e, assim
pelo corolário 8.3, p∗ é um equilı́brio de Nash em estratégias mistas.
Teorema 8.5 (equilı́brio de Nash) Todo jogo definido por matrizes de payoffs possui um equilı́brio
de Nash.
mi
n X
X 2
minimizar gij ( p)
i=1 j=1
sujeito a p ∈ ∆.
De fato, a soma dos quadrados é zero se, e somente se, cada parcela é nula.
No caso do dilema do prisioneiro (p, q) = ( p, 1 − p; q, 1 − q) ∈ ∆2 × ∆2 é um equilı́brio
de Nash se, e somente se, ( p, q) é solução do seguinte problema
sujeito a 0 ≤ p ≤ 1, 0 ≤ q ≤ 1.
50 Doherty Andrade (FEITEP) & Thiago Zanko (UEM)
Sabemos que (p, q) = (1, 0; 1, 0) é o único equilı́brio de Nash para o dilema dos prisio-
neiros . A figura 2 mostra a superfı́cie.
No caso do jogo a batalha dos sexos, devemos maximizar a função
+ (max{0, −5 q (3 p − 2)})2
Referências
1. Max Oliveira de Souza e Jorge Zubelli .Modelagem matemática em finanças quantitativas em tempo
discreto. Notas de Matemática aplicada, 2007.
2. D. Andrade et.al. Introdução à teoria dos Jogos. Notas de Minicurso na XXII semana de Matemática
da UEM. 2011.
3. H. Bortolossi, G. Garbugio, Brigida Sartini. Uma introdução à teoria do jogos. 260 colóquio Brasileiro
de Matemática, 2007.
4. Avner Friedman, Foundations of Modern Analysis. Holt, Reinehart and Winston, Inc., 1970.
5. S. Kesavan, Topics in Functional Analysis and Applications. Bangalores, John Wiley and Sons, 1988.