Part 2 Jeux m1
Part 2 Jeux m1
Part 2 Jeux m1
Nicolas Carayol
Dynamique
Exemple)
CHAPITRE 2. JEUX, STRATEGIES ET INFORMATION 12
(uE , uI )
Coopérer (40, 50)
Entrer I
E
Combattre (−10, 0)
Non
(0, 300)
Equilibre de Nash :
Sous-jeux
Généralisation de l’idée de base → utilisation effective des
stratégies annoncées.
Définition
Un sous-jeu d’un jeu en forme extensive J est constitué par :
• un ensemble K de sommets, comprenant un sommet de J et
les sommets consécutifs à celui-ci, muni de la propriété
suivante : si un sommet k de K appartient à un ensemble
d’information h non-réduit à un singleton alors tous les
sommets de h appartiennent à K (h ⊂ K ) ;
• l’ensemble des arcs reliant les différents sommets de K ;
• les gains terminaux de J correspondants aux sommets
terminaux de K .
Equilibre parfait en sous-jeux Jeux répétés
Définition
Quand un sous–jeu est différent du jeu original, on l’appelle un
sous-jeu propre.
Tout jeu J en forme extensive contient au moins un sous-jeu :
lui-même.
Equilibre parfait en sous-jeux Jeux répétés
ENPSJ
Définition
(Selten (1975)) Un profil de stratégies du jeu J est un équilibre
de Nash parfait en sous–jeux (ENPSJ) s’il correspond à un
équilibre de Nash dans chaque sous–jeu du jeu J.
Lemma
Un EPSJ doit être un équilibre de Nash du jeu original (car ce
dernier correspond à l’un des sous–jeux).
Equilibre parfait en sous-jeux Jeux répétés
Illustration
Jeux répétés
L’idée de base
2
C D
1 C (3, 3) (−1, 4)
D (4, −1) (0, 0)
Table: Dilemme du prisonnier II
Paiements minmax
Paiements minmax
2
C D
1 C (3, 3) (−1, 4)
D (4, −1) (0, 0)
Table: Dilemme du prisonnier II
Equilibre parfait en sous-jeux Jeux répétés
Paiements minmax
2
C D
1 C (3, 3) (−1, 4)
D (4, −1) (0, 0)
Table: Dilemme du prisonnier II
• Minimax = EN
• Paiements de minmax = 0
Equilibre parfait en sous-jeux Jeux répétés
Paiements minmax
2
C D P
C (3, 3) (−1, 4) (−2, −1)
1 D (4, −1) (0, 0) (−1, −1)
P (−1, −2) (−1, −1) (−3, −3)
Table: Dilemme du prisonnier II
Equilibre parfait en sous-jeux Jeux répétés
Paiements minmax
2
C D P
C (3, 3) (−1, 4) (−2, −1)
1 D (4, −1) (0, 0) (−1, −1)
P (−1, −2) (−1, −1) (−3, −3)
Table: Dilemme du prisonnier II
• EN=DD
• Paiements de minimax → −1
Equilibre parfait en sous-jeux Jeux répétés
Definitions
Définition
Un jeu en forme normale est décrit par :
Un ensemble de n joueurs : I = {1, 2, . . . , n} .
Chaque joueur i a un ensemble d’actions ai ∈ Ai . Une issue ou
profil d’actions est donnée par le vecteur a ≡ (a1 , a2 , . . . , an )
Pour chaque joueur i, une fonction de gain, ui : A = X Ai → R
i∈I
Equilibre parfait en sous-jeux Jeux répétés
Definitions
Définition
Etant donné un jeu sous forme normale G = (I , (Ai ), (ui )), le jeu
répété G (T , δ) est le jeu sous forme extensive où G est joué en T
étapes, où les actions de toutes les étapes sont publiquement et
parfaitement observées, et les gains sont obtenu à chaque période
jouée et actualisés au facteur δ.
Définition
Le jeu répété G (∞, δ) est le jeu sous forme extensive où G est joué
un nombre d’étapes infini.
Définition
Le profil d’action en t est noté at ≡ (a1t , a2t , . . . , ant ) , at ∈ A, ∀t.
Equilibre parfait en sous-jeux Jeux répétés
Histoires et Stratégies
Définition
Une histoire à l’étape t est le vecteur
ht = (a1 , a2 , ..., at−1 ) ∈ At−1 = A
| × {z
··· × A}.
t−1 fois
Définition
Une stratégie (pure) du joueur i est donnée par : si = (si1 , ..., siT ),
où sit : At−1 → Ai .
Equilibre parfait en sous-jeux Jeux répétés
Equilibre de Nash
Définition
Un profil de stratégies (pure) donné par : s = (s1 , ..., sn ) = (si , s−i )
est un équilibre de Nash si pour toute autre stratégie de n’importe
quel joueur i ŝi = (ŝi1 , ..., ŝiT ) :
T
X T
X
δ t−1 ui (sit , s−i
t
)≥ t
δ t−1 ui (ŝit , s−i ).
t=1 t=1
Equilibre parfait en sous-jeux Jeux répétés
Définition
La stratégie (pure) si du joueur i, sa stratégie de continuation en t
est donnée par si |ht .
Définition
Un profil de stratégies (pure) s = (si , s−i ) est un équilibre de Nash
parfait en sous jeux si pour toutes les histoires ht , si |ht est un
équilibre de Nash du jeu répété.
Equilibre parfait en sous-jeux Jeux répétés
Définition
Une déviation en un coup du joueur i de la stratégie si est une
stratégie ŝi 6= si telle qu’il existe une seule histoire ĥt pour laquelle,
si (ĥt ) 6= ŝi (ĥt ).
Définition
Un profil de stratégies s = (si , s−i ) est un équilibre de Nash parfait
en sous-jeux d’un jeu répété si et seulement si il n’existe pas de
déviation en un coup profitable. Soit ŝi toute déviation en un coup
du joueur i de la stratégie si . P
s = (si , s−i ) est un ENPSJ ssi :
∀i ∈ I , ∀τ ≤ T , ∀ĥτ ∈ At−1 : T t=τ δ
t−1 u (s t , s t ) ≥
i i −i
PT t−1 u (ŝ t , s t ).
t=τ δ i i −i
Equilibre parfait en sous-jeux Jeux répétés
L’horizon temporel
• L’horizon temporel du jeu est une variable essentielle.
• Horizon fini/infini : les résultats sont très différents entre ces
deux types de jeux.
• NB : il s’agit de l’horizon tel qu’il est perçu par les joueurs
plus que tel qu’il est objectivement.
Equilibre parfait en sous-jeux Jeux répétés
Théorème
Si tous les profils de paiements d’équilibre du jeu de base
coı̈ncident avec le profil de paiements minmax du jeu de base alors
toutes les trajectoires d’équilibres de Nash du jeu répété fini sont
telles que chaque action dans tous les jeux de base correspond aux
stratégies d’équilibre de Nash.
2
C D P
C (3, 3) (−1, 4) (−2, −1)
1 D (4, −1) (0, 0) (−1, −1)
P (−1, −2) (−1, −1) (−3, −3)
Table: Dilemme du prisonnier III
2
C D P
C (3, 3) (−1, 4) (−2, −1)
1 D (4, −1) (0, 0) (−1, −1)
P (−1, −2) (−1, −1) (−3, −3)
Table: Dilemme du prisonnier III
• Mais ce n’est pas un ENPSJ, car les joueurs n’ont pas intérêt
à jouer P à la seconde période ← il y a une déviation en un
coup profitable !
• Unique ENPSJ : les deux joueurs jouent D à la première
période et D à la seconde période.
Théorème
Si le jeu de base a un unique équilibre de Nash, le jeu répété un
nombre fini de fois a un unique équilibre de Nash parfait en sous
jeu, où l’équilibre de Nash du jeu de base est joué à chaque étape
(quelle que soit l’histoire préalable du jeu).
Equilibre parfait en sous-jeux Jeux répétés
2
C D P
C (3, 3) (−1, 4) (−2, −1)
1 D (4, −1) (1, 1) (−1, −1)
P (−1, −2) (−1, −1) (−1/2, −1/2)
Table: Dilemme du prisonnier IV
2
C D A B
C (2, 2) (0, 3) (0, 0) (−2, 0)
1 D (3, 0) (1, 1) (0, 0) (−2, 0)
A (0, −2) (0, −2) (2, −1) (−2, −2)
B (0, 0) (0, 0) (0, 0) (−1, 2)
Table: Dilemme du prisonnier V
2
C D
1 C (3, 3) (−1, 4)
D (4, −1) (0, 0)
3 1
≥ 4 ⇔ δ ≥ = 25%.
1−δ 4
Equilibre parfait en sous-jeux Jeux répétés
Définition
Un profil de paiement û est réalisable si, pour tout i, ûi est une
combinaison convexe
P des paiements P des différentes issues du
jeu :∃ρ, tel que a ρ(a) = 1 et a ρ(a)ui (a) = ûi .
Reprenons le dilemme du prisonnier :
2
C D
1 C (3, 3) (−1, 4)
D (4, −1) (0, 0)
Théorème
Tout vecteur de gains réalisables espérés peut être soutenu à
l’équilibre s’il donne à chaque joueur au moins autant que ses
gains de minmax (si tous les autres joueurs s’étaient ligués contre
lui, rationalité individuelle).
→ représentation graphique
→ Le folk theorem (ou le théorème de tout le monde).
→ Multiplicité des équilibres de Nash.
Equilibre parfait en sous-jeux Jeux répétés
Question : Quel est l’intérêt des autres joueurs à punir celui qui a
dévié de l’accord ?
→ La punition peut être très coûteuse non seulement pour le puni
mais aussi pour ceux qui l’infligent.
→ Equilibres de Nash basés sur ce type de menaces → Ils ne sont
pas parfaits en sous-jeux.
Equilibre parfait en sous-jeux Jeux répétés
2
C D
1 C (5, 5) (−1, −2)
D (6, −1) (0, −3)
Table: Dilemme du prisonnier (variante)
2
C D
1 C (5, 5) (−1, −2)
D (6, −1) (0, −3)
Un équilibre de Nash :
• 1 joue C tout le temps.
• 2 joue C tant que 1 joue C et adopte D si jamais 1 joue D.
Problème : 1 n’aura pas envie de jouer D (si δ est suffisamment
élevé)
← s’il croit que 2 va exécuter sa menace
→ mais difficile de croire que 2 va effectivement exécuter cette
menace :
• 2 n’obtiendra pas plus de −2 s’il exécute sa menace
• en jouant C , il obtient au pire −1.
La coopération n’est ici pas un ENPSJ : il existe une histoire dans
laquelle un joueur a envie de dévier de sa stratégie annoncée.
→ 1 va être incitée à jouer impunément D
Equilibre parfait en sous-jeux Jeux répétés
Théorème
Soit J un jeu fini statique en information complète. Soient
u ∗ = (u1∗ , . . . un∗ ) le vecteur des gains des joueurs pour un équilibre
de Nash du jeu de base, et u = (u1 , . . . un ) un vecteur de gains
réalisables dans ce jeu . Si ui > ui∗ pour tout joueur i et si δ est
suffisamment proche de l’unité alors il existe un EPSJ du jeu
répété de manière infinie G (∞, δ) qui donne u comme le vecteur
des gains moyens des joueurs.
Equilibre parfait en sous-jeux Jeux répétés
Joueur 2
c d
Joueur 1 c 2, 2 0, 3
d 3, 0 1, 1