Paradoxe des deux enfants

En théorie des probabilités, le paradoxe des deux enfants consiste à estimer le sexe d'un enfant parmi deux à partir de l'observation de l'autre, exemple-type d'inférence bayésienne. Il y a paradoxe pour deux raisons : d'une part la bonne réponse (l'autre enfant a davantage de chances d'être de sexe opposé) est contre-intuitive pour beaucoup de personnes, et d'autre part des formulations très voisines du problème mènent à des résultats différents.

Énoncé original

Formulation

La première occurrence de ce problème est un article de Martin Gardner, paru dans la revue Scientific American en 1959 sous le titre The Two Children Problem, puis publié dans The 2nd Scientific American book of mathematical puzzles & diversions^[1].

Mr. Smith has two children. At least one of them is a boy. What is the probability that both children are boys?

Mr. Jones has two children. The older child is a girl. What is the probability that both children are girls?

M. Smith a deux enfants. Au moins l'un des deux est un garçon. Quelle est la probabilité que les deux enfants soient des garçons ?

M. Jones a deux enfants. L'enfant aîné est une fille. Quelle est la probabilité que les deux enfants soient des filles ?

Dans cet article, les probabilités étaient évaluées respectivement à ${\tfrac {1}{3}}$ et ${\tfrac {1}{2}}.$ Cela signifie que parmi toutes les familles avec deux enfants dont au moins un garçon, un tiers d'entre elles a en fait deux garçons, tandis que parmi toutes les familles avec deux enfants dont une fille en première position, la moitié d'entre elles a en fait deux filles.

Mais Martin Gardner a reconnu plus tard que la question concernant Mr. Smith était ambiguë^[2]. En effet, la manière dont est acquise l'information selon laquelle il y a au moins un garçon dans la fratrie influence la réponse à la question, qui peut alors être soit ${\tfrac {1}{3}},$ soit ${\tfrac {1}{2}}.$

De nombreuses variantes de ce problème montrent l'importance de la formulation dans le calcul du résultat.

Hypothèses implicites

On néglige la petite différence de proportion qu'il y a entre garçons et filles dans les populations humaines (elle dépend d'ailleurs de l'âge et du pays)^[3], et les difficultés créées par les jumeaux : prendre en compte ces complications ne changerait les résultats que de manière infime^[4].

On utilise une modélisation dans laquelle chaque enfant est supposé être soit un garçon, soit une fille, de façon équiprobable, et où les sexes des enfants sont supposés être indépendants d'un enfant à l'autre (en l'absence d'hypothèse supplémentaire).

Explication par tableau

On distingue les quatre possibilités pour le sexe de deux enfants d'une famille à l'aide d'un tableau à double entrée :

		Sexe du deuxième enfant
		Fille	Garçon
Sexe du premier enfant	Fille	FF	FG
Sexe du premier enfant	Garçon	GF	GG

D'après les hypothèses implicites, ces quatre possibilités sont équiprobables. Il suffit alors de déterminer le quotient du nombre de cas favorables par le nombre de cas possibles dans chaque famille.

Dans la famille de M. Smith, les cas possibles sont FG, GF, et GG, alors que le seul cas favorable est GG. La probabilité que les deux enfants soient des garçons vaut donc ${\tfrac {1}{3}}.$

Dans la famille de M. Jones, les seuls cas possibles sont notés FF et FG, et le seul cas favorable est FF. La probabilité que les deux enfants soient des filles vaut donc ${\tfrac {1}{2}}.$

Calcul formel avec probabilités conditionnelles

Le calcul peut être effectué avec les notations d'événements :

$F_{1}$ : « le premier enfant est une fille » ;
$F_{2}$ : « le deuxième enfant est une fille ».

Démonstration

Famille Jones

La probabilité qu'il y ait deux filles dans la famille Jones est alors la probabilité de l'intersection de ces deux événements, sous la condition du premier événement :

P_{F_{1}}(F_{1}\cap F_{2})={\frac {P{\big (}F_{1}\cap (F_{1}\cap F_{2}){\big )}}{P(F_{1})}}={\frac {P(F_{1}\cap F_{2})}{P(F_{1})}}=P_{F_{1}}(F_{2})\ ;

or, par indépendance de $F_{1}$ et $F_{2}\ ,$

P_{F_{1}}(F_{2})=P(F_{2})\ ;

d'après les hypothèses implicites, cette probabilité vaut ${\tfrac {1}{2}}.$

Famille Smith

La probabilité qu'il y ait deux garçons dans la famille Smith s'écrit :

P_{{\overline {F_{1}}}\cup {\overline {F_{2}}}}({\overline {F_{1}}}\cap {\overline {F_{2}}})={\frac {P{\big (}({\overline {F_{1}}}\cup {\overline {F_{2}}})\cap ({\overline {F_{1}}}\cap {\overline {F_{2}}}){\big )}}{P({\overline {F_{1}}}\cup {\overline {F_{2}}})}}={\frac {P({\overline {F_{1}}}\cap {\overline {F_{2}}})}{P({\overline {F_{1}\cap F_{2}}})}}\ ,

la dernière égalité se déduisant des propriétés des opérations ensemblistes, notamment d'une des lois de De Morgan.

Puis, par passage au complémentaire, indépendance des événements $F_{1}$ et $F_{2}\ ,$ et donc aussi indépendance des événements ${\overline {F_{1}}}$ et ${\overline {F_{2}}}\ ,$

{\frac {P({\overline {F_{1}}}\cap {\overline {F_{2}}})}{P({\overline {F_{1}\cap F_{2}}})}}={\frac {P({\overline {F_{1}}}\cap {\overline {F_{2}}})}{1-P(F_{1}\cap F_{2})}}={\frac {P({\overline {F_{1}}})P({\overline {F_{2}}})}{1-P(F_{1})P(F_{2})}}={\frac {(1/2)^{2}}{1-(1/2)^{2}}}={\frac {1/4}{3/4}}={\frac {1}{3}}\ .

Critiques

Acquisition de l'information

Martin Gardner signale que la manière dont l'information sur la composition de la fratrie est recueillie peut changer la réponse au problème^[2].

Le calcul effectué précédemment suppose que la famille Smith se retrouve de façon équiprobable dans l'une des trois cases FG, GF, et GG du tableau. Or l'information selon laquelle M. Smith a au moins un garçon peut être obtenue de différentes manières :

Première procédure :
- Version abstraite : On suppose l'équiprobabilité entre les familles avec deux enfants dont au moins un garçon (dans cette version, on sait déjà quelles sont ces familles ; Gardner ne dit pas comment) ; la famille Smith est choisie au hasard parmi celles-ci^[2].
- Version concrète : On pose à M. Smith la question « Avez-vous au moins un garçon ? », et il répond « Oui. ».

Avec l'une ou l'autre de ces deux versions, la probabilité que M. Smith ait deux garçons vaut

{\tfrac {1}{3}}.

Deuxième procédure (concrète) :

On demande à M. Smith « Indiquez-moi le sexe de l'un de vos enfants. », et il répond « J'ai (au moins) un garçon. ». Gardner fait remarquer que^[2]: si, à cette question, tout père de famille avec un garçon et une fille répond seulement une fois sur deux « J'ai (au moins) un garçon. », alors avec cette procédure, la probabilité que M. Smith ait deux garçons remonte à

{\tfrac {1}{2}}.

Explication par tableaux

La première procédure (« Avez-vous au moins un garçon ? — Oui. ») correspond exactement au tableau donné précédemment. L'information donnée par M. Smith permettant d'éliminer le cas FF du tableau, et les trois autres possibilités étant équiprobables d'après les hypothèses implicites, la probabilité du cas GG vaut ${\tfrac {1}{3}}.$

Pour la deuxième procédure, on distingue comme précédemment les quatre possibilités de sexe, et on écrit dans le tableau à double entrée ce que M. Smith peut répondre :

		Sexe du deuxième enfant
		Fille	Garçon
Sexe du premier enfant	Fille	FF « une fille »	FG « une fille » ou bien « un garçon »
Sexe du premier enfant	Garçon	GF « une fille » ou bien « un garçon »	GG « un garçon »

M. Smith a répondu « un garçon », le cas FF est donc éliminé. M. Smith peut se trouver dans la situation GG, GF, ou bien FG, ces trois situations étant équiprobables et chacune associée à la probabilité ${\tfrac {1}{3}}.$ Si l'autre enfant de M. Smith est une fille (GF ou FG), les deux réponses « un garçon » ou « une fille » sont possibles. En supposant qu'un parent dans cette situation répond sans préférence particulière, la réponse « un garçon » recueille la moitié de la probabilité de chaque situation, soit ${\tfrac {1}{6}}$ pour GF et ${\tfrac {1}{6}}$ pour FG, donc ${\tfrac {1}{3}}$ au total. Si l'autre enfant de M. Smith est un garçon (GG), la réponse « un garçon » a la probabilité de la situation, soit ${\tfrac {1}{3}}$ également. La probabilité que M. Smith réponde « un garçon » alors qu'il a aussi une fille (GF ou FG) ou alors qu'il a un second garçon (GG) sont donc égales, ce qui fait que la probabilité qu'il ait un second garçon vaut ${\tfrac {1}{2}}.$

Calcul formel avec probabilités conditionnelles

Démonstration

On appelle $A$ l'événement Monsieur Smith répond « Oui. » à la question « Avez-vous au moins un garçon ? », et $B$ l'événement Monsieur Smith répond « J'ai au moins un garçon. » à la demande « Indiquez-moi le sexe de l'un de vos enfants. ».

Avec la première procédure, la probabilité qu'il ait deux garçons est la probabilité conditionnelle :

P_{A}(GG)={\frac {P(A\cap GG)}{P(A)}}={\frac {P_{GG}(A){\text{·}}P(GG)}{P(A)}}\ ,

où la probabilité $P(A)$ est donnée par la formule des probabilités totales :

{\begin{array}{rl}P(A)\!\!\!&=P(A\cap GG)+P(A\cap GF)+P(A\cap FG)+P(A\cap FF)\\&=P_{GG}(A){\text{·}}P(GG)+P_{GF}(A){\text{·}}P(GF)+P_{FG}(A){\text{·}}P(FG)+P_{FF}(A){\text{·}}P(FF)\\&=1\times {\tfrac {1}{4}}+1\times {\tfrac {1}{4}}+1\times {\tfrac {1}{4}}+0\times {\tfrac {1}{4}}={\tfrac {3}{4}}\ ;\end{array}}

ainsi,

P_{A}(GG)={\frac {1\times {\frac {1}{4}}}{\frac {3}{4}}}={\frac {1}{3}}\ .

Avec la deuxième procédure, les probabilités conditionnelles sur $B$ dépendent de la proportion de garçon(s) dans la fratrie :

{\begin{array}{rl}P(B)\!\!\!&=P_{GG}(B){\text{·}}P(GG)+P_{GF}(B){\text{·}}P(GF)+P_{FG}(B){\text{·}}P(FG)+P_{FF}(B){\text{·}}P(FF)\\&=1\times {\tfrac {1}{4}}+{\tfrac {1}{2}}\times {\tfrac {1}{4}}+{\tfrac {1}{2}}\times {\tfrac {1}{4}}+0\times {\tfrac {1}{4}}={\tfrac {1}{2}}\ ;\end{array}}

alors :

P_{B}(GG)={\frac {P(B\cap GG)}{P(B)}}={\frac {P_{GG}(B){\text{·}}P(GG)}{P(B)}}={\frac {1\times {\frac {1}{4}}}{\frac {1}{2}}}={\frac {1}{2}}\ .

D'autres manières d'acquérir l'information sur le sexe d'un enfant s'apparentent à la deuxième procédure, comme la rencontre d'un garçon disant être le fils de M. Smith.

Particularisation

Un autre biais de la formulation d'origine pour M. Smith est le recours à l'expression « l'un des deux » qui peut particulariser l'un des enfants de la même manière que le fait l'ordre de naissance. Cette particularisation peut être entérinée par la question « Quelle est la probabilité que l'autre enfant soit un garçon (aussi) ? » qui est parfois utilisée.
En effet, lorsque l’information est ainsi fournie spontanément par le locuteur, on pourra penser qu’il a fait un choix préalable sur l’enfant dont il parle, choix qui pourra être aussi bien volontaire qu'involontaire, ou même dû au hasard.

Exemple : « J’ai deux enfants, l’un est un garçon » peut indiquer que le garçon en question a été choisi par celui qui s’exprime, de manière consciente ou non. Si c’est le cas, la probabilité que l’autre enfant soit (aussi) un garçon est bien ${\tfrac {1}{2}},$ car à partir du moment où l'un et l'autre sont identifiés, le sexe de « l'autre » est indépendant de l'information fournie.

À l’inverse, il reste possible que l’interlocuteur n’ait pas fait de choix, même avec cette tournure de phrase ; il pourra s’agir par exemple d’un mathématicien ou logicien qui ne fait que livrer (malhabilement, ou très habilement) une information générale sur ses deux enfants, à savoir ici qu’il n’a pas deux filles, auquel cas la probabilité qu’il ait deux garçons est ${\tfrac {1}{3}}.$

Ce point est celui qui porte le plus souvent à discussion, et qui amène à employer le terme de paradoxe (des deux enfants). Il disparaît lorsque l’information fournie résulte d’une réponse à une question fermée ; par exemple, dans le dialogue suivant :
— « Avez-vous exactement deux enfants ? »
— « Oui. »
— « Avez-vous au moins un garçon ? »
— « Oui. »,
la particularisation de l’enfant ne peut plus être invoquée, et la probabilité que l’interlocuteur ait deux garçons vaut bien ${\tfrac {1}{3}}.$

Variantes

Les variantes les plus courantes du paradoxe des deux enfants consistent à joindre une autre information au sexe.

Jour de naissance

Lê Nguyên Hoang propose de considérer une famille de deux enfants, dont au moins l'un des enfants est un garçon né un mardi. On se demande quelle est la probabilité que l'autre enfant soit un garçon aussi^[5].

On suppose l'équiprobabilité entre les sexes et entre les jours de la semaine ; alors pour chaque enfant, l'événement « être un garçon » a la probabilité ${\textstyle {\frac {1}{2}},}$ et l'événement « être né un mardi » a la probabilité ${\textstyle {\frac {1}{7}}.}$ On suppose aussi l'indépendance entre le sexe et le jour de la semaine ; alors « être un garçon né un mardi » a la probabilité ${\textstyle {\frac {1}{2}}\times {\frac {1}{7}}={\frac {1}{14}},}$ « être un garçon né un autre jour » a la probabilité ${\textstyle {\frac {1}{2}}\times {\frac {6}{7}}={\frac {6}{14}},}$ et « être une fille » a la probabilité ${\textstyle {\frac {1}{2}}.}$
On suppose de plus l'indépendance mutuelle entre les sexes et les jours de la semaine des enfants ; alors pour deux enfants, on obtient les probabilités suivantes :

Probabilité a priori			Deuxième enfant
			Garçon		Fille
			né un mardi	né un autre jour	Fille
Premier enfant	Garçon	né un mardi	${\frac {1}{14}}\times {\frac {1}{14}}={\frac {1}{196}}=\ \mathbf {1} \times {\tfrac {1}{14^{2}}}$	${\frac {1}{14}}\times {\frac {6}{14}}={\frac {6}{196}}=\ \mathbf {6} \times {\tfrac {1}{14^{2}}}$	${\frac {1}{14}}\times \,{\frac {1}{2}}\ =\,{\frac {1}{28}}\,=\ \mathbf {7} \times {\tfrac {1}{14^{2}}}$
	Garçon	né un autre jour	${\frac {6}{14}}\times {\frac {1}{14}}={\frac {6}{196}}=\ \mathbf {6} \times {\tfrac {1}{14^{2}}}$	${\frac {6}{14}}\times {\frac {6}{14}}={\frac {36}{196}}=36\times {\tfrac {1}{14^{2}}}$	${\frac {6}{14}}\times \,{\frac {1}{2}}\ =\,{\frac {6}{28}}\,=42\times {\tfrac {1}{14^{2}}}$
	Fille		$\ {\frac {1}{2}}\,\times {\frac {1}{14}}=\,{\frac {1}{28}}\,=\ \mathbf {7} \times {\tfrac {1}{14^{2}}}$	$\ {\frac {1}{2}}\,\times {\frac {6}{14}}=\,{\frac {6}{28}}\,=42\times {\tfrac {1}{14^{2}}}$	$\ {\frac {1}{2}}\,\times \,{\frac {1}{2}}\ =\;\,{\frac {1}{4}}\;\,=49\times {\tfrac {1}{14^{2}}}$

Sachant que la famille a au moins un garçon né un mardi $(Gm),$ on peut éliminer les cases qui ne correspondent ni à la première ligne, ni à la première colonne. On obtient alors la probabilité que l'autre enfant soit un garçon aussi $(GG),$ sous la condition $Gm$ (la notation « $\neg m$ » signifie « non $m$ ») :

P_{Gm}(GG)={\frac {P(Gm\cap GG)}{P(Gm)}}={\frac {P(GmGm\cup GmG\neg m\cup G\neg mGm)}{P(GmGm\cup GmG\neg m\cup G\neg mGm\cup GmF\cup FGm)}}\ ;

les événements $GmGm,GmG\neg m,G\neg mGm,GmF,FGm$ sont deux à deux incompatibles, donc :

P_{Gm}(GG)={\frac {P(GmGm)+P(GmG\neg m)+P(G\neg mGm)}{P(GmGm)+P(GmG\neg m)+P(G\neg mGm)+P(GmF)+P(FGm)}}

={\frac {(1+6+6){\big /}14^{2}}{(1+6+6+7+7){\big /}14^{2}}}={\frac {13}{27}}\approx 48\ \%\ .

Prénom

Jean-Paul Delahaye présente le paradoxe suivant, inventé par Jacques Patarin^[6]:

Une famille a deux enfants dont au moins une fille ; elle se prénomme Sophie. Quelle est la probabilité pour que cette famille ait deux filles ?

Delahaye suppose que, dans la population : aucun garçon ne se prénomme Sophie, aucune famille n'a deux filles avec le même prénom, et la proportion de filles non prénommées Sophie vaut ${\tfrac {1}{2}}$ (il l'arrondit par excès).

Parmi toutes les familles ayant deux enfants, on en choisit une au hasard ; cette famille a au moins une fille, prénommée Sophie. Cet enfant est la seule Sophie de cette fratrie, donc est unique. L'enfant qui ne s'appelle pas Sophie a donc la même probabilité d'être un garçon ou une fille ; la probabilité pour que cet autre enfant soit une fille^[7]^,^[8] vaut donc ${\tfrac {1}{2}},$ et non pas ${\tfrac {1}{3}}.$

On peut comprendre intuitivement la différence entre ces deux résultats : dans le problème de Sophie, une famille ayant deux filles a deux fois plus de chances d'avoir une fille prénommée Sophie qu'une famille ayant une seule fille ; donc le poids des familles ayant deux filles est en quelque sorte doublé dans ce problème, alors qu'il ne l'est pas dans le problème de M. Smith (première procédure)^[8].

Généralisation

Cette généralisation est proposée par Jacques Patarin et exposée par Jean-Paul Delahaye^[9]. Il s'agit d'introduire un paramètre continu $p\in \ ]0,1]$ évaluant la probabilité qu'une fille ait une certaine propriété $P,$ cette propriété pouvant apparaître indépendamment d'un enfant à l'autre, et donc éventuellement pour deux filles d'une même famille. On démontre^[9]^,^[10] alors que pour une famille avec deux enfants dont au moins une fille ayant la propriété $P,$ la probabilité d'avoir deux filles vaut :

{\frac {2-p}{4-p}}\ .

Remarques :

Quand $p$ varie entre $0$ et $1,{\tfrac {2-p}{4-p}}$ varie entre ${\tfrac {1}{2}}$ et ${\tfrac {1}{3}},$ car ${\tfrac {2-p}{4-p}}$ est une fonction homographique (de $p$ ) décroissante sur $]-\infty ,4[.$
Plus $p$ est faible — c.-à-d. plus l'information particularise la fille (comme son prénom) — plus la probabilité est proche de ${\tfrac {1}{2}}.$

Plus

p

est forte — c.-à-d. moins l'information particularise la fille — plus la probabilité est^[11]^,^[12] proche de

{\tfrac {1}{3}}.

Notes

↑ Gardner 1961, p. 152-153 et 159, The Two Children Problem, Chap. 14 - Nine More Problems.
↑ ^{a b c et d} Gardner 1961, p. 226, Chap. 19 - Probability And Ambiguity.
↑ Proportion de garçons et de filles selon les âges et les pays
↑ Delahaye 2005, p. 92, col. 2.
↑ Science4All, « 3 variantes mindfucks des 2 enfants | Bayes 6 », 15 avril 2019 (consulté le 14 mai 2019)
↑ Delahaye 2005, p. 92, col. 2.
↑ Schwartz 2005, p. 3-4.
↑ ^{a et b} Delahaye 2005, p. 93, col. 1.
↑ ^{a et b} Delahaye 2005, p. 93, col. 2.
↑ Schwartz 2005, p. 2-3.
↑ Delahaye 2005, p. 94, col. 1.
↑ Schwartz 2005, p. 3.

Bibliographie

Jean-Paul Delahaye, « Le Trésor et les Sophies », Pour la science, n^o 336,‎ octobre 2005, p. 92-94 (lire en ligne)
(en) Martin Gardner, The 2nd Scientific American book of mathematical puzzles & diversions, Simon & Schuster, 1961 (présentation en ligne)
Claudine Schwartz, « Des familles de deux enfants », sur Irem de Grenoble, 11 novembre 2005

Articles connexes

Portail des probabilités et de la statistique

[Gardner1961152-153_et_159,_The_Two_Children_Problem,_Chap._14_-_Nine_More_Problems-1] Gardner 1961, p. 152-153 et 159, The Two Children Problem, Chap. 14 - Nine More Problems.

[Gardner1961226,_Chap._19_-_Probability_And_Ambiguity-2] {a b c et d} Gardner 1961, p. 226, Chap. 19 - Probability And Ambiguity.

[3] Proportion de garçons et de filles selon les âges et les pays

[Delahaye200592,_col._2-4] Delahaye 2005, p. 92, col. 2.

[5] Science4All, « 3 variantes mindfucks des 2 enfants | Bayes 6 », 15 avril 2019 (consulté le 14 mai 2019)

[Delahaye200592,_col._2-6] Delahaye 2005, p. 92, col. 2.

[Schwartz20053-4-7] Schwartz 2005, p. 3-4.

[Delahaye200593,_col._1-8] {a et b} Delahaye 2005, p. 93, col. 1.

[Delahaye200593,_col._2-9] {a et b} Delahaye 2005, p. 93, col. 2.

[Schwartz20052-3-10] Schwartz 2005, p. 2-3.

[Delahaye200594,_col._1-11] Delahaye 2005, p. 94, col. 1.

[Schwartz20053-12] Schwartz 2005, p. 3.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]