Fonction de Pearson

Cet article est une ébauche concernant les probabilités et la statistique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Les fonctions de Pearson ont été créées pour représenter des distributions unimodales. Il en existe douze. Elles ont été inventées par Karl Pearson à la fin du XIX^e siècle et au début du XX^e siècle.

Historique

Le système de Pearson a été originellement conçu afin de modéliser des observations visiblement asymétriques. Les méthodes pour ajuster un modèle théorique aux deux premiers cumulants ou moments de données observées : toute distribution peut être étendue directement une famille de distributions adaptée. Sauf dans des cas pathologiques, une famille peut être adaptée à l'espérance (premier cumulant) et la variance (deuxième cumulant) de façon arbitraire, mais il était jusque là impossible de construire des densités de probabilité en prenant également en compte l'asymétrie (troisième cumulant standardisé) et la kurtosis (quatrième cumulant standardisé). Ce besoin est apparu quand il a fallu trouver des modèles adaptés à des observations visiblement asymétriques. Les exemples de Pearson citent des données de survie, usuellement asymétriques.

Dans son article original, Pearson (1895, p. 360) identifie quatre types de distributions (numéroté de I à IV) en plus de la distribution normale (qu'il numérote originellement type V). La classification dépend du support des distributions, selon qu'il soit sur un intervalle borné, une demi-droite ou la droite réelle ; mais aussi selon leur asymétrie possible ou leur symétrie. Un deuxième papier (Pearson 1901) rectifie deux oublis : il redéfinit le type V (étant redéfinie de la loi normale, désormais la loi inverse-gamma) et introduit la fonction de type VI. Les deux papiers couvrent les cinq types principaux du système de Pearson (I, III, IV, V et VI). Un troisième papier de Pearson 1916 introduit de nouveaux types et sous-types (numérotés de VII à XII).

Rhind 1909 décrit un moyen simple de visualiser le paramètre spatial du système de Pearson, adopté par Pearson lui-même par la suite (Pearson 1916). Les types de Pearson sont caractérisés par deux quantités, couramment notées $β 1$ et $β 2$ . La première correspond au carré de l'asymétrie : $β 1 = γ 21$ où $γ 1$ est l'asymétrie, ou troisième moment standardisé. La deuxième est la kurtosis usuelle, ou quatrième moment standardisé : $β 2 = 3 + γ 2$ . Les définitions modernes définissent la kurtosis $γ 2$ à partir des cumulants plutôt que des moments, de sorte que pour la loi normale, on ait $γ 2 = 0$ et $β 2 = 3$ , mais on garde ici la définition historique de $β 2$ par Pearson.)

Beaucoup de lois asymétriques et/ou non-mésokurtiques connues de nos jours ne l'étaient pas dans les années 1890. Par exemple, la loi bêta était utilisée par Thomas Bayes comme loi a posteriori du paramètre d'une loi de Bernoulli dans ses travaux de 1763 sur les lois inverses. La loi beta a gagné en importance grâce au système de Pearson et est resté jusque dans les années 1940 conne la loi de Pearson de type I^[1] (le type II de Pearson est un cas spécial du type I, mais n'est plus de nos jours considéré séparément du type I). De même, la loi gamma vient originellement de Pearson 1893 et Pearson 1895 et est resté jusque dans les années 1940 conne la loi de Pearson de type III^[2]. La loi de type IV apparait dans Pearson 1895, et décrit comme cas spécial, ce qu'on appelle désormais la loi de Student, précédant les travaux de William Gosset de plusieurs années. Son article de 1901 présente les lois inverse-gamma (type V) et bêta prime (type VI).

Définition

Diagramme du système de Pearson, qui détermine le type de la distribution (I, III, VI, V ou IV) en fonction des termes de $β 1$ (carré de l'asymétrie) et $β 2$ (kurtosis normalisée).

Une densité $p$ est définie comme toute solution de l'équation différentielle (Pearson 1895, p. 381) ${\frac {p'(x)}{p(x)}}+{\frac {a+(x-\mu )}{b_{0}+b_{1}(x-\mu )+b_{2}(x-\mu )^{2}}}=0,$ avec : $b_{0}={\frac {4\beta _{2}-3\beta _{1}}{10\beta _{2}-12\beta _{1}-18}}\mu _{2},\quad a=b_{1}={\sqrt {\mu _{2}}}{\sqrt {\beta _{1}}}{\frac {\beta _{2}+3}{10\beta _{2}-12\beta _{1}-18}},\quad b_{2}={\frac {2\beta _{2}-3\beta _{1}-6}{10\beta _{2}-12\beta _{1}-18}}.$

Selon Ord^[3], Pearson a trouvé cette forme en partant d'abord de la forme de la dérivée logarithmique de la densité de la loi normale (qui est linéaire) puis en utilisant une relation de récurrence pour les valeurs de la fonction de densité de la loi hypergéométrique (qui donne la forme d'une fraction rationnelle, linéaire au numérateur et quadratique au dénominateur).

Le paramètre $a$ détermine un point stationnaire, et donc, sous certaines conditions, un mode de la distribution, car on peut déduire de l'équation différentielle que $p'(\mu -a)=0.$

L'équation différentielle est du premier ordre à coefficients variables et peut donc être résolue : $p(x)\propto \exp \left(-\int {\frac {x+a}{b_{2}x^{2}+b_{1}x+b_{0}}}\,\mathrm {d} x\right).$

L'intégrale dans la solution peut se simplifier grandement pour certains cas de l'intégrande. Pearson distingue deux cas, déterminé par le signe du discriminant de l'équation différentielle, et donc le nombre de racines réelles du polynôme $f (x) = b 2 x 2 + b 1 x + b 0$ .

Fonctions de Pearson

Pearson IV

La fonction de Pearson IV correspond au cas où la fonction $f$ définie auparavant a un discriminant strictement négatif. On peut alors la réécrire sous la forme : $f(x)=b_{2}\left[\left(x+{\frac {b_{1}}{2b_{2}}}\right)^{2}+\left({\frac {\sqrt {4b_{2}b_{1}-b_{0}^{2}}}{2b_{2}}}\right)^{2}\right]=b_{2}\left[(x-\lambda )^{2}+\alpha ^{2}\right]$

Le paramètre $α > 0$ (bien défini en raison du signe du discriminant) est un paramètre d'échelle, on a deux paramètres de forme $m = 1 ⁄ b 2 > 1/2$ et ${\textstyle \nu ={\frac {b_{1}-2b_{2}a}{2b_{2}^{2}\alpha }}}$ , et le paramètre $λ = b 1 ⁄ 2 b 2$ est un paramètre de localisation.

Après simplification, la densité de probabilité $p$ , pour $x$ réel, vaut : $p(x)=k\cdot \left[1+\left({\frac {x-\lambda }{\alpha }}\right)^{2}\right]^{-m}\cdot \exp \left[-\nu \cdot \arctan \left({\frac {x-\lambda }{\alpha }}\right)\right]$ où $k$ est un facteur de normalisation. Si $m \leq 1/2$ , la fonction n'est pas normalisable.

La fonction de Pearson IV est en fait une version asymétrique de la loi de Student ; de fait, on retrouve la loi de Student avec $r = 2 m -1$ degrés de liberté pour $ν = 0$ .

Pour $m = 1$ , la distribution de Pearson IV est une forme asymétrique de la loi de Cauchy (ou distribution de Breit-Wigner).

La fonction a un mode (sommet) unique placé en $x_{m}=\lambda -{\frac {a\nu }{2m}}$ elle présente deux points d'inflexion situés en $x_{i+/-}=x_{m}\pm {\frac {a}{2m}}{\sqrt {\frac {4m^{2}+\nu ^{2}}{2m+1}}}$ .

Sa moyenne vaut $\langle x\rangle =\lambda -{\frac {a\nu }{r}}$ pour $m > 1$ . La moyenne est infinie si $ν = 0$ et $m \leq 1$ .

Sa variance vaut $\mu _{2}={\frac {a^{2}}{r^{2}(r-1)}}(r^{2}+\nu ^{2})$ pour $m > 3/2$ . La variance est infinie si $m \leq 3/2$ .

Le facteur de normalisation vaut : $k={\frac {2^{2m-2}|\Gamma (m+\mathrm {i} \nu /2)|^{2}}{\pi a\Gamma (r+1)}}$ où $Γ$ est la fonction Gamma d'Euler.

Pearson VII

La fonction de Pearson IV correspond au cas particulier de la fonction IV où le paramètre de forme $ν$ , qui détermine l'asymétrie, est supposé nul. La distribution devient alors symétrique.

La VII^e fonction de Pearson est définie alors, pour $x$ entier, par $p(x)=k\left[1+{\frac {(x-\lambda )^{2}}{\alpha ^{2}}}\right]^{-m}.$ Le facteur de normalisation vaut alors : $k={\frac {1}{\alpha \mathrm {B} (m-{\frac {1}{2}},{\frac {1}{2}})}}$ où $B$ est la fonction bêta.

On écrit parfois une expression simplifiée en posant $σ = α/ \sqrt 2 m -3$ : $p(x)={\frac {1}{\sigma {\sqrt {2m-3}}\,\mathrm {B} (m-{\frac {1}{2}},{\frac {1}{2}})}}\left[1+{\frac {(x-\lambda )^{2}}{\sigma ^{2}(2m-3)}}\right]^{-m}$

Le paramètre $m$ détermine alors la kurtosis de la distribution ;

$m < 1$ : distribution dite super-lorentzienne ;
$m = 1$ : distribution de Cauchy/Lorentz (lorentzienne)/Breit-Wigner ;
$m \to \infty$ : distribution de Gauss-Laplace (gaussienne, loi normale).

Elle est utilisée en radiocristallographie pour modéliser le profil des pics de diffraction (voir aussi Fonction de Voigt).

Autre paramétrisation : la loi de Student

La fonction de Pearson VII permet aussi de retrouver la fonction de densite de la loi de Student en fixant le jeu de paramètres : $\lambda =\mu ,\ \alpha ={\sqrt {\nu \sigma ^{2}}},\ m={\frac {\nu +1}{2}}.$

La contrainte $m > 1/2$ est ainsi toujours vérifiée.

On obtient alors la densité : $p(x\mid \mu ,\sigma ^{2},\nu )={\frac {1}{{\sqrt {\nu \sigma ^{2}}}\,\operatorname {\mathrm {B} } \left({\frac {\nu }{2}},{\frac {1}{2}}\right)}}\left(1+{\frac {1}{\nu }}{\frac {(x-\mu )^{2}}{\sigma ^{2}}}\right)^{-{\frac {\nu +1}{2}}}.$

Autres cas

En considérant le cas où $f$ a un discriminant positif ( $b 21 - 4 b 2 b 0 \geq 0$ ), on a alors deux racines réelles $a 1$ et $a 2$ (pas forcément distinguées) :

${\begin{aligned}a_{1}&={\frac {-b_{1}-{\sqrt {b_{1}^{2}-4b_{2}b_{0}}}}{2b_{2}}},\\[5pt]a_{2}&={\frac {-b_{1}+{\sqrt {b_{1}^{2}-4b_{2}b_{0}}}}{2b_{2}}}.\end{aligned}}$

La forme générale de la densité peut alors se réécrire : $p(x)\propto \exp \left(-{\frac {1}{b_{2}}}\int {\frac {x-a}{(x-a_{1})(x-a_{2})}}\,\mathrm {d} x\right).$

Pearson le désigne comme le "cas logarithmique" (logarithmic case), car l'intégrale se résout alors en utilisant uniquement la fonction logarithme : $\int {\frac {x-a}{(x-a_{1})(x-a_{2})}}\,\mathrm {d} x={\frac {(a_{1}-a)\ln(x-a_{1})-(a_{2}-a)\ln(x-a_{2})}{a_{1}-a_{2}}}+C.$

En posant ${\textstyle \nu ={\frac {1}{b_{2}(a_{1}-a_{2})}},}$ , il vient : $p(x)\propto (x-a_{1})^{-\nu (a_{1}-a)}(x-a_{2})^{\nu (a_{2}-a)}.$

Pearson I

Les fonctions de Pearson de type I (une généralisation de la loi bêta) correspondent au cas où les deux racines sont de signes opposés ( $a 1 < 0 < a 2$ ). La densité $p$ n'est alors définie que sur l'intervalle $(a 1, a 2)$ . En se ramenant à l'intervalle $(0 ; 1)$ par la substitution $x = a 1 + y (a 2 - a 1)$ , et en posant : ${\begin{aligned}m_{1}&={\frac {a-a_{1}}{b_{2}(a_{1}-a_{2})}},\\[5pt]m_{2}&={\frac {a-a_{2}}{b_{2}(a_{2}-a_{1})}},\end{aligned}}$

l'écriture de la densité se simplifie en : $p(y)\propto y^{m_{1}}(1-y)^{m_{2}},$

Ainsi, ${\frac {x-\lambda -a_{1}}{a_{2}-a_{1}}}$ suit une loi bêta $B(m 1 + 1 , m 2 + 1)$ avec ${\textstyle \lambda =\mu _{1}-(a_{2}-a_{1}){\frac {m_{1}+1}{m_{1}+m_{2}+2}}-a_{1}}$ . La condition $m 1, m 2 > -1$ est nécessaire et suffisante pour que $p$ définisse une densité de probabilités.

Pearson II

Les fonctions de Pearson de type II sont un cas particulier des fonctions de type I, où les paramètres rendent la densité symétrique.

Pour la courbe de la fonction de Pearson II^[4] $y=y_{0}\left(1-{\frac {x^{2}}{a^{2}}}\right)^{m},$

avec $x={\frac {1}{2}}\sum d^{2}-{\frac {n^{3}-n}{12}}.$

L'ordonnée $y$ est la fréquence de $\sum d 2$ . Elles sont utilisées dans le calcul des tables de coefficients de corrélation dans la corrélation de Spearman pour un échantillon de moins de 100. Après, la distribution se rapproche d'une loi de Student.

Pearson III

En posant $\lambda =\mu _{1}+{\frac {b_{0}}{b_{1}}}-(m+1)b_{1},$ il vient que les fonctions de Pearson de type III regroupent les lois gamma et les lois du χ².

Pearson V

En posant ${\begin{aligned}C_{1}&={\frac {b_{1}}{2b_{2}}},\\\lambda &=\mu _{1}-{\frac {a-C_{1}}{1-2b_{2}}},\end{aligned}}$ on voit que les fonctions de Pearson de type V correspondant aux lois inverse-gamma.

Pearson VI

En posant $\lambda =\mu _{1}+(a_{2}-a_{1}){\frac {m_{2}+1}{m_{2}+m_{1}+2}}-a_{2},$ il vient que les fonctions de Pearson de type VI regroupent les lois bêta prime et les lois de Fisher.

Pearson VIII

La forme générale de la densité peut s'écrire^[5]: $p(x)\propto \exp \left(-{\frac {x}{a}}\right)^{-m}.$

Pearson IX

La forme générale de la densité peut s'écrire^[5]: $p(x)\propto \exp \left(-{\frac {x}{a}}\right)^{m}.$

Pearson X

La forme générale de la densité peut s'écrire^[5]: $p(x)\propto \exp \left(-{\frac {x-m}{a}}\right).$ On reconnait alors la loi exponentielle.

Pearson XI

La forme générale de la densité peut s'écrire^[5]: $p(x)\propto x^{-m}.$ C'est donc un cas particulier de la loi de Pareto.

Pearson XII

La forme générale de la densité peut s'écrire^[5]: $p(x)\propto \left({\frac {1+{\frac {x}{a}}}{1+\int {\frac {x}{b}}}}\right)^{m}.$ C'est donc un cas particulier du type I.

Généralisations

Le système de Pearson est défini à partir d'une équation différentielle. En considérant d'autres fonctions, on peut construire d'autres systèmes, comme celui de Burr ou de Johnson^[5]^,^[6]

Système de Burr

Articles détaillés : Système de Burr et Loi de Burr.

Le système de Burr regroupe les distributions telles que leur fonctions de répartition $F$ vérifient l'équation différentielle^[7]: $F'(x)=F(x)(1-F(x))g(x)$ où $g$ est une fonction positive.

Burr a déterminé douze types de solutions, selon le choix de $g$ ^[8]^,^[9]^,^[10]; celle qu'on appelle usuellement loi de Burr correspond au 12^e et dernier cas.

Système de Johnson

Article détaillé : Système de Johnson.

Le système de Johnson repose sur une transformation de données normalement distribuées, caractérisée par une fonction et quatre paramètres dits de translation. En considérant $φ$ la fonction de densité de la loi normale centrée réduite, il pose une fonction $h$ supposément croissante et dérivable, et quatre paramètres, $δ, λ > 0, γ, ξ$ réels, il transforme la variable ${\textstyle Z\sim {\mathcal {N}}(0;1)}$ en $X=\xi +\lambda h^{-1}\left({\frac {Z-\gamma }{\delta }}\right)\Longleftrightarrow Z=\gamma +\delta h\left({\frac {X-\xi }{\lambda }}\right),$ ce qui permet d'obtenir un modèle de fonction de densité : $p(x)=\delta h'\left({\frac {x-\xi }{\lambda }}\right)\varphi \left(\gamma +\delta h\left({\frac {x-\xi }{\lambda }}\right)\right).$ Johnson s'attarde sur trois types de fonctions^[11]:

une fonction à support borné :

$h(x)=\ln \left({\frac {x}{1-x}}\right)$

une fonction à support sur la demi-droite réelle :

$h(x)=\ln(x)$

une fonction à support non borné (en) :

$h(x)=\ln \left(x+{\sqrt {1+x^{2}}}\right)=\operatorname {argsinh} (x)$

Voir aussi

Ajustement de loi de probabilité

Bibliographie

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Pearson distribution » (voir la liste des auteurs).
(en) Karl Pearson, « Contributions to the Mathematical Theory of Evolution. II. Skew Variation in Homogeneous Material : A (1887-1895) », Philosophical Transactions of the Royal Society of London, vol. 186,‎ 1895, p. 343–414 (DOI 10.1098/rsta.1895.0010, JSTOR 90649)
(en) Karl Pearson, « Mathematical Contributions to the Theory of Evolution. X. Supplement to a Memoir on Skew Variation : Series A, Containing Papers of a Math. or Phys. Character (1896-1934) », Philosophical Transactions of the Royal Society of London, vol. 197,‎ 1901, p. 443–459 (DOI 10.1098/rsta.1901.0023, JSTOR 90841)
(en) Karl Pearson, « Mathematical Contributions to the Theory of Evolution. XIX. Second Supplement to a Memoir on Skew Variation : Series A, Containing Papers of a Math. or Phys. Character (1896-1934) », Philosophical Transactions of the Royal Society of London, vol. 216,‎ 1916, p. 429–457 (DOI 10.1098/rsta.1916.0009, JSTOR 91092)
(en) A. Rhind, « Tables to facilitate the computation of the probable errors of the chief constants of skew frequency distributions », Biometrika, vol. 7, n^os 1/2,‎ juillet–octobre 1909, p. 127–147 (DOI 10.1093/biomet/7.1-2.127, JSTOR 2345367, lire en ligne)
(en) J.K. Ord, Families of Frequency Distributions, London, Griffin.

Liens externes

(en) A Guide to the Pearson Type IV Distribution, Joel Heinrich, University of Pennsylvania, 2004
(en) Milton Abramowitz et Irene Stegun, Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables [détail de l’édition] (lire en ligne)
(en) Eric W. Weisstein, « Pearson Type III Distribution », sur MathWorld.

Notes et références

↑ (en) Jeff Miller et al., « Beta distribution », sur Earliest Known Uses of Some of the Words of Mathematics, 9 juillet 2006 (consulté le 9 décembre 2006).
↑ (en) Jeff Miller et al., « Gamma distribution », sur Earliest Known Uses of Some of the Words of Mathematics, 7 décembre 2006 (consulté le 9 décembre 2006).
↑ Ord 1972, p. 2.
↑ (en) Philip H. Ramsey, « Critical Values for Spearman's Rank Order Correlation », Journal of Educational Statistics, vol. 14, n^o 3,‎ 1^er septembre 1989, p. 245–253 (JSTOR 1165017).
↑ ^{a b c d e et f} (en) Bachioua Lahcene, « On Pearson families of distributions and its applications », African Journal of Mathematics and Computer Science Research, vol. 6, n^o 5,‎ mai 2013, p. 108-117 (ISSN 2006-9731, DOI 10.5897/AJMCSR2013.0465).
↑ (en) D. C. M. Leslie, « Determination of Parameters in the Johnson System of Probability Distributions », Biometrika, vol. 46, n^os 1/2,‎ juin 1959, pp. 229-231 (DOI 10.2307/2332826).
↑ (en) Tanujit Chakraborty, Suchismita Das et Swarup Chattopadhyay, « A New Method for Generalizing Burr and Related Distributions », Mathematica Slovaca, vol. 72, n^o 1,‎ février 2022 (DOI 10.1515/ms-2022-0016).
↑ (en) R.N. Rodriguez, Encyclopedia of Statistical Science, vol. 1, New York, John Wiley & Sons, 1982, « Burr distributions ».
↑ (en) M. Z. Raqab, « Order Statistics From the Burr Type X Model », Computers Math. Applic., vol. 36, n^o 4,‎ 1998, pp. 111-120 (lire en ligne).
↑ (en) T.R.L. Fry, Univariate and Multivariate Burr Distributions: A Survey, 1989 (DOI 10.22004/ag.econ.266976, lire en ligne).
↑ (en) N.L. Johnson, « Systems of Frequency Curves Generated by Methods of Translation », Biometrika, Oxford University Press, vol. 36, n^os 1/2,‎ juin 1949, p. 149-176.

Portail des probabilités et de la statistique

[1] (en) Jeff Miller et al., « Beta distribution », sur Earliest Known Uses of Some of the Words of Mathematics, 9 juillet 2006 (consulté le 9 décembre 2006).

[2] (en) Jeff Miller et al., « Gamma distribution », sur Earliest Known Uses of Some of the Words of Mathematics, 7 décembre 2006 (consulté le 9 décembre 2006).

[3] Ord 1972, p. 2.

[4] (en) Philip H. Ramsey, « Critical Values for Spearman's Rank Order Correlation », Journal of Educational Statistics, vol. 14, n^o 3,‎ 1^er septembre 1989, p. 245–253 (JSTOR 1165017).

[PearsonFamilies-5] {a b c d e et f} (en) Bachioua Lahcene, « On Pearson families of distributions and its applications », African Journal of Mathematics and Computer Science Research, vol. 6, n^o 5,‎ mai 2013, p. 108-117 (ISSN 2006-9731, DOI 10.5897/AJMCSR2013.0465).

[6] (en) D. C. M. Leslie, « Determination of Parameters in the Johnson System of Probability Distributions », Biometrika, vol. 46, n^os 1/2,‎ juin 1959, pp. 229-231 (DOI 10.2307/2332826).

[7] (en) Tanujit Chakraborty, Suchismita Das et Swarup Chattopadhyay, « A New Method for Generalizing Burr and Related Distributions », Mathematica Slovaca, vol. 72, n^o 1,‎ février 2022 (DOI 10.1515/ms-2022-0016).

[8] (en) R.N. Rodriguez, Encyclopedia of Statistical Science, vol. 1, New York, John Wiley & Sons, 1982, « Burr distributions ».

[9] (en) M. Z. Raqab, « Order Statistics From the Burr Type X Model », Computers Math. Applic., vol. 36, n^o 4,‎ 1998, pp. 111-120 (lire en ligne).

[10] (en) T.R.L. Fry, Univariate and Multivariate Burr Distributions: A Survey, 1989 (DOI 10.22004/ag.econ.266976, lire en ligne).

[11] (en) N.L. Johnson, « Systems of Frequency Curves Generated by Methods of Translation », Biometrika, Oxford University Press, vol. 36, n^os 1/2,‎ juin 1949, p. 149-176.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]