確率分布

確率分布（かくりつぶんぷ、英: probability distribution）は、確率変数に対して、各々の値をとる確率全体を表したものである。日本産業規格では、「確率変数がある値となる確率，又はある集合に属する確率を与える関数」と定義している^[1]。

概要

例えば、「サイコロ2個を振ったときの出た目の和」は確率変数である。この確率変数 $X$ に対する分布は次の表のようになる。

$X$ の取る値 $n$	2	3	4	5	6	7	8	9	10	11	12
$P (X の値が n を取る)$	1/36	2/36	3/36	4/36	5/36	6/36	5/36	4/36	3/36	2/36	1/36

すなわち、離散型確率変数である場合は、確率分布とは確率変数の値にその確率（確率質量）を対応させる関数（確率質量関数）のことであると言うこともできる。しかし、例えば「次に電話がなるまでの時間」といった、連続型確率変数の場合は、確率変数値での確率が全て $0$ となり、確率分布を確率質量関数で表すことができない。

「次に電話がなるまでの時間」は確率変数である。この確率変数 $X$ の分布が次のようになったとする。

$X$ の値が取る範囲 $I$	1時間以内	1–2時間後	2–3時間後	3–4時間後	4時間以上先
$P (X が I の範囲の値を取る)$	1/2	1/4	1/8	1/16	1/16

この場合の確率を全て表すには、全ての連続区間での確率を求めることになる。次の電話が $a$ - $b$ 時間後になる確率は次の式で表せる：

P(a<X\leq b)=\left({\frac {1}{2}}\right)^{a}-\left({\frac {1}{2}}\right)^{b}

累積分布関数 $F X$ を

F_{X}(t)=P(X\leq t)={\begin{cases}1-\left({\frac {1}{2}}\right)^{t},&t\geq 0\\0,&t<0\end{cases}}

で定めれば、

P(a<X\leq b)=F_{X}(b)-F_{X}(a)

のように、一変数関数で分布を表現できるので便利である。さらに、 $F X$ の導関数 $f X$ は確率密度関数と呼ばれ、確率は積分を用いて

P(a<X\leq b)=\int _{a}^{b}f_{X}(t)\,dt

と書ける。

通常、連続値をとる確率変数の分布は確率密度関数を用いて記述される。なぜなら、確率密度関数は初等関数で書けるが、累積分布関数は書けない場合が多いからである。

公理主義的な確率論においては、 $d$ 次元ベクトル値確率変数の確率分布とは、その確率変数の引き起こす像測度のことである。この測度は $d$ 次元ユークリッド空間上の確率測度であり、ユークリッド空間の部分集合に対して、確率変数の値がその集合に入る確率を与える関数となる。

単に確率分布というときは、 $d$ 次元ユークリッド空間などのよく使われる可測空間上で定義された確率測度のことをいう。ただの確率測度と違って空間に散らばっている様子がグラフなどの目に見える形で表現できるので「分布」と呼ばれる。

確率論で、確率変数の分布を考えるのは、その変数だけを確率論的な議論の対象にしたい場合である。例えば、確率変数がある値を取る確率や、期待値、分散といった量は変数の分布が分かれば計算できる量である。逆に分布を考えることによって隠れた変数 $ω$ ^{[注 1]} と確率変数との対応関係は失われてしまい、他の確率変数との関連性も不明になる。例えば、確率変数 $X$ と $Y$ の分布がそれぞれ $P X$ と $P Y$ のように与えられたとしても、2つの変数の関連性は分からないので、 $X + Y$ がある値を取る確率や、積 $XY$ の期待値、 $X + Y$ の分散といった量は計算できない。このような量を計算したいときは、 $X$ と $Y$ の同時確率分布 $P X,Y$ が必要となる。

よく使われる確率分布には、それぞれ名前がついており、性質がよく研究されている。このような分布をもつ確率変数に対して、研究の結果を利用することができる。例えば、確率変数の分布が平均 $0$ 、分散 $1$ の正規分布だった場合、その変数が $2$ 以上の値を取る確率は数表から 2.28% である。

定義

確率分布

1次元確率分布とは可測空間 $(\mathbb {R} ,{\mathcal {B}}(\mathbb {R} ))$ 上で定義された確率測度のことである。
同様に $d$ 次元確率分布とは $(\mathbb {R} ^{d},{\mathcal {B}}(\mathbb {R} ^{d}))$ 上で定義された確率測度のことである。

なお、 ${\mathcal {B}}(\mathbb {R} ^{d})$ は $\mathbb {R} ^{d}$ 上のボレル集合族（集合演算で閉じた部分集合族の一種）である。

確率変数の確率分布

実数値確率変数 $X$ の確率分布 $P_{X}:{\mathcal {B}}(\mathbb {R} )\to [0,1]$ を

P_{X}(A)=P(X\in A),\ \ \ A\in {\mathcal {B}}(\mathbb {R} )

で定義する。 $P X$ は確率測度（像測度）である。

同様に $\mathbb {R} ^{d}$ 値確率変数 $X$ の確率分布 $P_{X}:{\mathcal {B}}(\mathbb {R} ^{d})\to [0,1]$ は

P_{X}(A)=P(X\in A),\ \ \ A\in {\mathcal {B}}(\mathbb {R} ^{d})

で定義される確率測度である。

確率変数 $X$ の確率分布が $μ$ であるとき、 $X$ は $μ$ に従う確率変数であるといい、記号で $X ~ μ$ と書く^[2]。例えば、「 $X$ は平均 0、分散 1 の正規分布に従う」のように使い、これを

X\sim N(0,1)

のように書く。

累積分布関数

→詳細は「累積分布関数」を参照

実数値確率変数 $X$ の累積分布関数 (cumulative distribution function, CDF) あるいは一次元確率分布 $P X$ の累積分布関数とは

F_{X}(x)=P(X\leq x)=P_{X}((-\infty ,x])

で与えられる関数 $F X$ のことである。累積を省略して分布関数 (distribution function) とも言う。

累積分布関数は定義より右連続であるが、左連続とは限らない。累積分布関数が連続である（左連続でもある）確率分布を連続確率分布という。累積分布関数がとる値が高々可算個である確率分布を離散確率分布という。

確率密度関数

→詳細は「確率密度関数」を参照

確率分布 $P X$ が絶対連続ならば、ある可測関数 $f : X \to [0, \infty)$ が存在して、確率分布は

P(X\in A)=P_{X}(A)=\int _{A}f_{X}(x)\,dx

と表される（ラドン＝ニコディムの定理）。 $f X$ は $P X$ のラドン=ニコディム微分であり、零集合を除いて一意である。 $f X$ を連続型確率変数 $X$ の確率密度関数 (probability density function, PDF) という。

確率分布 $P X$ が絶対連続であるとは、任意の（ルベーグ測度に関しての）零集合 $N$ に対して、

P_{X}(N)=0

が成り立つことと定義される。これは測度の絶対連続性と同じである。このとき連続確率分布である。

とくに $A$ が区間の場合は

P(a<X<b)=P(a\leq X<b)=P(a<X\leq b)=P(a\leq X\leq b)=\int _{a}^{b}f_{X}(x)\,dx

となる。区間の端点は入れても入れなくても確率は同じである。

確率質量関数

→詳細は「確率質量関数」を参照

離散確率分布のときに確率密度関数に対応する関数として確率質量関数 (probability mass function) がある。確率変数 $X$ のとる値の集合が $S = {x 1, x 2, \dots}$ だとすると確率質量関数は

f_{X}(x_{i})=P(X=x_{i})=P_{X}(\{x_{i}\})

で定まる関数 $f X$ のことである。日本語では確率関数とも略されるが、英語の probability function は意味が曖昧な言葉とされる。

多次元確率分布

2つ以上の変数の確率分布を、多次元確率分布と呼ぶ。2変数の確率確率分布を、二次元確率分布と呼ぶ^[3]。

同時分布

→詳細は「同時分布」を参照

2つ以上の変数の組の確率分布のことを同時分布（どうじぶんぷ、joint distribution）、同時確率分布 (joint probability distribution) という^[3]。

周辺分布

→詳細は「周辺分布」を参照

同時分布から各変数の分布だけを取り出したものを周辺分布（しゅうへんぶんぷ、marginal distribution）、周辺確率分布と呼ぶ。日本工業規格では、「k次元確率変数の部分集合である k - 1変数の同時分布」と定義している^[4]。

確率分布の分類

まず確率変数が連続か離散かで分かれ、連続型確率変数の場合は累積分布関数が連続か絶対連続かで分類できる。

離散型確率変数の確率分布
- 離散確率分布
連続型確率変数の確率分布
- 連続確率分布
  - 絶対連続分布
  - 累積分布関数が連続だが絶対連続では無い確率分布
    - 特異分布
- 累積分布関数が連続では無い確率分布

代表的な確率分布

よく使われる確率分布は離散確率分布と絶対連続確率分布である。

離散確率分布

→詳細は「離散確率分布」を参照

サイコロを投げた時に出る目の数字など、確率変数が離散的な値をとる場合の確率分布は離散型確率分布である。パラメトリックな離散確率分布は母数（パラメータ）と台と確率質量関数 $f$ で特徴付けられる。台というのは確率変数のとる値の集合のことである。

連続確率分布（絶対連続分布）

→詳細は「連続確率分布」を参照

ある地点での通行人の体重など、確率変数が連続的な場合の確率分布のうち、累積分布関数が連続な確率分布が連続型確率分布である。パラメトリックな絶対連続分布は母数（パラメータ）と台と確率密度関数 $f$ で特徴付けられる。

累積分布関数が連続だが絶対連続では無い確率分布

特異分布
- カントール分布

累積分布関数が連続では無い確率分布

退化分布（連続型確率変数の場合）

確率分布の利用法

確率変数の確率分布が与えられると、その変数に関する確率・期待値・分散などが以下のように計算できる。

$X$ は連続型確率変数で確率密度関数は $f X$ であり、累積分布関数は $F X$ とする。 $Y$ は離散型確率変数で台は $S = {y 1, y 2, \dots}$ で確率質量関数は $f Y$ であるとする。

確率の計算

X が a 以上 b 以下の値を取る確率
- $P(a\leq X\leq b)=\int _{a}^{b}f_{X}(x)\,dx$
- $P(a\leq X\leq b)=F_{X}(b)-F_{X}(a)$
Y の値が集合 $T\subset S$ に属する確率
- $P(Y\in T)=\sum _{y_{k}\in T}f_{Y}(y_{k})$

期待値の計算

関数 $g$ が与えられたときに $g (X)$ と $g (Y)$ の期待値は

E[g(X)]=\int _{-\infty }^{+\infty }g(x)f_{X}(x)\,dx

E[g(Y)]=\sum _{y_{k}\in S}g(y_{k})f_{Y}(y_{k})

特に

E[X]=\int _{-\infty }^{+\infty }xf_{X}(x)\,dx

E[Y]=\sum _{y_{k}\in S}y_{k}f_{Y}(y_{k})

分散の計算

$X$ と $Y$ の分散は

V[X]=\int _{-\infty }^{+\infty }(x-E[X])^{2}f_{X}(x)\,dx=\int _{-\infty }^{+\infty }x^{2}f_{X}(x)\,dx-E[X]^{2}

V[Y]=\sum _{y_{k}\in S}(y_{k}-E[Y])^{2}f_{Y}(y_{k})=\sum _{y_{k}\in S}{y_{k}}^{2}f_{Y}(y_{k})-E[Y]^{2}

変数変換

確率変数の変数変換による新しい変数の密度関数は、元の変数の密度関数で書くことができる。この公式は重積分における変数変換とほぼ同様である。

確率密度関数の変数変換公式

$\mathbb {R} ^{d}$ から $\mathbb {R} ^{d}$ への変換 $T$ により、 $\mathbb {R} ^{d}$ 値確率変数 $X$ と $Y$ が

X=T(Y)

と書けているとすると、 $Y$ の確率密度関数は $X$ の確率密度関数を用いて

f_{Y}(y_{1},\cdots ,y_{d})=|(\det J_{T})(y_{1},\cdots ,y_{d})|f_{X}(T(y_{1},\cdots ,y_{d}))

となる。ただし $J$ はヤコビアンとする。

例えばボックス-ミューラー変換は $(0, 1] 2$ 上の一様分布に従う確率変数 $X = (X 1, X 2)$ を

Y_{1}={\sqrt {-2\ln X_{1}}}\sin(2\pi X_{2})

Y_{2}={\sqrt {-2\ln X_{1}}}\cos(2\pi X_{2})

によって変換する。 $X$ の密度関数は

f_{X}(x_{1},x_{2})={\begin{cases}1,&(x_{1},x_{2})\in (0,1]^{2}\\0,&(x_{1},x_{2})\notin (0,1]^{2}\end{cases}}

であり、上の公式を当てはめると $Y$ の確率密度関数は

f_{Y}(y_{1},y_{2})={\frac {1}{2\pi }}\exp \left(-{\frac {{y_{1}}^{2}+{y_{2}}^{2}}{2}}\right)

となり、 $Y$ が二次元の標準正規分布に従うことが分かる。このように単純な分布を持つ変数を変換して、複雑な分布を作る操作は計算機による乱数の生成で重要となる。

確率変数の和の確率分布

2つの確率変数 $X$ と $Y$ の和 $X + Y$ の確率分布や差 $X - Y$ の確率分布は変数変換公式により計算できる。特に $X$ と $Y$ が独立で、確率密度関数がそれぞれ $f X$ と $f Y$ だったとすると、和と差の確率密度関数は

f_{X+Y}(t)=\int _{-\infty }^{+\infty }f_{X}(t-y)f_{Y}(y)\,dy

f_{X-Y}(t)=\int _{-\infty }^{+\infty }f_{X}(t+y)f_{Y}(y)\,dy

となる。

特に和の確率密度関数は2つの分布の確率密度関数の畳み込みである。また、特性関数は確率密度関数のフーリエ変換であり、畳み込みのフーリエ変換は周波数領域における積であることから、和の特性関数は2つの分布の特性関数の積となる。

なお、確率変数の和の確率分布が元の分布族に従う場合、その分布は再生性があるという。

確率モデル

パーコレーション: パーコレーションを参照。浸透 (percolation) 確率に基づくモデル。具体的には森林火災の広がり、伝染病の伝搬、金属と絶縁体の混合物、強磁性元素と非磁性元素の混晶系、分子間の重合による巨大高分子のゲル化などがある^[5]。
分岐過程: 分岐過程 (branching process) は、生命の数変化モデル^[6]。
ランダムウォーク: ランダムウォークを参照。
無限粒子系: 無限粒子の遷移率の連続時間のモデル^[7]。
凝集: 拡散律速凝集 (DLA : diffusion limited aggregation) と呼ぶ、ヴィッテンとサンダーによる粒子のクラスターが凝集によって成長するモデル。
砂山崩し: バックたちによる砂山の斜面の崩壊を表すモデル。
渋滞: 交通流の渋滞モデル。
生命: 生命の時間的空間的モデル。セルオートマトンとも呼ぶ。生命競技 (life game) は2次元セルオートマトンの一種である。
排他過程: 排他過程 (exclusion process) は、連続時間で発展する確率モデル。上記生命モデルが離散時間の決定論的モデルであるのに対応している^[8]。

脚注

[脚注の使い方]

出典

^ JIS Z 8101-1 : 1999, 1.3 確率分布.
^ Klenke, Achim (2014). Probability Theory: A Comprehensive Course (Second ed.). Springer. p. 41. ISBN 978-1-4471-5360-3. "We write $X\sim \mu$ if $\mu =\mathbf {P} _{X}$ and say that $X$ has distribution $\mu$ ."
^ ^a ^b JIS Z 8101-1 : 1999, 1.4 2次元分布関数.
^ JIS Z 8101-1 : 1999, 1.6 周辺分布.
^ 今野 1995, 第1章パーコレーションのモデル.
^ 今野 1995, 第2章分岐過程.
^ 今野 1995, 第4章無限粒子系.
^ 今野 1995, 第5章その他のモデル.

注釈

^ 標本点あるいは結果 (確率論)のこと

参考文献

西岡康夫『数学チュートリアルやさしく語る確率統計』オーム社、2013年。ISBN 9784274214073。
伏見康治『確率論及統計論』河出書房、1942年。ISBN 9784874720127。
JIS Z 8101-1:1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語, 日本規格協会, (1999)
日本数学会『数学辞典』岩波書店、2007年。ISBN 9784000803090。
今野紀雄『確率モデルって何だろう―複雑系科学への挑戦』ダイヤモンド社、1995年。ISBN 978-4478830086。

確率分布

目次

概要

定義

確率分布

確率変数の確率分布

累積分布関数

確率密度関数

確率質量関数

多次元確率分布

同時分布

周辺分布

確率分布の分類

代表的な確率分布

離散確率分布

連続確率分布（絶対連続分布）

累積分布関数が連続だが絶対連続では無い確率分布

累積分布関数が連続では無い確率分布

確率分布の利用法

確率の計算

期待値の計算

分散の計算

変数変換

確率密度関数の変数変換公式

確率変数の和の確率分布

確率モデル

脚注

出典

注釈

参考文献

関連項目