確率論・統計学において、二項分布とポアソン分布はどちらも離散確率分布として重要な役割を果たします。
「二項分布とポアソン分布はどのような関係にあるのか」「どのような条件のときにポアソン分布で近似できるのか」という疑問を持つ方も多いのではないでしょうか。
この記事では、二項分布とポアソン分布の関係・近似条件・確率分布の変換・n大・p小という極限定理の考え方まで、わかりやすく解説していきます。
二項分布とポアソン分布の関係とは?基本的な結論
それではまず、二項分布とポアソン分布の関係の基本と、押さえるべき結論から解説していきます。
二項分布とポアソン分布の関係の核心は、「nが非常に大きく、pが非常に小さいとき、B(n,p)はλ=npのポアソン分布Po(λ)に近似できる」という極限定理にあります。
二項分布B(n,p)のポアソン近似条件:n→∞、p→0、np=λ(一定)という極限において、B(n,p)の確率質量関数はPoisson(λ)の確率質量関数に収束します。実務的な目安として「n≧20かつp≦0.05」または「n≧100かつnp≦10」のときにポアソン近似が有効とされます。
この関係は、「ポアソン分布は二項分布の極限(n大・p小)として導出できる」という数学的な関係を意味しており、ポアソン分布が「まれな事象の発生回数」をモデル化するのに適している理由を説明しています。
ポアソン分布とは何か?基本概念の確認
続いては、ポアソン分布の基本概念と、二項分布との比較を確認していきます。
ポアソン分布の定義と特徴
ポアソン分布Po(λ)は、単位時間または単位区間内に平均λ回発生するまれな事象が、k回発生する確率を表す確率分布です。
確率質量関数は P(X=k) = (λᵏ × e⁻λ) / k! で表されます。
ポアソン分布の特徴的な性質は、期待値と分散がともにλで等しいという点です(E(X)=V(X)=λ)。
二項分布とポアソン分布の比較
| 比較項目 | 二項分布B(n,p) | ポアソン分布Po(λ) |
|---|---|---|
| パラメータ | n(試行回数)、p(成功確率) | λ(平均発生回数) |
| 適用場面 | n回中の成功回数 | まれな事象の発生回数 |
| 期待値 | np | λ |
| 分散 | np(1-p)≈np(p小のとき) | λ |
| 試行回数 | nが有限・固定 | nが無限大または不定 |
p≪1のとき、np(1-p)≈np=λとなるため、二項分布の期待値と分散がほぼ一致するという性質が、ポアソン近似が有効な理由のひとつです。
ポアソン分布が適用される実例
ポアソン分布は、まれな事象の発生回数をモデル化する場合に特に適しています。
1時間に電話コールセンターにかかってくる電話の件数・1日に交差点で発生する交通事故件数・放射線の崩壊回数・Webサイトへの1分間のアクセス件数などが、ポアソン分布でモデル化される典型的な例です。
二項分布からポアソン分布が導かれる数学的な仕組み
続いては、二項分布からポアソン分布が極限として導かれる数学的な仕組みを確認していきます。
ポアソン近似の導出の概要
n→∞、p→0、np=λ(一定)という条件のもと、二項分布の確率質量関数がポアソン分布に収束することを示します。
ポアソン近似の導出(概要):
P(X=k) = ₙCₖ × pᵏ × (1-p)ⁿ⁻ᵏ において p=λ/n を代入する
n→∞の極限を取ると:
ₙCₖ/nᵏ → 1/k!、(1-λ/n)ⁿ → e⁻λ、(1-λ/n)⁻ᵏ → 1
したがって P(X=k) → λᵏ × e⁻λ / k!(ポアソン分布の確率質量関数)
この導出は、e = lim(1+1/n)ⁿ というネイピア数の定義と、二項係数の漸近展開を組み合わせたものです。
ポアソン近似の精度
ポアソン近似の精度は、nが大きく・pが小さいほど高くなります。
具体的には、n=100・p=0.02(λ=2)の場合、二項分布の確率とポアソン近似値はほぼ完全に一致します。
一方、n=10・p=0.1(λ=1)の場合は、近似誤差がやや大きくなるため、この場合は二項分布の正確な計算を使う方が適切です。
ポアソン近似を使うべき場面と計算の簡略化
続いては、ポアソン近似を実際に使うべき場面と、計算を簡略化するメリットについて確認していきます。
ポアソン近似が有効な実用場面
ポアソン近似が特に有効なのは、二項係数ₙCₖの計算が困難なほどnが大きい場合です。
例えばn=1000・p=0.001のとき、₁₀₀₀C₅の計算は非常に煩雑ですが、ポアソン近似を使えば λ=np=1 として簡単に計算できます。
ポアソン近似の計算例:
n=500, p=0.004(λ=np=2)のとき、X=3である確率:
正確な二項分布:P(X=3) = ₅₀₀C₃ × 0.004³ × 0.996⁴⁹⁷(計算が煩雑)
ポアソン近似:P(X=3) ≈ (2³ × e⁻²) / 3! = 8 × e⁻² / 6 ≈ 8 × 0.1353 / 6 ≈ 0.1804
ポアソン分布の再生性との関係
ポアソン分布には重要な性質として再生性があります。
独立なPo(λ₁)とPo(λ₂)の和はPo(λ₁+λ₂)に従います。
この性質も、二項分布の独立な試行を合算する状況での応用に活かされています。
まとめ
この記事では、二項分布とポアソン分布の関係・ポアソン近似条件(n大・p小・np=λ一定)・数学的な導出の概要・実用的な近似の使い方について詳しく解説しました。
二項分布とポアソン分布の本質的な関係は、「B(n,p)はn→∞・p→0・np=λのとき、Po(λ)に収束する」という極限定理にあります。
ポアソン近似はnが大きくpが小さい場面での計算を大幅に簡略化でき、実用上非常に有用なツールです。
ぜひこの記事で紹介した近似条件と計算方法を参考に、二項分布とポアソン分布の使い分けを身につけていただければ幸いです。