二項分布B(n,p)の確率を計算する際、nが大きくなるにつれて直接計算が煩雑になってきます。
そのような場合に非常に有効なのが、正規分布近似(Normal Approximation)という手法です。
この記事では、二項分布の正規分布近似とは何か・近似が有効な条件・連続性の補正・中心極限定理との関係・具体的な計算方法まで、詳しく解説していきます。
二項分布の正規分布近似とは?まず押さえる結論
それではまず、二項分布の正規分布近似の基本概念と、押さえるべき結論から解説していきます。
二項分布の正規分布近似とは、二項分布B(n,p)をN(np, np(1-p))の正規分布で近似する手法です。
平均μ=np・分散σ²=np(1-p)の正規分布を使って二項確率を近似計算することで、標準正規分布表を用いた計算が可能になります。
正規近似の核心:B(n,p)をN(np, np(1-p))で近似し、標準化(Z=(X-np)/√{np(1-p)})することで標準正規分布N(0,1)の問題に変換できます。連続性の補正(±0.5)を加えることで近似精度がさらに向上します。
この近似が有効な理由は、中心極限定理による数学的な保証があるためです。
n回の独立なベルヌーイ試行の成功数は、その和として表せ、中心極限定理によりnが大きいほど正規分布に近づくことが保証されています。
正規分布近似が有効な条件
続いては、二項分布の正規分布近似が有効に使える条件について確認していきます。
近似条件の目安
正規分布近似が有効とされる条件の目安は、np≧5かつn(1-p)≧5(一部の教科書では np≧10かつn(1-p)≧10)です。
この条件は、分布の両端(X=0付近・X=n付近)に十分な確率が分配されており、分布が釣鐘型に近い形状になっていることを保証します。
| 条件 | 近似の妥当性 | 推奨される代替手法 |
|---|---|---|
| np≧5かつn(1-p)≧5を満たす | 正規近似が有効 | - |
| nが大きいがpが極端に小さい(p≦0.05) | 正規近似は不向き | ポアソン近似 |
| nが小さい(n≦20) | 正規近似は不向き | 二項分布の直接計算 |
p=0.5のときに近似精度が最も高い理由
p=0.5のとき、二項分布は左右対称の形状になり、正規分布の対称性と最もよく一致します。
pが0または1に近いほど二項分布の歪みが大きくなり、正規近似の精度が低下します。
pが0.5から離れるほど、より大きなnが必要になることを意識して近似条件を判断しましょう。
連続性の補正と計算方法
続いては、正規近似における重要なテクニックである連続性の補正と、具体的な計算方法を確認していきます。
連続性の補正が必要な理由
二項分布は整数値のみをとる離散分布であるのに対し、正規分布は連続分布です。
この「離散から連続への変換」において生じるズレを補正するために、±0.5の連続性の補正(Continuity Correction)を適用します。
連続性の補正の適用ルール:
P(X=k) ≈ P(k-0.5 ≦ Z ≦ k+0.5) ← 正規近似値
P(X≦k) ≈ P(Z ≦ k+0.5) ← 連続性補正あり
P(X≧k) ≈ P(Z ≧ k-0.5) ← 連続性補正あり
P(a≦X≦b) ≈ P(a-0.5 ≦ Z ≦ b+0.5) ← 連続性補正あり
正規近似の計算手順
例題:B(100, 0.4)に従うXについてP(X≧45)を正規近似で求めよ。
①μ = np = 100 × 0.4 = 40
②σ² = np(1-p) = 100 × 0.4 × 0.6 = 24、σ = √24 = 2√6 ≈ 4.899
③連続性の補正:P(X≧45) ≈ P(Z ≧ (44.5-40)/4.899) = P(Z ≧ 4.5/4.899) ≈ P(Z ≧ 0.918)
④標準正規分布表より:P(Z ≧ 0.918) ≈ 1-0.8207 ≈ 0.179
【答え】約17.9%
正規近似と直接計算の精度比較
上記の例題でnp=40・n(1-p)=60であり、近似条件(np≧5・n(1-p)≧5)を十分に満たしているため、正規近似の精度は高いと期待できます。
Excelやプログラミング言語(Python・R)で直接計算した値と正規近似値を比較することで、近似精度を実際に確認する習慣をつけることが、理解を深めるうえで有効です。
中心極限定理と正規近似の理論的背景
続いては、正規分布近似の理論的根拠となる中心極限定理について確認していきます。
中心極限定理の内容
中心極限定理は、「独立同分布の確率変数の和(または平均)は、nが大きくなるにつれて正規分布に近づく」という定理です。
この定理は、もとの分布の形状に関わらず成立するという普遍性が特徴です。
二項分布はベルヌーイ試行の和であるため、中心極限定理が直接適用でき、n→∞で正規分布に収束します。
近似精度とn・pの関係
正規近似の精度はnの増加とともに改善しますが、同じnでもpが0.5に近いほど近似精度が高く、pが極端な値(0に近いまたは1に近い)ほど正規分布の対称性が崩れ近似精度が低下します。
近似の誤差の大きさを定量的に評価する定理として「Berry-Esséen定理」があり、誤差がO(1/√n)のオーダーであることが示されています。
まとめ
この記事では、二項分布の正規分布近似の概念・近似が有効な条件・連続性の補正・中心極限定理との関係・具体的な計算方法について詳しく解説しました。
正規近似の核心は、B(n,p)をN(np, np(1-p))で近似し、標準化して標準正規分布表を活用するというプロセスにあります。
連続性の補正(±0.5)を適切に適用することで近似精度が向上し、np≧5かつn(1-p)≧5という条件が満たされるとき、正規近似は非常に有効なツールとなります。
ぜひこの記事で紹介した正規近似の条件と計算手順を参考に、二項分布の問題をスムーズに解けるよう練習していただければ幸いです。