二項分布の分散はなぜnp(1-p)？証明と導出過程を解説

二項分布B(n,p)の分散がV(X)=np(1-p)となることは、多くの教科書で公式として紹介されています。

しかし、「なぜこの式になるのか」という証明や導出過程まで理解している方は意外と少ないのではないでしょうか。

この記事では、二項分布の分散V(X)=np(1-p)の証明と導出過程・期待値の証明・標準偏差の求め方・計算式の意味まで、数学的にわかりやすく解説していきます。

二項分布の分散np(1-p)の証明とは？まず押さえる結論

それではまず、二項分布の分散の証明の概要と、押さえるべき結論から解説していきます。

二項分布の分散V(X)=np(1-p)の証明において、最もエレガントな方法は「ベルヌーイ試行への分解＋分散の加法性（独立性）」を活用する方法です。

証明の核心アイデア：二項分布に従う確率変数XはX=X₁+X₂+…+Xₙ（各Xᵢは独立なベルヌーイ試行）と分解できます。各Xᵢは独立なので分散の加法性が成立し、V(X)=V(X₁)+V(X₂)+…+V(Xₙ)=np(1-p)が導かれます。

この証明アプローチを理解することで、分散の公式が「暗記すべき式」ではなく、「論理的に必然的に導かれる結果」として理解できるようになります。

ベルヌーイ分布の期待値と分散の導出

続いては、二項分布の証明の出発点となるベルヌーイ分布の期待値と分散の導出を確認していきます。

ベルヌーイ分布の定義

ベルヌーイ分布は、結果が「成功（X=1、確率p）」または「失敗（X=0、確率1-p）」の2値の確率分布です。

確率質量関数は P(X=1)=p, P(X=0)=1-p と表され、これは二項分布B(1, p)の特別な場合に相当します。

ベルヌーイ分布の期待値の導出

ベルヌーイ分布の期待値の計算：

E(X) = 1×P(X=1) + 0×P(X=0)

E(X) = 1×p + 0×(1-p)

E(X) = p

これは直感的にも明確で、成功確率pが期待値となることを示しています。

ベルヌーイ分布の分散の導出

ベルヌーイ分布の分散の計算：

V(X) = E(X²) – {E(X)}²

E(X²) = 1²×p + 0²×(1-p) = p

{E(X)}² = p²

V(X) = p – p² = p(1-p)

したがって、ベルヌーイ分布の分散はV(X)=p(1-p)となります。

二項分布の分散np(1-p)の厳密な証明

続いては、ベルヌーイ分布の結果を使って、二項分布の分散を厳密に証明していきます。

独立なベルヌーイ試行への分解

二項分布B(n,p)に従う確率変数Xは、n個の独立なベルヌーイ確率変数の和として表すことができます。

X = X₁ + X₂ + … + Xₙ と定義します。ただし各Xᵢは独立にベルヌーイ分布（成功確率p）に従います。

i回目の試行で成功すればXᵢ=1、失敗すればXᵢ=0となるので、XはXᵢの合計であり、X＝0, 1, 2, …, nの値をとります。

分散の加法性の適用

分散の加法性（X₁, X₂, …, Xₙが独立のとき）：

V(X₁+X₂+…+Xₙ) = V(X₁) + V(X₂) + … + V(Xₙ)

各Xᵢはベルヌーイ分布に従うので V(Xᵢ) = p(1-p)

したがって：

V(X) = V(X₁) + V(X₂) + … + V(Xₙ)

V(X) = p(1-p) + p(1-p) + … + p(1-p) （n項）

V(X) = np(1-p)　　□（証明終わり）

この証明は非常にシンプルかつ明快であり、独立性と線形性という確率論の基本原理のみを使っています。

期待値E(X)=npの証明と導出

続いては、期待値E(X)=npの証明についても確認していきます。

期待値の線形性を使った証明

分散の証明と同様に、期待値の証明も線形性を活用します。

期待値E(X)=npの証明：

X = X₁ + X₂ + … + Xₙ（各Xᵢはベルヌーイ分布）

期待値の線形性より（独立性は不要）：

E(X) = E(X₁) + E(X₂) + … + E(Xₙ)

E(Xᵢ) = p より：

E(X) = p + p + … + p = np　　□

期待値の線形性は独立性を必要としないため、分散の証明より一般的な状況で成立します。

二項係数の恒等式を使った直接計算

より発展的な証明として、二項係数の恒等式を使って期待値を直接計算する方法もあります。

E(X) = Σₖ₌₀ⁿ k × ₙCₖ × pᵏ × (1-p)ⁿ⁻ᵏ という定義式から出発し、k×ₙCₖ = n×ₙ₋₁Cₖ₋₁ という二項係数の恒等式を使って式を変形すると、最終的にE(X)=npが導かれます。

この方法は計算量が多くなりますが、定義に忠実な厳密な証明として理解しておく価値があります。

標準偏差の求め方と分散との関係

続いては、二項分布の標準偏差の求め方と、分散との関係について確認していきます。

標準偏差の計算式

二項分布の標準偏差σ(X)は、分散の正の平方根として定義されます。

標準偏差の計算例：n=50, p=0.4の二項分布

期待値：E(X) = np = 50 × 0.4 = 20

分散：V(X) = np(1-p) = 50 × 0.4 × 0.6 = 12

標準偏差：σ(X) = √12 = 2√3 ≈ 3.464

解釈：50回試行で平均20回成功し、ばらつきは約3.46回程度

分散・標準偏差の値が持つ意味

分散V(X)=np(1-p)において、p=0.5のとき分散はnp/4で最大となります。

p=0または1（確実な結果）では分散は0となり、ばらつきがないことを示します。

標準偏差は分散と同じ単位（成功回数）で表され、「平均からどの程度のばらつきがあるか」の直感的な指標となります。

まとめ

この記事では、二項分布の分散V(X)=np(1-p)の証明・ベルヌーイ分布の期待値と分散の導出・独立性と分散の加法性を使った証明・期待値E(X)=npの証明・標準偏差の計算方法について詳しく解説しました。

証明の核心は「ベルヌーイ試行への分解＋分散の加法性（独立性）」という、シンプルながら強力なアプローチにあります。

この証明を理解することで、np(1-p)という公式が丸暗記ではなく、論理的に必然的に導かれる結果として深く理解できるようになるでしょう。

ぜひこの記事で紹介した証明の流れを追いながら、二項分布の分散公式への理解を深めていただければ幸いです。