二項分布に従うとは？確率変数の意味を解説

統計学や確率論を学ぶなかで「XはB(n,p)の二項分布に従う」という表現を目にすることがよくあります。

しかし、「二項分布に従う」とはどういう意味なのか・確率変数の表記方法・記号・パラメータn・pの意味を正確に理解している方は意外と少ないのではないでしょうか。

この記事では、「二項分布に従う」という表現の意味・確率変数の概念・B(n,p)という表記方法・パラメータの意味・統計学における位置づけまで、丁寧に解説していきます。

「二項分布に従う」とはどういう意味か？基本的な結論

それではまず、「二項分布に従う」という表現の意味と、基本的な結論から解説していきます。

「確率変数XがB(n,p)の二項分布に従う」とは、「Xのとりうる各値k（k=0,1,2,…,n）に対する確率が、二項分布の確率質量関数P(X=k) = ₙCₖ × pᵏ × (1-p)ⁿ⁻ᵏで与えられる」ことを意味します。

「XはB(n,p)に従う」という表現は、「X～B(n,p)」または「X∈B(n,p)」とも記述されます。この表現は「Xの確率分布がB(n,p)で完全に記述される」ことを意味し、n（試行回数）とp（成功確率）というたった2つのパラメータがXの確率的な振る舞いをすべて決定することを示しています。

「従う（follows）」という動詞は、確率変数の確率分布を指定する際の標準的な表現であり、二項分布に限らず「正規分布に従う」「ポアソン分布に従う」など、あらゆる確率分布について使われます。

確率変数とは何か？二項分布との関係

続いては、「二項分布に従う」を理解するうえで欠かせない「確率変数」の概念について確認していきます。

確率変数の定義と直感的な意味

確率変数（Random Variable）とは、試行の結果によって値が確率的に決まる変数のことです。

コインを10回投げる試行において「表が出た回数」は、実際に試行するまで何回になるかわからない確率変数です。

確率変数は通常、大文字のX・Y・Zなどで表記し、その実現値（実際に観測された値）を小文字のx・y・zなどで区別します。

「XはB(n,p)に従う」と言うとき、このXは「まだ実現していない、確率的に変動する変数」を指しています。

確率変数の分布と「従う」の意味

確率変数Xの「分布」とは、Xが各値をとる確率を完全に記述したものです。

「XがB(n,p)に従う」とは、Xの分布が二項分布B(n,p)に一致することを意味します。

つまり、二項分布の確率質量関数P(X=k) = ₙCₖ × pᵏ × (1-p)ⁿ⁻ᵏを使って、Xに関するあらゆる確率を計算できることを保証します。

確率変数の独立性と二項分布の関係

二項分布における重要な前提のひとつが、各試行の独立性です。

「各試行が独立」とは、1回の試行の結果が次の試行の結果に影響しないことを意味します。

コインを10回投げるとき、1回目の結果が2回目に影響しないという「独立性」が成り立っているため、二項分布が適用できます。

B(n,p)という表記方法とパラメータの意味

続いては、二項分布の表記B(n,p)のnとpというパラメータの意味と役割を確認していきます。

パラメータnの意味と役割

パラメータn（試行回数）は、ベルヌーイ試行を繰り返す回数を表します。

nはXの最大値を決定するパラメータでもあり、XはX=0, 1, 2, …, nの範囲の値をとります。

nが大きくなるほど、二項分布のグラフは正規分布に近い形状になっていきます。

nの値	Xのとりうる範囲	分布の特徴
n=1	0, 1（ベルヌーイ分布）	2値の分布
n=10	0, 1, …, 10	比較的非対称（p≠0.5のとき）
n=100	0, 1, …, 100	正規分布に近い形状

パラメータpの意味と役割

パラメータp（成功確率）は、各試行で「成功」が起きる確率を表します。

pは0以上1以下の実数（0≦p≦1）でなければなりません。

p=0.5のとき二項分布は左右対称となり、pが0に近いほど分布は右に偏り（低い成功率）、pが1に近いほど左に偏ります。

失敗確率は1-pであり、「失敗の回数」の分布はB(n, 1-p)に従います。

nとpが分かれば分布が完全に決まる

二項分布B(n,p)の美しい点は、たった2つのパラメータ（n,p）で分布が完全に記述されるということです。

n=20, p=0.3と決まれば、期待値=6、分散=4.2、そして任意のkに対するP(X=k)がすべて計算できます。

このパラメータによる分布の完全な記述が、二項分布を実用的な確率モデルとして非常に使いやすくしています。

「XはB(n,p)に従う」の統計学的な意味と応用

続いては、「XはB(n,p)に従う」という表現が統計学においてどのような意味を持ち、どう応用されるかを確認していきます。

確率モデルとしての二項分布

「XがB(n,p)に従う」という仮定は、確率モデルを設定することに相当します。

現実のデータが二項分布から生成されていると仮定することで、データの確率的な振る舞いを数学的に扱えるようになります。

例えば、コインの表裏・製品の良否・患者の治癒・選挙での投票などを、二項分布でモデル化することが統計的分析の出発点となります。

パラメータの推定（統計的推測）

実際のデータから、パラメータpを推定することが統計的推測の重要な課題のひとつです。

例えば、100回の試行で37回成功したとき、pの最尤推定量は p̂=37/100=0.37 となります。

このような推定を通じて、「コインが歪んでいるかどうか」「新薬の治癒率がどのくらいか」といった実際の問いに数学的に答えることができます。

仮説検定での活用

「XがB(n,p₀)に従う」という帰無仮説を立て、観測されたデータとの乖離を検定する二項検定（Binomial Test）も重要な統計手法です。

「このコインは公正か（p=0.5かどうか）」「新薬の治癒率は従来薬と有意に異なるか」といった問いに、二項分布を基に答えます。

まとめ

この記事では、「二項分布に従う」という表現の意味・確率変数の概念・B(n,p)という表記とパラメータn・pの意味・統計学的な応用について詳しく解説しました。

「XはB(n,p)に従う」とは、「Xの確率分布が二項分布の確率質量関数で完全に記述される」ことを意味し、n（試行回数）とp（成功確率）の2つのパラメータがXの確率的な振る舞いをすべて決定します。

この表現と概念を正確に理解することで、統計学・確率論の問題文を正しく読み解き、適切な解法を選択できるようになるでしょう。

ぜひこの記事で解説した確率変数の意味とB(n,p)の概念を、今後の統計学の学習に役立てていただければ幸いです。