統計学・確率論を学ぶうえで、最初に出会う重要な確率分布のひとつが二項分布(Binomial Distribution)です。
高校数学の数学Bから大学の統計学まで幅広く登場し、コインの裏表・製品の不良品検査・医薬品の臨床試験など、私たちの身近な現象を確率でモデル化する際に非常に役立つ概念です。
この記事では、二項分布の定義・意味・基本概念を、確率分布の基礎知識とともにわかりやすく解説していきます。
二項分布とは何か?基本的な定義と結論
それではまず、二項分布の基本的な定義と、押さえるべき結論から解説していきます。
二項分布とは、「成功か失敗か」のような2値の結果(ベルヌーイ試行)をn回繰り返したとき、成功回数Xが従う確率分布のことです。
例えば、コインを10回投げたときに表が出る回数・100個の製品の中に不良品が何個含まれるかといった状況が、二項分布でモデル化できます。
二項分布が成立するための4つの条件:①試行の回数nが固定されている、②各試行の結果は「成功」か「失敗」の2値のみ、③各試行における成功確率pが一定、④各試行は互いに独立している。この4条件がすべて満たされるとき、確率変数XはB(n,p)の二項分布に従います。
二項分布はBinomial Distributionの略で、「B(n, p)」と表記されます。
nは試行回数・pは各試行での成功確率を表すパラメータです。
これらのパラメータが決まれば、成功回数Xがk回になる確率を計算できるようになります。
二項分布の確率分布としての意味と直感的な理解
続いては、二項分布が確率分布としてどのような意味を持つのか、直感的な理解とともに確認していきます。
ベルヌーイ試行との関係
二項分布を理解するうえで欠かせないのがベルヌーイ試行の概念です。
ベルヌーイ試行とは、結果が「成功(確率p)」または「失敗(確率1-p)」の2種類しかない単一の試行のことを指します。
コインを1回投げる・製品を1個検査する・患者に薬を1回投与するといった場面が、ベルヌーイ試行に対応します。
二項分布は、このベルヌーイ試行をn回独立に繰り返したときの成功回数の分布であり、「n個のベルヌーイ試行の成功数の分布」として定義されます。
二項分布の確率の意味を具体例で理解する
二項分布の直感的な理解のために、具体例で考えてみましょう。
具体例:コインを5回投げて表が3回出る確率
n=5(試行回数)、p=0.5(表の確率)、k=3(成功回数)の場合:
「HHHTT」「HHTHT」「HHTTH」…のように、5回中3回表が出るパターンは₅C₃=10通り
各パターンの確率は (0.5)³ × (0.5)² = 0.5⁵ = 1/32
したがって、P(X=3) = 10 × (1/32) = 10/32 ≈ 0.3125
このように、「パターン数(組み合わせ)× 各パターンの確率」という形で二項分布の確率が計算されます。
確率変数と二項分布の関係
二項分布において、成功回数Xは確率変数(Random Variable)です。
確率変数とは、試行の結果によって値が変わる変数のことで、二項分布に従う確率変数XはX=0, 1, 2, …, nのいずれかの値をとります。
XがB(n,p)に従うとき、「XはB(n,p)に従う」または「X~B(n,p)」と表記することが一般的です。
高校数学・数学Bにおける二項分布の位置づけ
続いては、高校数学の数学Bにおける二項分布の学習内容と位置づけを確認していきます。
数学Bで学ぶ二項分布の基本
高校数学の数学Bでは、確率分布の単元の中で二項分布が登場します。
学習の流れとしては、確率変数→期待値・分散→確率分布→二項分布という順序で学ぶことが一般的です。
数学Bの範囲では、二項分布の確率計算・期待値・分散の公式を理解し、具体的な問題に適用できることが求められます。
共通テスト・センター試験でも頻出の単元であり、計算力だけでなく、どのような状況に二項分布が適用できるかを判断する力も問われます。
二項分布の確率の公式(確率質量関数)
二項分布B(n,p)に従う確率変数XがX=kとなる確率は、確率質量関数(PMF:Probability Mass Function)として以下の形で表されます。
二項分布の確率質量関数:
P(X=k) = ₙCₖ × pᵏ × (1-p)ⁿ⁻ᵏ
k = 0, 1, 2, …, n
ₙCₖ :n個からk個を選ぶ組み合わせ(二項係数)
pᵏ :k回成功する確率
(1-p)ⁿ⁻ᵏ :残りのn-k回失敗する確率
この公式の各要素の意味を理解することが、二項分布をマスターする第一歩となります。
二項分布のグラフの形状と直感的な解釈
二項分布をグラフで表すと、pの値に応じて分布の形状が変化することがわかります。
p=0.5のとき、分布は左右対称の釣鐘型になります。
pが0に近いほど分布は右に偏り(右歪み)、pが1に近いほど分布は左に偏ります(左歪み)。
また、nが大きくなるにつれて、二項分布は正規分布に近い形状になっていくという重要な性質があります(これが正規分布近似の根拠となります)。
二項分布が適用できる現実の場面
続いては、二項分布が実際にどのような場面で活用されるかを確認していきます。
品質管理・製造業での活用
製造業の品質管理において、不良品の発生率を二項分布でモデル化することがよく行われます。
例えば、不良品率が1%の工場で100個の製品を検査したとき、不良品が何個含まれるかという問題はB(100, 0.01)の二項分布で分析できます。
このモデルを使うことで、抜き取り検査の設計・品質基準の設定・リスク評価などが数学的に行えるようになります。
医薬品・臨床試験での活用
新薬の臨床試験において、治療効果の有無(成功・失敗)を二項分布でモデル化することが一般的です。
例えば、治癒率が70%とされる薬を20人に投与したとき、15人以上が治癒する確率を計算する問題は、B(20, 0.7)の二項分布で解くことができます。
臨床試験のサンプルサイズ計算・検出力分析にも、二項分布が理論的な基盤として使われています。
情報科学・機械学習での活用
情報科学や機械学習の分野でも、二項分布はベイズ推定や分類問題の評価に活用されています。
スパムメール判定・画像分類・自然言語処理における精度評価など、「正解・不正解」の2値の結果を扱う場面で二項分布の考え方が基礎となっています。
また、A/Bテストの分析においても、二項分布に基づく仮説検定が標準的な手法として使われています。
まとめ
この記事では、二項分布の定義・ベルヌーイ試行との関係・確率質量関数・高校数学での位置づけ・現実での応用場面について詳しく解説しました。
二項分布は、「n回の独立なベルヌーイ試行における成功回数の確率分布」という明確な定義を持つ、確率論の基礎となる分布です。
4つの成立条件を理解し、確率質量関数P(X=k) = ₙCₖ × pᵏ × (1-p)ⁿ⁻ᵏを使いこなすことが、二項分布をマスターするうえでの核心となります。
品質管理・医薬品試験・機械学習など、さまざまな実用場面で活躍する二項分布の概念をしっかりと理解し、確率統計の学習に役立てていただければ幸いです。