株価・所得分布・生物の体重など、現実のデータには「正規分布ではなく対数正規分布に従う」ものが数多く存在します。
対数正規分布は、データの対数をとると正規分布になるという特徴を持つ確率分布です。
この記事では、対数正規分布の定義・確率密度関数・期待値・正規分布との違い・統計・データ分析への応用をわかりやすく解説していきます。
データ分析・統計学・金融工学など幅広い分野で役立つ知識ですので、ぜひ最後までご覧ください。
対数正規分布とは?定義と直感的な理解
それではまず、対数正規分布の定義と直感的な意味について解説していきます。
確率変数 X が対数正規分布に従うとは、Y=ln X が正規分布 N(μ, σ²) に従うことを意味します。
対数正規分布の定義:
ln X ~ N(μ, σ²) のとき、X は対数正規分布 LogNormal(μ, σ²) に従う
・定義域:X > 0(正の値のみ)
・パラメータ:μ(対数の平均), σ²(対数の分散)
つまり、「Xの対数が正規分布する」のが対数正規分布であり、「Xそのものが正規分布する」正規分布とは明確に異なります。
対数正規分布は「掛け算の結果」として生まれる分布であり、正規分布は「足し算の結果」として生まれる分布という直感があります。
確率密度関数
対数正規分布の確率密度関数は以下の通りです。
f(x) = 1/(xσ√(2π))・exp(−(ln x−μ)²/(2σ²))(x > 0)
・x≤0では f(x)=0
・グラフは右に裾を引く非対称な形(右歪み)
・ピーク(最頻値)は正規分布より左に位置する
この密度関数は、正規分布の密度関数に変数変換 x=eʸ を適用して得られます。
対数正規分布が自然に現れる理由
多くの独立した「乗法的」な要因の積として生じるデータは、中心極限定理の乗法版(対数をとって加法的に考える)から対数正規分布に近づきます。
株価の変動率・体の成長・粒子の大きさなどが対数正規分布に従う理由がここにあります。
対数正規分布の期待値・分散・その他の統計量
続いては、対数正規分布の主要な統計量を確認していきます。
期待値と分散
期待値:E[X] = exp(μ + σ²/2)
分散:Var(X) = (exp(σ²)−1)・exp(2μ+σ²)
中央値:exp(μ)
最頻値(モード):exp(μ−σ²)
重要な点として、期待値・中央値・最頻値がすべて異なり、期待値>中央値>最頻値という順になります。
これは対数正規分布が右歪みの分布であることを反映しています。
σ²の大きさによる分布の形状変化
σ²が小さいとき(σ²→0)、対数正規分布は正規分布に近い対称な形に近づきます。
σ²が大きいとき、分布は大きく右歪みになり、極端に大きな値が現れやすくなります。
所得分布では σ² が大きいほど「格差が大きい」状態を意味します。
モーメント母関数と特性関数
対数正規分布のモーメント母関数は、すべての実数tで有限な値を取らないという特徴があります。
これは正規分布との重要な違いのひとつであり、大きなリスクが存在する状況を反映しています。
正規分布との違い
続いては、対数正規分布と正規分布の違いを確認していきます。
| 比較項目 | 正規分布 | 対数正規分布 |
|---|---|---|
| 定義域 | 全実数(−∞〜+∞) | 正の実数(0〜+∞) |
| 形状 | 左右対称(ベル型) | 右歪み(裾が右に長い) |
| 平均=中央値=最頻値 | 常に成立 | 成立しない |
| 生成メカニズム | 多くの量の「和」 | 多くの量の「積」 |
| 代表的な応用 | 測定誤差・身長分布 | 株価・所得・粒子径 |
正規分布は「和の極限」、対数正規分布は「積の極限」として生まれる分布というのが最も本質的な違いです。
対数変換の役割
対数正規分布に従うデータは、対数変換することで正規分布に変換できます。
これにより、正規分布を前提とした統計手法(t検定・線形回帰など)を適用することが可能になります。
データ分析において、対数変換は「非対称で裾の長いデータ」を正規化する最も一般的な手法のひとつです。
対数正規分布の統計・データ分析への応用
続いては、対数正規分布の具体的な応用場面を確認していきます。
金融工学への応用
株価の変動は対数正規分布でモデル化されることが多く、これがブラック・ショールズモデルの基礎になっています。
株価 S(t) が幾何ブラウン運動に従うとき、S(t)/S(0) は対数正規分布に従います。
オプション価格の理論的な計算に対数正規分布が不可欠であり、金融数学の根幹をなしています。
所得分布・都市規模への応用
個人所得の分布は多くの国で対数正規分布(または対数正規分布とべき分布の組み合わせ)でよく近似されます。
都市の人口サイズ分布(ジップの法則)も、対数正規分布やべき分布との関係が研究されています。
生物学・医学への応用
生物の体重・薬の血中濃度・細菌の生存時間など、生物学・医学のデータにも対数正規分布が頻出します。
臨床試験のデータ解析では、対数変換してから正規分布を仮定するアプローチが一般的です。
まとめ
この記事では、対数正規分布の定義・確率密度関数・期待値・正規分布との違い・統計・データ分析への応用について解説してきました。
対数正規分布は「Xの対数が正規分布する」分布であり、正の値のみを取り右歪みの形を持ちます。
期待値がexp(μ+σ²/2)、中央値がexp(μ)、最頻値がexp(μ−σ²)と三者が異なる点が正規分布との大きな違いです。
対数正規分布を理解することは、金融・医学・社会科学のデータ分析力を大きく高めます。