技術(非IT系)

対数正規分布とは?期待値と特徴も!(確率密度関数・正規分布との違い・統計・データ分析など)

当サイトでは記事内に広告を含みます

株価・所得分布・生物の体重など、現実のデータには「正規分布ではなく対数正規分布に従う」ものが数多く存在します。

対数正規分布は、データの対数をとると正規分布になるという特徴を持つ確率分布です。

この記事では、対数正規分布の定義・確率密度関数・期待値・正規分布との違い・統計・データ分析への応用をわかりやすく解説していきます。

データ分析・統計学・金融工学など幅広い分野で役立つ知識ですので、ぜひ最後までご覧ください。

対数正規分布とは?定義と直感的な理解

それではまず、対数正規分布の定義と直感的な意味について解説していきます。

確率変数 X が対数正規分布に従うとは、Y=ln X が正規分布 N(μ, σ²) に従うことを意味します。

対数正規分布の定義:

ln X ~ N(μ, σ²) のとき、X は対数正規分布 LogNormal(μ, σ²) に従う

・定義域:X > 0(正の値のみ)

・パラメータ:μ(対数の平均), σ²(対数の分散)

つまり、「Xの対数が正規分布する」のが対数正規分布であり、「Xそのものが正規分布する」正規分布とは明確に異なります。

対数正規分布は「掛け算の結果」として生まれる分布であり、正規分布は「足し算の結果」として生まれる分布という直感があります。

確率密度関数

対数正規分布の確率密度関数は以下の通りです。

f(x) = 1/(xσ√(2π))・exp(−(ln x−μ)²/(2σ²))(x > 0)

・x≤0では f(x)=0

・グラフは右に裾を引く非対称な形(右歪み)

・ピーク(最頻値)は正規分布より左に位置する

この密度関数は、正規分布の密度関数に変数変換 x=eʸ を適用して得られます。

対数正規分布が自然に現れる理由

多くの独立した「乗法的」な要因の積として生じるデータは、中心極限定理の乗法版(対数をとって加法的に考える)から対数正規分布に近づきます。

株価の変動率・体の成長・粒子の大きさなどが対数正規分布に従う理由がここにあります。

対数正規分布の期待値・分散・その他の統計量

続いては、対数正規分布の主要な統計量を確認していきます。

期待値と分散

期待値:E[X] = exp(μ + σ²/2)

分散:Var(X) = (exp(σ²)−1)・exp(2μ+σ²)

中央値:exp(μ)

最頻値(モード):exp(μ−σ²)

重要な点として、期待値・中央値・最頻値がすべて異なり、期待値>中央値>最頻値という順になります。

これは対数正規分布が右歪みの分布であることを反映しています。

σ²の大きさによる分布の形状変化

σ²が小さいとき(σ²→0)、対数正規分布は正規分布に近い対称な形に近づきます。

σ²が大きいとき、分布は大きく右歪みになり、極端に大きな値が現れやすくなります。

所得分布では σ² が大きいほど「格差が大きい」状態を意味します。

モーメント母関数と特性関数

対数正規分布のモーメント母関数は、すべての実数tで有限な値を取らないという特徴があります。

これは正規分布との重要な違いのひとつであり、大きなリスクが存在する状況を反映しています。

正規分布との違い

続いては、対数正規分布と正規分布の違いを確認していきます。

比較項目 正規分布 対数正規分布
定義域 全実数(−∞〜+∞) 正の実数(0〜+∞)
形状 左右対称(ベル型) 右歪み(裾が右に長い)
平均=中央値=最頻値 常に成立 成立しない
生成メカニズム 多くの量の「和」 多くの量の「積」
代表的な応用 測定誤差・身長分布 株価・所得・粒子径

正規分布は「和の極限」、対数正規分布は「積の極限」として生まれる分布というのが最も本質的な違いです。

対数変換の役割

対数正規分布に従うデータは、対数変換することで正規分布に変換できます。

これにより、正規分布を前提とした統計手法(t検定・線形回帰など)を適用することが可能になります。

データ分析において、対数変換は「非対称で裾の長いデータ」を正規化する最も一般的な手法のひとつです。

対数正規分布の統計・データ分析への応用

続いては、対数正規分布の具体的な応用場面を確認していきます。

金融工学への応用

株価の変動は対数正規分布でモデル化されることが多く、これがブラック・ショールズモデルの基礎になっています。

株価 S(t) が幾何ブラウン運動に従うとき、S(t)/S(0) は対数正規分布に従います。

オプション価格の理論的な計算に対数正規分布が不可欠であり、金融数学の根幹をなしています。

所得分布・都市規模への応用

個人所得の分布は多くの国で対数正規分布(または対数正規分布とべき分布の組み合わせ)でよく近似されます。

都市の人口サイズ分布(ジップの法則)も、対数正規分布やべき分布との関係が研究されています。

生物学・医学への応用

生物の体重・薬の血中濃度・細菌の生存時間など、生物学・医学のデータにも対数正規分布が頻出します。

臨床試験のデータ解析では、対数変換してから正規分布を仮定するアプローチが一般的です。

まとめ

この記事では、対数正規分布の定義・確率密度関数・期待値・正規分布との違い・統計・データ分析への応用について解説してきました。

対数正規分布は「Xの対数が正規分布する」分布であり、正の値のみを取り右歪みの形を持ちます。

期待値がexp(μ+σ²/2)、中央値がexp(μ)、最頻値がexp(μ−σ²)と三者が異なる点が正規分布との大きな違いです。

対数正規分布を理解することは、金融・医学・社会科学のデータ分析力を大きく高めます