「173cmという身長データをどのように統計的に分析するか」について興味を持つ方もいるでしょう。
データサイエンスや統計学の視点から173cmという数値を分析することで、日本人の身長分布・平均・標準偏差などを理解する手助けになります。
この記事では、173cmを題材に身長データの統計的な分析方法・平均値・分布・統計計算をわかりやすく解説していきます。
データ分析の基礎を身につける参考にしてください。
173cmの統計的位置づけの結論
それではまず、173cmの統計的な位置づけの結論から解説していきます。
日本人成人男性の平均身長は約170.7cm(令和元年国民健康・栄養調査)とされており、173cmは平均よりやや高めの位置に属します。
標準偏差を約5.5cmとすると、173cmは平均から約0.42標準偏差上に位置します。
173cmは日本人男性の平均身長(約170.7cm)より約2.3cm高い値。統計的には標準偏差内の範囲に収まる一般的な身長です。
身長データの基本統計量の計算方法
続いては、身長データの基本統計量の計算方法を確認していきます。
統計分析の基本指標として、平均値・中央値・標準偏差・パーセンタイルが重要です。
平均値の計算方法
平均値(算術平均)はデータの総和を個数で割ることで求められます。
例:5人の身長データ(168・170・172・173・177cm)の平均値
(168+170+172+173+177)÷5 = 860÷5 = 172cm
173cmが平均値に近いデータセットを想定した場合、173cmはほぼ「代表値」に相当するデータポイントといえるでしょう。
標準偏差の意味と計算
標準偏差とは、データのばらつきの大きさを示す統計量です。
標準偏差が大きいほどデータの散らばりが大きく、小さいほどデータが平均値の近くに集中していることを表します。
身長のような生体データは正規分布に近い形状を示すことが多く、平均±1標準偏差の範囲に約68%のデータが含まれます。
パーセンタイル(百分位数)の活用
パーセンタイルとは、データを小さい順に並べたときに下から何%の位置にあるかを示す統計量です。
| 日本人男性身長 | パーセンタイル(推定) |
|---|---|
| 163cm以下 | 約15パーセンタイル |
| 167cm | 約30パーセンタイル |
| 170.7cm | 約50パーセンタイル(中央値) |
| 173cm | 約65パーセンタイル |
| 176cm以上 | 約80パーセンタイル |
173cmは日本人男性の中で上位35%程度に相当する身長といえるでしょう。
正規分布と173cmの分布上の位置
続いては、正規分布と173cmの分布上の位置を確認していきます。
身長データは正規分布(ガウス分布)に近い分布を示すことが統計的に知られています。
正規分布とは何か
正規分布とは平均値を中心に左右対称の釣り鐘型の分布であり、自然界や人間のデータに広く見られる分布形状です。
身長・体重・試験のスコアなどが正規分布に近い分布を示すことが多く、統計学の基本的な概念として重要でしょう。
正規分布のもとでは、平均±2標準偏差の範囲に約95%のデータが収まります。
Zスコア(標準化)の計算方法
Zスコアとは、特定のデータが平均から何標準偏差離れているかを示す値です。
Zスコア計算式:Z = (データの値 − 平均値)÷ 標準偏差
173cmの場合:Z = (173 − 170.7)÷ 5.5 ≒ 0.42
(平均より約0.42標準偏差高い位置に相当)
Zスコアが0.42の場合、正規分布表から累積確率は約66%となり、173cmは日本人男性の身長分布において上位34%程度に位置することが推定できます。
信頼区間の考え方
統計学では、母集団の平均値の範囲を推定する「信頼区間」という概念が重要です。
例えば100人のサンプルデータから日本人男性の平均身長を推定する場合、95%信頼区間を計算することで「母集団の平均がこの範囲に収まる確率が95%」という推定ができます。
データサイエンスにおいて信頼区間の理解は不可欠な知識でしょう。
データサイエンスにおける身長データの活用
続いては、データサイエンスにおける身長データの活用方法を確認していきます。
身長データは健康管理・マーケティング・スポーツ科学など様々な分野で活用されています。
相関分析への応用
身長と体重・身長と靴のサイズ・身長と運動能力など、2つの変数の関係性を調べる「相関分析」は統計学の基本的な手法です。
ピアソンの積率相関係数を使って変数間の直線的な関係の強さを数値化できるでしょう。
173cmという身長データと他の変数の相関を分析することで、体型・能力・傾向の把握に役立てることができます。
回帰分析による予測モデル
身長から標準体重・消費カロリー・靴のサイズを予測するモデルを構築する際に回帰分析が使われます。
線形回帰は「y=ax+b」という式でデータの傾向を近似し、新しい入力値に対する出力値を予測するモデルです。
データサイエンスでは機械学習の基礎として回帰分析の知識が重要になるでしょう。
PythonやRを使ったデータ分析
統計分析やデータサイエンスにはPythonやRなどのプログラミング言語が広く活用されています。
PythonのPandas・NumPy・SciPy・Matplotlibなどのライブラリを使えば、身長データの集計・可視化・統計検定を効率的に行えるでしょう。
データサイエンスの学習においてこれらのツールの習得は非常に有益です。
まとめ
173cmは日本人成人男性の平均身長(約170.7cm)より約2.3cm高く、正規分布においてZスコア約0.42に相当し上位34%程度に位置します。
身長データの分析には平均値・標準偏差・パーセンタイル・Zスコア・信頼区間などの統計量が活用されます。
データサイエンスの手法を活用することで、身長データから体型・健康傾向・相関関係を分析することが可能でしょう。
統計学とデータサイエンスの基礎を身につけて、データを活用した科学的な分析ができるようになってみてください。