統計学の論文・レポート・教科書を読んでいると、パーセンタイルの表記方法がさまざまな形で登場することに気づくでしょう。
「P75」「75th percentile」「Q3」「第75百分位数」など、同じ概念が複数の表現で書かれていることがあり、混乱することもあるのではないでしょうか。
パーセンタイルの記号と表記方法には、国際的な統計学の慣例・学術論文の投稿規定・分野ごとの慣習などによってさまざまなバリエーションが存在します。
正しい表記方法を身につけることは、学術論文・卒業論文・ビジネスレポートの作成において、専門性と信頼性を高めるうえで重要なスキルです。
この記事では、パーセンタイルの記号・表記方法の基本から、数学的・統計学的な正式表現、論文での記載ルール、分野別の慣習まで、わかりやすく体系的に解説していきます。
統計学を学ぶ方から、論文執筆に取り組む研究者まで幅広くお役に立てる内容です。
パーセンタイルの記号と表記:基本的な書き方のルール
それではまず、パーセンタイルの記号と表記の基本的なルールについて解説していきます。
パーセンタイルの表記にはいくつかの形式が広く使われており、文脈・分野・投稿規定に応じて適切な表記を選ぶことが求められます。
最も一般的な表記形式:P表記と百分位数表記
パーセンタイルの表記として最も広く使われているのが「P」を使った表記形式です。
パーセンタイルの主な表記形式
P表記:P25、P50、P75、P95(大文字のPにパーセンタイル値を付ける)
例文:「中央値はP50 = 82.5であった。」
英語表記:25th percentile、50th percentile、75th percentile
例文:「The median (50th percentile) was 82.5.」
日本語表記:第25百分位数、第50百分位数(百分位数は「パーセンタイル」の和訳)
例文:「第25百分位数は18.0であった。」
四分位数表記(Q表記):Q1(=P25)、Q2(=P50)、Q3(=P75)
P表記はシンプルで視認性が高く、国際的な論文・学術誌でも広く採用されています。
「P」は大文字を使い、数値はイタリック体にしない(通常のローマン体)のが一般的な慣例です。
添字(subscript)を使った数学的表記
数学・統計学の教科書や記号論的に厳密な文書では、添字(下付き文字)を使った表記が使われることがあります。
添字(subscript)を使ったパーセンタイルの数学的表記
一般形:x_p(xのp番目のパーセンタイル)
例:x₀.₇₅(75パーセンタイル)、x₀.₅(50パーセンタイル)
または:π_p(πはparameterのπ)
分位数関数の表記:Q(p) = p番目の分位数(0≦p≦1)
例:Q(0.5) = 中央値、Q(0.75) = 75パーセンタイル
この表記法は確率論・数理統計学の文脈でよく登場しますが、一般的な応用統計・医学論文ではP表記の方が読みやすく、より多く使われています。
対象読者と文脈に合わせて表記法を選択することが重要です。
信頼区間・統計量との組み合わせ表記
論文やレポートでは、パーセンタイルを他の統計量と組み合わせて報告することが多いです。
中央値と四分位範囲を合わせて報告する場合の標準的な表記は以下の通りです。
中央値+四分位範囲(IQR)の表記例
英語表記:median (IQR) = 82.5 (72.0–91.0)
または:median [Q1, Q3] = 82.5 [72.0, 91.0]
または:82.5 (P25–P75: 72.0–91.0)
日本語表記:中央値(四分位範囲)=82.5(72.0〜91.0)
または:82.5(第25〜75百分位数:72.0〜91.0)
四分位範囲の表記では「–(ハイフン)」よりも「〜(波ダッシュ)」や「–(エンダッシュ)」を使う方が範囲を示すうえで適切とされています。
論文・学術誌でのパーセンタイルの表記ルール
続いては、学術論文・医学誌・統計学誌でのパーセンタイルの記載ルールについて確認していきます。
学術論文に投稿する際は、各誌のauthor guidelines(投稿規定)に従った表記方法を使うことが求められます。
医学・医療系論文でのパーセンタイル表記の慣例
医学系の主要論文誌(New England Journal of Medicine・The Lancet・JAMA・BMJなど)では、記述統計量の報告に関するガイドラインが設けられています。
一般的な医学論文での慣例としては以下のルールが広く採用されています。
| 表記の要素 | 標準的な書き方(英語) | 日本語例 |
|---|---|---|
| 中央値+IQR | median (IQR): 82.5 (72.0–91.0) | 中央値(IQR):82.5(72.0〜91.0) |
| パーセンタイル指定 | 25th–75th percentile: 72.0–91.0 | 第25〜75百分位数:72.0〜91.0 |
| 特定パーセンタイル | P25 = 72.0, P75 = 91.0 | P25 =72.0、P75 =91.0 |
| 95パーセンタイル | 95th percentile または P95 | 第95百分位数またはP95 |
CONSORT・STROBE・PRISMAなどの医学研究報告のガイドラインでも、記述統計量には中央値とIQRを合わせて報告することが推奨されており、パーセンタイルの明示が求められています。
統計学・数学の論文での記号表記
統計学・数学系の論文では、より形式的な数学的記号が使われる傾向があります。
分位数(quantile)を一般化して表す場合は、Q(τ)またはF⁻¹(τ)(累積分布関数の逆関数)という表記がよく使われます。
統計学・数学論文でのパーセンタイル・分位数の記号表記例
Q_τ または Q(τ) :τ番目の分位数(0<τ<1)
例:Q_0.5 = 中央値、Q_0.75 = 75パーセンタイル
F⁻¹(p) :累積分布関数Fのp番目の逆関数(分位数関数)
Med(X) :確率変数Xの中央値
Q₁, Q₂, Q₃ :第1・第2・第3四分位数
IQR = Q₃ − Q₁ :四分位範囲
数学論文では記号の定義を本文中または注釈で明確に示すことが重要であり、読者が記号の意味を解釈できるよう配慮することが求められます。
日本語論文・報告書でのパーセンタイル表記
日本語で書かれた論文・報告書では、漢字表記と英語略号が混在することが多く見られます。
日本語の学術誌(日本統計学会誌・日本公衆衛生雑誌・日本小児科学会誌など)では以下のような表記が一般的です。
「中央値(P25〜P75)」「第25〜75百分位数」「パーセンタイル値(P10・P25・P50・P75・P90)」などが使われており、投稿先の雑誌の過去の論文を参照して表記を合わせるのが実践的なアドバイスです。
卒業論文・修士論文では指導教員や学部・研究科の記載ルールに従うことが最優先となります。
ビジネスレポート・一般文書でのパーセンタイルの書き方
続いては、ビジネス文書・一般向けレポート・プレゼンテーションでのパーセンタイルの適切な書き方について確認していきます。
ビジネスの場面では学術論文ほど厳密な記号使用は求められませんが、読み手に正確に意図が伝わる表記を選ぶことが重要です。
一般読者向けのパーセンタイル表記の工夫
ビジネスレポートや一般向けの文書では、「パーセンタイル」という言葉自体になじみのない読者もいます。
その場合は「上位25%の境界値」「下位10%の水準」などの言い換えを使うことで、より直感的に伝わります。
一般向けのパーセンタイル表現の言い換え例
P25(25パーセンタイル)→「全体の下位25%と上位75%の境界値」
P50(50パーセンタイル)→「全体のちょうど中央の値(中央値)」
P75(75パーセンタイル)→「上位25%と下位75%の境界値」
P95(95パーセンタイル)→「上位5%の水準・高パフォーマンス層の基準」
P99(99パーセンタイル)→「上位1%の極めて高い水準」
専門用語を使う場合でも、初出時に括弧書きで説明を加える(例:95パーセンタイル(全体の95%がこの値以下))ことで、読み手の理解を助けられます。
グラフ・図表でのパーセンタイルの標記方法
グラフや表でパーセンタイルを示す際のラベルの書き方も重要です。
箱ひげ図の説明では「箱の上端:P75(第3四分位数)、中央線:P50(中央値)、箱の下端:P25(第1四分位数)」のように凡例に明示することが視認性を高めます。
折れ線グラフでパーセンタイル曲線を描く場合は、各線のラベルを「P10」「P25」「P50(中央値)」「P75」「P90」と明示し、P50を太い線で強調して基準線を明確化することが効果的です。
データラベル・凡例・注釈を適切に活用することで、グラフを見るだけでパーセンタイルの意味が伝わる、自立したグラフ(self-explanatory figure)を目指しましょう。
Wordスタイルガイドとパーセンタイルの表記統一
ビジネス文書や公式レポートでは、社内スタイルガイドや出版社のスタイルガイド(APA・AMA・APStyle等)に従った表記の統一が求められます。
APAスタイル(アメリカ心理学会)では「percentile」は小文字で、序数(75th percentile)の形で書くことが推奨されています。
AMAスタイル(アメリカ医学会)では「percentile」の略語として「P」を使うことが認められており、医学論文ではP25・P75のような形が広く使われています。
スタイルガイドが指定されている場合は必ずそのルールに従い、文書全体で表記を統一することが文書の品質を保つうえで不可欠です。
パーセンタイルに関連する記号・用語の一覧と整理
続いては、パーセンタイルに関連する記号・用語を総整理して、混同しやすい概念を整理していきます。
統計学では似た概念が複数の記号や用語で表されることが多く、用語・記号の対応関係を整理して理解することが正確な読み書きの基礎となります。
パーセンタイル関連の主要記号一覧
| 記号・表現 | 意味 | 別表記 |
|---|---|---|
| P50 | 50パーセンタイル(中央値) | Q2、Median、Med |
| P25 | 25パーセンタイル(第1四分位数) | Q1、Q₁、Lower quartile |
| P75 | 75パーセンタイル(第3四分位数) | Q3、Q₃、Upper quartile |
| IQR | 四分位範囲(P75−P25) | Interquartile Range |
| PR | パーセンタイル順位(Percentile Rank) | 百分位順位 |
| Q(p) | p番目の分位数関数 | 分位関数、quantile function |
| F⁻¹(p) | 累積分布関数の逆関数 | 分位数関数の数学的表記 |
特に混同しやすいのが「P50」「Q2」「Median(中央値)」の三つですが、これらはすべて同じ値を指す異なる表記であることを覚えておきましょう。
分位数(Quantile)・四分位数(Quartile)・百分位数の区別
統計学では「分位数(Quantile)」「四分位数(Quartile)」「百分位数(Percentile)」という三つの関連用語が登場します。
これらはデータを等分割する区切り点の概念として共通していますが、分割数が異なります。
分位数・四分位数・百分位数の違いまとめ
分位数(Quantile):データをn等分する区切り点の総称(n分位数)
四分位数(Quartile):データを4等分する3つの区切り点(Q1・Q2・Q3)
十分位数(Decile):データを10等分する9つの区切り点(D1〜D9)
百分位数(Percentile):データを100等分する99の区切り点(P1〜P99)
四分位数はパーセンタイルの特殊ケース:Q1=P25, Q2=P50, Q3=P75
これらの関係を整理すると、「百分位数(パーセンタイル)は最も細かい分位数の一種」であり、四分位数・十分位数はすべてパーセンタイルに換算して表現できることがわかります。
統計ソフト・プログラミング言語での記法との対応
最後に、統計ソフト・プログラミング言語でのパーセンタイル関連の関数名・引数の表記を整理します。
| ツール | 関数・書き方 | 備考 |
|---|---|---|
| Excel | PERCENTILE(配列, 0.75) | 0〜1の小数で指定 |
| Python/numpy | np.percentile(data, 75) | 0〜100の整数で指定 |
| Python/pandas | df.quantile(0.75) | 0〜1の小数で指定 |
| R | quantile(data, 0.75) | 0〜1の小数で指定 |
| SPSS | Frequencies→Percentiles | 0〜100で指定 |
| SAS | PROC UNIVARIATE / PCTLPTS | 0〜100で指定 |
ツールによって「0〜1の小数で指定」か「0〜100の整数で指定」かが異なるため、引数の入力形式を取り違えないよう注意することが実務上の重要なポイントです。
まとめ
この記事では、パーセンタイルの記号と表記方法について、基本的な書き方のルールから、論文・学術誌での記載慣例、ビジネス文書での工夫、関連用語の整理まで幅広く解説してきました。
パーセンタイルの表記は「P75」「75th percentile」「第75百分位数」「Q3」など複数の形式が存在しますが、対象読者・文脈・投稿規定に合わせて一貫した表記を選ぶことが最も重要です。
医学論文ではP表記+IQRの組み合わせ、数学論文ではQ(p)や分位数関数、一般文書では言い換えや括弧書きの説明を活用することで、正確で伝わりやすい記述が実現します。
分位数・四分位数・百分位数の区別と、各統計ソフトでの引数の入力形式の違いを正しく把握することが、ツールを使ったデータ分析の精度向上にもつながります。
パーセンタイルの記号と表記を正確に使いこなすことで、論文執筆・レポート作成・データ分析の質が確実に向上するでしょう。
ぜひこの記事を参考に、パーセンタイルの正しい表記方法を身につけてください。