箱ひげ図の見方・読み取り方を図解で解説|読み取れないことも解説

Cover Photo

データ分析や資料作成の場で「箱ひげ図(Boxplot)」を目にする機会が増えてきました。棒グラフや折れ線グラフと違い、少し独特な形をしているため、「どこをどう見ればいいのか自信がない」「平均値と何が違うの?」と戸惑う方も多いのではないでしょうか。

実は、箱ひげ図はデータの「散らばり具合」や「偏り」を一瞬で把握できる非常に強力なツールです。しかし万能ではなく、このグラフだけでは決して見えない「死角」も存在します。

本記事では、箱ひげ図から「読み取れること」と「読み取れないこと」を明確にし、ビジネスや研究でデータを正しく解釈するためのポイントを解説します。ここを押さえておけば、データに隠された事実を見落とすことなく、説得力のある分析ができるようになります。

この記事の内容(目次)

  1. 箱ひげ図の基本構成をおさらい
  2. 箱ひげ図から「読み取れること」
    1. 1. データの「ばらつき」と「集中度合い」
    2. 2. データの「偏り(歪み)」
    3. 3. 「外れ値」の存在
  3. 箱ひげ図の形状パターン別の読み方
    1. パターン1: 箱が短い+ひげが長い
    2. パターン2: 箱が長い+ひげが短い
    3. パターン3: 中央値が箱の上寄り(左裾が長い)
    4. パターン4: 中央値が箱の下寄り(右裾が長い)
    5. パターン5: ほぼ対称(中央値が箱の中央付近)
    6. 形状パターンを読むときの注意点
  4. 具体例で理解する箱ひげ図の読み方
    1. データの準備
    2. ステップ1: 5数要約を読み取る
    3. ステップ2: ばらつきを読み取る
    4. ステップ3: 偏りを読み取る
    5. ステップ4: 総合的な解釈
  5. 箱ひげ図からは「読み取れないこと」
    1. 1. 具体的な「データの個数(サンプルサイズ)」
    2. 2. 分布の「山の形(ピークの数)」
    3. 3. (通常は)平均値は表示されない
  6. 複数のデータを比較する時こそ真価を発揮する
    1. 品質管理での活用
    2. 教育での活用
    3. 金融での活用
    4. 医療での活用
  7. 箱ひげ図を簡単に作成する方法 | Excel・オンラインツール
  8. まとめ
  9. 箱ひげ図に関するQ&A
    1. Q1. 箱ひげ図の「ひげ」の長さはどうやって決まっていますか?
    2. Q2. 中央値と平均値が大きくズレている場合、何を意味しますか?
    3. Q3. 箱ひげ図はどのようなデータに適していますか?
    4. Q4. ひげがない箱ひげ図になることはありますか?
    5. Q5. プレゼンで箱ひげ図を使う際の注意点は?

箱ひげ図の基本構成をおさらい

まず、箱ひげ図がどのような要素で成り立っているかを確認しましょう。箱ひげ図は、データを小さい順に並べたときの「位置」を示しています。

主に以下の5つの数値(5数要約)が視覚化されています。

  1. 最小値:もっとも小さい値(ひげの下端)

  2. 第一四分位数(25%点):下から25%の位置にある値(箱の下底)

  3. 中央値(50%点):真ん中の順位の値(箱の中の線)

  4. 第三四分位数(75%点):下から75%の位置にある値(箱の上底)

  5. 最大値:もっとも大きい値(ひげの上端)

  6. (平均値):箱ひげ図に必須ではありませんがツールによっては表示可能

これらを見ることで、データがどの範囲に集中しているかがわかります。より詳しい用語の定義や計算方法については、以下の記事で詳しく解説しています。

箱ひげ図から「読み取れること」

箱ひげ図を使う最大のメリットは、単純な「平均」だけでは見えないデータの構造が見えることです。具体的に読み取れる重要ポイントは以下の3点です。

1. データの「ばらつき」と「集中度合い」

箱(Box)の長さは、データ全体の真ん中50%が含まれる範囲(四分位範囲)を表しています。

  • 箱が短い(縦に潰れている):データが中央値付近に密集しており、格差が少ない。

  • 箱が長い(縦に伸びている):データが広範囲に散らばっており、個人差や個体差が大きい。

例えば、あるクラスのテスト結果を見た時、平均点が同じでも「全員が平均点付近を取ったのか(箱が短い)」「0点と100点がいて平均になっているのか(箱が長い)」を見分けることができます。

2. データの「偏り(歪み)」

中央値(箱の中の線)が箱のどの位置にあるか、あるいはひげの長さのバランスを見ることで、分布の偏りがわかります。

  • 中央値が箱の下の方にある(または上のひげが長い):高い数値の方にデータが広がっている(右に裾を引く分布)。年収データなどがこれに当てはまります。

  • 中央値が箱のど真ん中にある:データが左右対称に近い(正規分布に近い)可能性があります。

3. 「外れ値」の存在

ひげの上下に「点」としてプロットされるのが外れ値です。これは通常のデータの範囲から極端に離れた異常値を指します。

平均値などの統計量は、たった一つの極端な外れ値によって大きく数値が変わってしまいますが、箱ひげ図を使えば「異常なデータが含まれていること」が一目でわかります。

外れ値が見つかった場合、それが入力ミスなのか、重要な発見なのかを検討する必要があります。
参考記事: 箱ひげ図における外れ値とは?見つけ方と対処法

箱ひげ図の形状パターン別の読み方

箱ひげ図を見慣れてくると、形状のパターンからデータの特徴を素早く読み取れるようになります。ここでは代表的な5つのパターンを紹介します。

パターン1: 箱が短い+ひげが長い

箱(四分位範囲)が短く、上下のひげが長く伸びているパターンです。

  • データの特徴: データ全体の範囲は広いが、中央50%のデータは狭い範囲に密集している

  • 読み取れること: 大多数のデータは中央値の近くに集まっているが、両端にまばらにデータが散らばっている

  • 具体例: 多くの社員の年収が400〜600万円台に集中しているが、一部の幹部層が1,000万円以上、新入社員が300万円以下というケース

パターン2: 箱が長い+ひげが短い

箱(四分位範囲)が大きく広がり、ひげが短いパターンです。

  • データの特徴: 中央50%のデータが広範囲に分布しており、データ全体のばらつきが大きい

  • 読み取れること: 個体差・個人差が大きく、「標準的な値」を一概に決めにくい状態

  • 具体例: あるクラスのテスト結果で、50点台から90点台まで満遍なく分布しており、成績にばらつきがあるケース

パターン3: 中央値が箱の上寄り(左裾が長い)

中央値の線が箱の上端に近い位置にあり、箱の下側や下のひげが長いパターンです。

  • データの特徴: 下位のデータが広範囲に散らばっており、左(低い方)に裾を引く分布

  • 読み取れること: 多くのデータは高い値に集中しているが、低い値が散発的に存在する

  • 具体例: 100点満点のテストで、大半の生徒が80〜95点を取っているが、一部の生徒が40〜60点台に散らばっているケース

パターン4: 中央値が箱の下寄り(右裾が長い)

中央値の線が箱の下端に近い位置にあり、箱の上側や上のひげが長いパターンです。

  • データの特徴: 上位のデータが広範囲に散らばっており、右(高い方)に裾を引く分布

  • 読み取れること: 多くのデータは低い値に集中しているが、突出して高い値が散発的に存在する

  • 具体例: 年収データで大半の人が300〜500万円に集中し、一部の高所得者が1,000万円以上に散らばっているケース。このパターンは経済データに多く見られます

パターン5: ほぼ対称(中央値が箱の中央付近)

中央値が箱のほぼ真ん中にあり、上下のひげの長さもほぼ等しいパターンです。

  • データの特徴: データが中央値を中心にほぼ均等に分布している

  • 読み取れること: 正規分布に近い対称的な分布である可能性が高い

  • 具体例: 身長や体重といった自然界のデータ、あるいは大規模な標準テストの成績データなど

形状パターンを読むときの注意点

形状パターンはあくまで「傾向を読み取るためのヒント」です。前述のとおり、箱ひげ図はデータの分布形状を完全には表現できないため、パターンから読み取った推測はヒストグラムなどで検証することをおすすめします。

具体例で理解する箱ひげ図の読み方

実際の数値データを使って、箱ひげ図の読み方をステップバイステップで確認してみましょう。

データの準備

あるクラス15人の数学テストの成績データ(100点満点)を例にします。

45, 52, 58, 62, 65, 68, 70, 72, 75, 78, 82, 85, 88, 92, 98

ステップ1: 5数要約を読み取る

まず、箱ひげ図に表される5つの数値を確認します。

統計量

箱ひげ図上の位置

最小値

45

下のひげの先端

第一四分位数(Q1)

62

箱の下端

中央値(Q2)

72

箱の中の線

第三四分位数(Q3)

85

箱の上端

最大値

98

上のひげの先端

箱ひげ図(ボックスプロット)とは?見方と作り方をわかりやすく解説!
あわせて読みたいRELATED POST

箱ひげ図(ボックスプロット)とは?見方と作り方をわかりやすく解説!

箱ひげ図(ボックスプロット)の基本的な見方、メリット、作り方を初心者にもわかりやすく解説します。データの最小値、最大値、四分位数を使い、分布のばらつきや外れ値を視覚的に把握する方法がわかります。オンラインツールでの簡単な作成方法も紹介。

ステップ2: ばらつきを読み取る

  • 全体の範囲(レンジ): 98 − 45 = 53点。最高点と最低点の差が53点あり、成績には大きな幅がある

  • 四分位範囲(IQR): 85 − 62 = 23点。中央50%の生徒(約8人)の成績は62〜85点の23点の幅に収まっている

  • 箱の長さ(23点)に対してレンジ(53点)が約2.3倍あるため、箱の外にもデータがそれなりに散らばっていることがわかる

ステップ3: 偏りを読み取る

  • 中央値(72)は箱の中でやや下寄りに位置している(Q1からの距離 = 10、Q3からの距離 = 13)

  • 上のひげの長さ(98 − 85 = 13)と下のひげの長さ(62 − 45 = 17)を比較すると、下のひげの方がやや長い

  • 解釈: やや低い方にデータが散らばりやすい傾向があるが、おおむね対称に近い分布

ステップ4: 総合的な解釈

このクラスの数学テストの成績について、箱ひげ図から以下のように読み取れます。

「クラスの成績は最低45点から最高98点まで幅があるが、半数の生徒は62〜85点の範囲に収まっている。成績の中央値は72点で、極端な低得点者が若干名いるものの、全体としてはおおむねバランスの取れた分布をしている。」

このように、5数要約の各値を順番に読み取っていくことで、データの全体像を正確に把握できます。

箱ひげ図からは「読み取れないこと」

非常に便利な箱ひげ図ですが、弱点もあります。ここを理解していないと、データを読み間違える危険性があります。

1. 具体的な「データの個数(サンプルサイズ)」

箱ひげ図の形を見ただけでは、その元データが「10人のデータ」なのか「10,000人のデータ」なのかが分かりません。
データの信頼性はサンプルサイズ(nn数)に依存するため、箱ひげ図を提示する際は、必ず別途「n=100n=100」のようにデータ数を記載する必要があります。

2. 分布の「山の形(ピークの数)」

これが最大の落とし穴です。箱ひげ図はデータを要約してしまうため、分布の細かい形状が消えてしまいます。
例えば、「ひとつの山(正規分布)」のデータと、「ふたつの山(二極化した分布)」のデータが、箱ひげ図にするとまったく同じ形になってしまうことがあります。

データの詳細な分布形状を知りたい場合は、ヒストグラムバイオリン図を併用するのがベストです。
ヒストグラムと箱ひげ図の違いとは?使い分けを徹底解説
バイオリン図の基本:箱ひげ図の進化形を使いこなす

3. (通常は)平均値は表示されない

箱ひげ図の真ん中の線はあくまで「中央値」です。「平均値」は読み取れません。
ビジネスの現場では平均値も重要な指標となるため、作成ツールによっては「×」印や「●」印で平均値を同時にプロットする機能がついているものもあります。

複数のデータを比較する時こそ真価を発揮する

箱ひげ図が「読み取れないこと」を抱えながらも、なぜこれほど普及しているのでしょうか?それは、「複数のグループを比較する能力」が圧倒的に高いからです。

ヒストグラムを10個並べると見づらくて比較が困難ですが、箱ひげ図なら10個並べてもスッキリと比較できます。

品質管理での活用

製造業では、製品の寸法や重量のばらつき管理に箱ひげ図が使われます。製造ラインごとの箱ひげ図を並べることで、「ラインAは安定しているがラインBはばらつきが大きい」「ラインCは基準値から偏っている」といった問題をすぐに発見できます。

QC7つ道具・新QC7つ道具とは?違いと使い方を徹底解説【初心者向け】
あわせて読みたいRELATED POST

QC7つ道具・新QC7つ道具とは?違いと使い方を徹底解説【初心者向け】

QC7つ道具と新QC7つ道具の違いを初心者にも分かりやすく解説。パレート図や特性要因図など各ツールの目的、使い方、使い分けを具体例で紹介します。データに基づいた問題解決で、あなたのビジネスの品質を向上させる第一歩に。

教育での活用

学年別・クラス別のテスト成績の比較にも有効です。平均点だけの比較では見えない「クラスAは平均点は高いが成績差が大きい」「クラスBは全体的にまとまっている」といったばらつきの違いを可視化できます。

金融での活用

月別の株価リターンの分布を比較することで、「夏場はリターンのばらつきが大きい(リスクが高い)」「冬場は安定している」といった季節性のパターンを読み取ることができます。

医療での活用

治療前後の血圧や血糖値などの数値を箱ひげ図で比較することで、治療効果の有無だけでなく、患者間の効果のばらつき(個人差)も把握できます。

このように、箱ひげ図は業界を問わず「複数のグループ間のばらつきを比較する」場面で真価を発揮します。

[月ごとの気温の変化の比較]

このように「比較」を通して全体感を掴みたい場合、箱ひげ図は最強のツールとなります。

箱ひげ図の身近な例3選!テストの点数や気温など、平均値だけでは見えないデータの真実とは?
あわせて読みたいRELATED POST

箱ひげ図の身近な例3選!テストの点数や気温など、平均値だけでは見えないデータの真実とは?

箱ひげ図は難しそうに見えますが、実は「データのばらつき」を一目で把握できる便利なグラフです。この記事では、テストの点数、気温、年収といった身近な例を使って、箱ひげ図の見方と活用メリットをわかりやすく解説します。エクセルよりも簡単に作成できる無料ツールも紹介。

箱ひげ図を簡単に作成する方法 | Excel・オンラインツール

「箱ひげ図が便利なのはわかったけれど、Excelで作るのは設定が面倒くさい…」
そう感じたことはありませんか?実際、Excelでの作成はデータの並べ替えやグラフ種類の選択など、意外と手間がかかります。
Excelでの箱ひげ図作成方法:ステップバイステップガイド

xGrapherなら、ブラウザ上でデータを貼り付けるだけで、美しく整った箱ひげ図を瞬時に作成できます。

  • インストール不要:Webブラウザですぐに使えます。

  • 直感的な操作:データをコピペするだけでグラフ化。

  • 平均値の表示もワンクリック:読み取れないはずの平均値もオプションで表示可能。

  • 外れ値の処理:外れ値を含めるかどうかも簡単に切り替えられます。

xGrapherの箱ひげ図作成画面

レポートやプレゼン資料用に、プロフェッショナルなグラフを数秒で作成したい方は、ぜひ試してみてください。

今すぐxGrapherで箱ひげ図を作成する

まとめ

箱ひげ図は、データ分析において「木」ではなく「森」を見るためのツールです。

  • 読み取れること:データの中央値、ばらつき(四分位範囲)、歪み、外れ値の有無。

  • 読み取れないこと:サンプルサイズ(データ数)、分布の山の数(ヒストグラムのような形状)。

「読み取れないこと」があるという弱点を理解した上で、ヒストグラムと組み合わせたり、サンプル数を明記したりすることで、誤解のない正確なデータ活用が可能になります。
xGrapherのようなツールを活用して、データの「ばらつき」を味方につけ、説得力のある資料作成に役立ててください。

xGrapher紹介画像

箱ひげ図に関するQ&A

データ分析初心者の方からよく寄せられる質問をまとめました。

Q1. 箱ひげ図の「ひげ」の長さはどうやって決まっていますか?

A1. 一般的な定義(Tukeyの方法)では、箱の両端(第一四分位数と第三四分位数)から、「箱の長さ(IQR)× 1.5倍」の範囲内にある最大値・最小値までひげを伸ばします。この範囲を超えたデータは「外れ値」として点で表示されます。ただし、単に最大値・最小値までひげを伸ばす書き方もあるため、注釈を確認することをおすすめします。

箱ひげ図の外れ値とは?基準(1.5倍)の求め方と見つけた時の対処法を解説
あわせて読みたいRELATED POST

箱ひげ図の外れ値とは?基準(1.5倍)の求め方と見つけた時の対処法を解説

箱ひげ図に表示される「外れ値」。その定義や基準(IQRの1.5倍)の計算方法、なぜ外れ値が出るのか、見つけた場合に削除すべきかなどの対処法までを分かりやすく解説します。オンラインで簡単に箱ひげ図を作成する方法も紹介。

Q2. 中央値と平均値が大きくズレている場合、何を意味しますか?

A2. データが大きく偏っていることを意味します。例えば、極端に数値が大きい外れ値がある場合、平均値はその値に引っ張られて大きくなりますが、中央値はあまり影響を受けません。このズレを見ることで、データの中に特異な値が含まれているかを推測できます。

例: 年収のデータで(250万円、300万円、350万円、400万円、2000万円)の場合平均値は660万円ですが中央値は350万円です。このように必ずしも平均値だけでは実態が把握できない場合もあります。

Q3. 箱ひげ図はどのようなデータに適していますか?

A3. 「連続する数値データ」に適しています。例えば、身長、体重、テストの点数、売上金額、温度などです。一方で、「好き・嫌い」のようなカテゴリデータや、順位だけのデータには不向きです。

Q4. ひげがない箱ひげ図になることはありますか?

A4. あります。例えば、最大値が第三四分位数と同じ値だった場合、上のひげはなくなります。データが特定の値に極端に集中している場合によく起こる現象です。

Q5. プレゼンで箱ひげ図を使う際の注意点は?

A5. 箱ひげ図に見慣れていない聴衆がいる場合、「この箱はデータの真ん中50%を表しています」といった簡単な凡例や説明を必ず添えるようにしましょう。いきなり出すと理解されないがあります。

コラム著者・編集者

xGrapher編集チーム

xGrapher編集チームは、オンラインチャート作成ツールの開発者、技術ライターからなる専任チームです。グラフやチャートに関する実務経験から得た知識を活かし、ユーザーにとって価値のある情報を提供することに努めています。

関連記事