箱ひげ図の見方「読み取れること・読み取れないこと」を完全解説!

データ分析や資料作成の場で「箱ひげ図(Boxplot)」を目にする機会が増えてきました。棒グラフや折れ線グラフと違い、少し独特な形をしているため、「どこをどう見ればいいのか自信がない」「平均値と何が違うの?」と戸惑う方も多いのではないでしょうか。
実は、箱ひげ図はデータの「散らばり具合」や「偏り」を一瞬で把握できる非常に強力なツールです。しかし万能ではなく、このグラフだけでは決して見えない「死角」も存在します。
本記事では、箱ひげ図から「読み取れること」と「読み取れないこと」を明確にし、ビジネスや研究でデータを正しく解釈するためのポイントを解説します。ここを押さえておけば、データに隠された事実を見落とすことなく、説得力のある分析ができるようになります。
この記事の内容(目次)
箱ひげ図の基本構成をおさらい
まず、箱ひげ図がどのような要素で成り立っているかを確認しましょう。箱ひげ図は、データを小さい順に並べたときの「位置」を示しています。
主に以下の5つの数値(5数要約)が視覚化されています。
最小値:もっとも小さい値(ひげの下端)
第一四分位数(25%点):下から25%の位置にある値(箱の下底)
中央値(50%点):真ん中の順位の値(箱の中の線)
第三四分位数(75%点):下から75%の位置にある値(箱の上底)
最大値:もっとも大きい値(ひげの上端)
(平均値):箱ひげ図に必須ではありませんがツールによっては表示可能
.png&w=3840&q=75)
これらを見ることで、データがどの範囲に集中しているかがわかります。より詳しい用語の定義や計算方法については、以下の記事で詳しく解説しています。
箱ひげ図から「読み取れること」
箱ひげ図を使う最大のメリットは、単純な「平均」だけでは見えないデータの構造が見えることです。具体的に読み取れる重要ポイントは以下の3点です。
1. データの「ばらつき」と「集中度合い」
箱(Box)の長さは、データ全体の真ん中50%が含まれる範囲(四分位範囲)を表しています。
箱が短い(縦に潰れている):データが中央値付近に密集しており、格差が少ない。
箱が長い(縦に伸びている):データが広範囲に散らばっており、個人差や個体差が大きい。

例えば、あるクラスのテスト結果を見た時、平均点が同じでも「全員が平均点付近を取ったのか(箱が短い)」「0点と100点がいて平均になっているのか(箱が長い)」を見分けることができます。
2. データの「偏り(歪み)」
中央値(箱の中の線)が箱のどの位置にあるか、あるいはひげの長さのバランスを見ることで、分布の偏りがわかります。
中央値が箱の下の方にある(または上のひげが長い):高い数値の方にデータが広がっている(右に裾を引く分布)。年収データなどがこれに当てはまります。

中央値が箱のど真ん中にある:データが左右対称に近い(正規分布に近い)可能性があります。

3. 「外れ値」の存在
ひげの上下に「点」としてプロットされるのが外れ値です。これは通常のデータの範囲から極端に離れた異常値を指します。

平均値などの統計量は、たった一つの極端な外れ値によって大きく数値が変わってしまいますが、箱ひげ図を使えば「異常なデータが含まれていること」が一目でわかります。
外れ値が見つかった場合、それが入力ミスなのか、重要な発見なのかを検討する必要があります。
参考記事: 箱ひげ図における外れ値とは?見つけ方と対処法
箱ひげ図からは「読み取れないこと」
非常に便利な箱ひげ図ですが、弱点もあります。ここを理解していないと、データを読み間違える危険性があります。
1. 具体的な「データの個数(サンプルサイズ)」
箱ひげ図の形を見ただけでは、その元データが「10人のデータ」なのか「10,000人のデータ」なのかが分かりません。
データの信頼性はサンプルサイズ(数)に依存するため、箱ひげ図を提示する際は、必ず別途「」のようにデータ数を記載する必要があります。

2. 分布の「山の形(ピークの数)」
これが最大の落とし穴です。箱ひげ図はデータを要約してしまうため、分布の細かい形状が消えてしまいます。
例えば、「ひとつの山(正規分布)」のデータと、「ふたつの山(二極化した分布)」のデータが、箱ひげ図にするとまったく同じ形になってしまうことがあります。

データの詳細な分布形状を知りたい場合は、ヒストグラムやバイオリン図を併用するのがベストです。
ヒストグラムと箱ひげ図の違いとは?使い分けを徹底解説
バイオリン図の基本:箱ひげ図の進化形を使いこなす
3. (通常は)平均値は表示されない
箱ひげ図の真ん中の線はあくまで「中央値」です。「平均値」は読み取れません。
ビジネスの現場では平均値も重要な指標となるため、作成ツールによっては「×」印や「●」印で平均値を同時にプロットする機能がついているものもあります。

複数のデータを比較する時こそ真価を発揮する
箱ひげ図が「読み取れないこと」を抱えながらも、なぜこれほど普及しているのでしょうか?それは、「複数のグループを比較する能力」が圧倒的に高いからです。
ヒストグラムを10個並べると見づらくて比較が困難ですが、箱ひげ図なら10個並べてもスッキリと比較できます。
支店ごとの売上のバラつき比較
月ごとの気温の変化
製造ラインごとの製品誤差の比較
[月ごとの気温の変化の比較]

このように「比較」を通して全体感を掴みたい場合、箱ひげ図は最強のツールとなります。
参考記事: 箱ひげ図の身近な例3選!テストの点数や気温など
箱ひげ図を簡単に作成する方法 | Excel・オンラインツール
「箱ひげ図が便利なのはわかったけれど、Excelで作るのは設定が面倒くさい…」
そう感じたことはありませんか?実際、Excelでの作成はデータの並べ替えやグラフ種類の選択など、意外と手間がかかります。
Excelでの箱ひげ図作成方法:ステップバイステップガイド
xGrapherなら、ブラウザ上でデータを貼り付けるだけで、美しく整った箱ひげ図を瞬時に作成できます。
インストール不要:Webブラウザですぐに使えます。
直感的な操作:データをコピペするだけでグラフ化。
平均値の表示もワンクリック:読み取れないはずの平均値もオプションで表示可能。
外れ値の処理:外れ値を含めるかどうかも簡単に切り替えられます。

レポートやプレゼン資料用に、プロフェッショナルなグラフを数秒で作成したい方は、ぜひ試してみてください。
まとめ
箱ひげ図は、データ分析において「木」ではなく「森」を見るためのツールです。
読み取れること:データの中央値、ばらつき(四分位範囲)、歪み、外れ値の有無。
読み取れないこと:サンプルサイズ(データ数)、分布の山の数(ヒストグラムのような形状)。
「読み取れないこと」があるという弱点を理解した上で、ヒストグラムと組み合わせたり、サンプル数を明記したりすることで、誤解のない正確なデータ活用が可能になります。
xGrapherのようなツールを活用して、データの「ばらつき」を味方につけ、説得力のある資料作成に役立ててください。

箱ひげ図に関するQ&A
データ分析初心者の方からよく寄せられる質問をまとめました。
Q1. 箱ひげ図の「ひげ」の長さはどうやって決まっていますか?
A1. 一般的な定義(Tukeyの方法)では、箱の両端(第一四分位数と第三四分位数)から、「箱の長さ(IQR)× 1.5倍」の範囲内にある最大値・最小値までひげを伸ばします。この範囲を超えたデータは「外れ値」として点で表示されます。ただし、単に最大値・最小値までひげを伸ばす書き方もあるため、注釈を確認することをおすすめします。
参考記事: 箱ひげ図の外れ値についての解説記事
Q2. 中央値と平均値が大きくズレている場合、何を意味しますか?
A2. データが大きく偏っていることを意味します。例えば、極端に数値が大きい外れ値がある場合、平均値はその値に引っ張られて大きくなりますが、中央値はあまり影響を受けません。このズレを見ることで、データの中に特異な値が含まれているかを推測できます。
例: 年収のデータで(250万円、300万円、350万円、400万円、2000万円)の場合平均値は660万円ですが中央値は350万円です。このように必ずしも平均値だけでは実態が把握できない場合もあります。
Q3. 箱ひげ図はどのようなデータに適していますか?
A3. 「連続する数値データ」に適しています。例えば、身長、体重、テストの点数、売上金額、温度などです。一方で、「好き・嫌い」のようなカテゴリデータや、順位だけのデータには不向きです。
Q4. ひげがない箱ひげ図になることはありますか?
A4. あります。例えば、最大値が第三四分位数と同じ値だった場合、上のひげはなくなります。データが特定の値に極端に集中している場合によく起こる現象です。
Q5. プレゼンで箱ひげ図を使う際の注意点は?
A5. 箱ひげ図に見慣れていない聴衆がいる場合、「この箱はデータの真ん中50%を表しています」といった簡単な凡例や説明を必ず添えるようにしましょう。いきなり出すと理解されないがあります。
&w=3840&q=75)
&w=3840&q=75)
&w=3840&q=75)
&w=3840&q=75)
&w=3840&q=75)
&w=3840&q=75)
&w=3840&q=75)
&w=3840&q=75)
&w=3840&q=75)
&w=3840&q=75)
&w=3840&q=75)