ヒストグラムとは?棒グラフとの違い、見方、作り方を初心者にも分かりやすく解説

「テストの点数、クラス全体の平均点は分かったけど、どの点数帯に何人くらいいるんだろう?」
「自社製品の顧客満足度アンケートを取ったけど、点数のばらつき具合はどうなっているんだろう?」

手元にあるたくさんの数値データ。平均値だけを見て「だいたいこんなものか」と判断していませんか?実は、データの本当の姿は「分布」、つまりどの値にどのくらいのデータが集まっているかという「ばらつき」に隠されています。この分布を視覚的に分かりやすく表現してくれるのがヒストグラムです。

ヒストグラムは、数値データを特定の範囲(階級)で区切り、それぞれの範囲にいくつのデータが含まれるか(度数)を柱状のグラフで表したものです。

これにより、データ全体の形状、中心的な傾向、ばらつきの度合いなどを一目で把握することができます。

この記事では、多くの人が混同しがちな棒グラフとの決定的な違いから、分布パターンの読み解き方、そして誰でも簡単に見やすいヒストグラムを作成する方法まで、分かりやすく解説していきます。

Cover Photo

【最重要】ヒストグラムと棒グラフの決定的な違い

ヒストグラムと聞いて、多くの人が「棒グラフと何が違うの?」という疑問を持ちます。見た目は似ていますが、この2つは目的も作り方も全く異なるグラフです。

ヒストグラムと棒グラフの違い

項目

ヒストグラム

棒グラフ

目的

連続するデータの分布を表現

項目ごとの量の比較

横軸

連続した数値(階級)

分類項目(製品名、地域など)

棒の間隔

棒同士がくっついている

棒同士が離れている

棒の順序

横軸の数値順で並べ替え不可

自由に並べ替え可能

棒グラフが「A商品の売上」「B商品の売上」のように独立した項目を比較するのに対し、ヒストグラムは「10点〜20点の人数」「20点〜30点の人数」のように、連続した一つのデータを区切ってその分布を表現します。

そのため、ヒストグラムの棒はデータが連続していることを示すためにくっついているのです。

この違いを理解することが、ヒストグラムを正しく使いこなすための第一歩です。

ヒストグラムの見方|分布の「形」からデータを読み解く

ヒストグラムの真価は、その「形」からデータがどのような特徴を持っているかを読み解ける点にあります。ここでは代表的な5つの分布パターンを見ていきましょう。

1. 正規分布(左右対称型)

正規分布のヒストグラム

特徴: 中央が最も高く、左右対称のなだらかな山の形。
読み取れること: 平均値を中心にデータがバランス良く散らばっている理想的な状態です。身長や体重など、自然界の多くの事象がこの形に近い分布を示します。

2. 右に歪んだ分布(右に裾が長い)

右に歪んだ分布のヒストグラム

特徴: 山の頂点が左側に寄り、右側に向かって裾が長く伸びている形。
読み取れること: 小さな値のデータが多く、大きな値のデータが少ない状態です。例えば、1世帯あたりの所得分布などがこの形になりやすいです。(多くの世帯は平均付近に集中するが、一部に極端に所得の高い世帯が存在するため)

3. 左に歪んだ分布(左に裾が長い)

左に歪んだヒストグラム

特徴: 山の頂点が右側に寄り、左側に向かって裾が長く伸びている形。
読み取れること: 大きな値のデータが多く、小さな値のデータが少ない状態です。満点が近い簡単なテストの結果などがこの形になりやすいです。(多くの人が高得点を取るが、一部に点数が低い人がいるため)

4. 二峰性分布(山が2つ)

二峰性のヒストグラム

特徴: 山が2つある形。
読み取れること: 性質が異なる2つのグループのデータが混在している可能性を示唆します。例えば、大人と子供が混在した集団の身長をヒストグラムにすると、子供の身長の山と大人の身長の山の2つが現れることがあります。

5. 絶壁型

絶壁型のヒストグラム

特徴: 片側が絶壁のようになっている形。
読み取れること: 本来は左右対称になるはずのデータが、何らかの理由で片側が削られている状態です。例えば、製品の品質検査で「規格外」のものが除外された後のデータなどがこの形になります。

【実践】ヒストグラムの作り方

ヒストグラムを作成するには、いくつかの専門用語を理解する必要があります。

  • 度数: 各区間に入っているデータの個数。

  • 階級(ビン): データを区切る区間。(例:10点〜20点)

  • 階級の幅: 一つの階級の幅。(例:10点)

  • 階級数: 階級の数。

これらの設定、特に「階級の幅」をどうするかでヒストグラムの見た目が大きく変わるため、データの特徴をうまく表現できる幅を見つけることが重要です。

一般的にはExcelで作ることが多いですが、「階級の設定が面倒」「見た目の調整が難しい」と感じる方も少なくありません。そこでおすすめなのが、オンラインのグラフ作成ツールです。

オンラインツールなら、もっと簡単・スピーディに

手軽に美しいヒストグラムを作りたいなら、オンラインツールの活用が最適です。私たちが提供する「xGrapher」は、データ分析の専門家でなくても、直感的な操作でヒストグラムを作成できるツールです。

  • データ入力が簡単: 元データをコピー&ペーストするだけでOK。

  • 階級の自動設定: 最適な階級幅や階級数を自動で提案してくれます。もちろん手動での微調整も可能です。

  • デザイン性が高い: 色やフォントを自由にカスタマイズでき、レポートやプレゼン資料にもそのまま使える美しいグラフがすぐに完成します。

  • 共有もスムーズ: 作成したグラフはURLで共有したり、画像としてダウンロードしたりできます。

面倒な設定に時間をかけることなく、データの分析と考察に集中したい方は、ぜひ「xGrapher」をお試しください。

xGrapherのヒストグラム作成画面

ヒストグラムに関するよくある質問(Q&A)

Q1. 階級の数(ビンの数)は、いくつくらいが適切ですか?

A: これに唯一の正解はありませんが、一般的にはデータの数の平方根(√n)を目安にすると良いとされています。

例えば、データが100個あれば√100=10なので、階級数は10個程度が目安になります。階級数が少なすぎると分布の形が潰れてしまい、多すぎるとギザギザになりすぎて全体の傾向が掴みにくくなります。

いくつかのパターンを試して、最もデータの特徴を捉えやすいものを選ぶのが良いでしょう。

Q2. ヒストグラムはどんな場面で役立ちますか?

A: ビジネスの様々な場面で活用できます。

  • 品質管理: 製品の重量や寸法のばらつきを確認し、品質が安定しているかを評価する。

  • 顧客分析: 顧客の年齢層や購入金額の分布を把握し、マーケティング戦略を立てる。

  • 人事評価: 社員の評価点の分布を見て、評価が特定の点数に偏っていないかなどを確認する。

  • Webサイト分析: ユーザーのサイト滞在時間の分布を分析し、コンテンツ改善に役立てる。

Q3. パレート図とヒストグラムの違いは何ですか?

A: ヒストグラムが「一つの連続データの分布」を見るのに対し、パレート図は「項目別のデータを大きい順に並べた棒グラフ」と「累積構成比を示す折れ線グラフ」を組み合わせたものです。

パレート図は、「売上の8割は、どの商品が生み出しているのか?」といった問題の原因を特定し、優先順位をつける(ABC分析)ために使われます。目的が全く異なるグラフです。

Q4. ヒストグラムの正規分布とは?

A: 正規分布は、ヒストグラムで最も基本的な分布の形で、平均値を頂点とした左右対称のなだらかな山の形をしています ⛰️。これは、データが平均値の周りに最も多く集まり、平均から離れるほど少なくなっていく「ごく自然なばらつきの状態」を示します。身長やテストの点数など、世の中の多くの事象がこの正規分布に近い形になります。

Q5. なぜ二峰性分布になるのですか?

A: 二峰性分布は、性質が異なる2つのグループがデータに混在しているサインです。それぞれのグループが別々の山を形成するため、全体として見ると山が2つあるように見えます。

例えば、「休日のカフェの客層」を分析した場合、午前中に多い「高齢者のグループ」と午後に多い「若者のグループ」が混ざることで、年齢の分布に2つの山が現れることがあります。

Q6. 階級(ビン)の幅を変えると、グラフの形が変わってしまうのはなぜですか?

A: 階級の幅は、データをまとめる「容器の大きさ」のようなものです。幅が広すぎると(容器が大きすぎると)、細かい分布の凹凸がならされてしまい、のっぺりとした山になってデータの特徴を見逃す可能性があります。

逆に幅が狭すぎると(容器が細かすぎると)、グラフがギザギザになりすぎて、どこが本当の山なのかがかえって分かりにくくなります。データの本質を捉えるためには、適切な幅を見つけることが非常に重要です。

Q7. ヒストグラムは英語では?別の呼び方は?

A: ヒストグラムは英語でそのまま histogram と言います。

別の呼び方としては、その機能を表す frequency distribution chart (度数分布図) と表現することもありますが、一般的には histogram が最も広く使われています。

まとめ

今回は、データの分布を明らかにする「ヒストグラム」について解説しました。

  • ヒストグラムは、連続したデータのばらつき(分布)を視覚化するグラフ。

  • 項目を比較する棒グラフとは目的も作り方も全く異なる。

  • 分布の「形」から、データの中心的な傾向や偏り、異常などを読み取ることができる。

  • オンラインツール「xGrapher」を使えば、階級設定などを気にせず簡単・きれいに作成可能。

平均値だけでは見えてこないデータの本質を掴むために、ヒストグラムは非常に強力なツールです。ぜひあなたのデータ分析に活用してみてください。

コラム著者・編集者

xGrapher編集チーム

xGrapher編集チームは、オンラインチャート作成ツールの開発者、技術ライターからなる専任チームです。グラフやチャートに関する実務経験から得た知識を活かし、ユーザーにとって価値のある情報を提供することに努めています。

関連記事