はじめに:「分散」がわからず困っていませんか?
「分散」と聞いて、何となく“ばらつき”のことだとは分かっても、
「実際にどう使うのか?」「母分散と標本分散の違いがわからない…」
という方は多いのではないでしょうか?
この記事では、分散の意味と使い方を、具体例とともに丁寧に解説します!
QC検定2級の試験対策にも活用できるよう、ビジネス実務に即した視点でまとめました。
多彩な資格がスマートフォンで手軽に本格的な学習ができるオンライン試験対策講座


1. そもそも「分散」とは?
分散は「データのばらつき具合」を示す指標
分散(variance)とは、「データが平均からどれくらい散らばっているか」を表す指標です。
つまり、「バラつきの度合い」を数字で示したものです。
例えば、ある商品の製品重量を10個測定したとしましょう。
平均値が同じでも、それぞれの測定値にバラつきがあると、品質としては安定していない印象になりますよね?
その「ばらつき」の程度を数値化したものが 分散(variance) です。
直感的なイメージ
- データが平均にギュッと集まっていれば、分散は小さくなります。
- データがバラバラで平均から離れていれば、分散は大きくなります。
2. 分散の基本的な考え方
分散のイメージ:全体のデータが平均からどれだけ離れているかを測る
分散は、各データが平均からどれくらい離れているかを表します。
数学的には、次のように計算されます。
3. 分散の計算方法(標準パターン)
基本式(標本分散の場合)
\(s^2 = \frac{1}{n-1} \sum_{i=1}^{n}(x_i – \bar{x})^2\)用語の意味
- \(x_i\):個々のデータ値
- \(\bar{x}\):データの平均値(xバー)
- n:データの個数
- \(s^2\):標本分散(sample variance)
つまり、「それぞれのデータと平均の差」を2乗して、全部足して、(n−1)で割ることで分散を求めます。
4. 具体的な例で計算してみよう!
例題:製品の寸法を5つ測定した場合
測定値(mm) |
---|
10.2 |
9.8 |
10.0 |
10.1 |
9.9 |
まず、平均値を計算します。
\(\bar{x} = \frac{10.2 + 9.8 + 10.0 + 10.1 + 9.9}{5} = 10.0\)次に、各データと平均値との差を2乗して合計します:
\((10.2 – 10.0)^2 = 0.04,\quad (9.8 – 10.0)^2 = 0.04\) \((10.0 – 10.0)^2 = 0,\quad (10.1 – 10.0)^2 = 0.01,\quad (9.9 – 10.0)^2 = 0.01\)合計すると:
0.04 + 0.04 + 0 + 0.01 + 0.01 = 0.10
最後に、n−1で割って標本分散を求めます:
\(s^2 = \frac{0.10}{5 – 1} = \frac{0.10}{4} = 0.025\)つまり、この製品群の分散は0.025 mm²です。
補足:分散の単位と「標準偏差」との違い
- 分散の単位は「元の単位の2乗」になります(例:mm²、kg²など)
- 実務では「標準偏差」=分散の平方根を使う方が分かりやすいです!
上の例だと、標準偏差は
\(s = \sqrt{0.025} ≒ 0.1581\)という形になります。
5. 「母分散」と「標本分散」の違いとは?
母分散(σ²)とは?
母集団(全体)の分散。
→ 全数のデータがあるときに使います。
\(\sigma^2 = \frac{1}{n} \sum_{i=1}^{n}(x_i – \mu)^2\)事例:
- 工場で全数検査して、すべての製品の寸法を把握しているとき。
- データの全体(母集団)をすべて持っているとき。
標本分散(s²)とは?
母集団の一部=サンプル(標本)だけを使って計算した推定値。
→ 普段の測定やQCでは、こちらが基本!
\(s^2 = \frac{1}{n-1} \sum_{i=1}^{n}(x_i – \bar{x})^2\)事例:
- 工場で1000個の中から50個だけ抜き取って検査して平均やばらつきを推定する。
- アンケート調査で、一部の人の意見から全体を推測したいとき。
なぜ「n-1」で割るのか?
標本は母集団の一部なので、平均が母集団の真の平均からズレている可能性があります。
このズレを補正するために、あえて「n−1」で割って、バラつきを少し大きく見積もるのです。
これを「不偏分散(ふへんぶんさん)」とも言います。
→ 標本平均を使って計算することで、1つ自由度を使ってしまっているため、ばらつきを正確に見積もるには「n−1」で割る必要があります。これは統計学の世界ではとても重要な考え方です!
標本から母分散を推定するときは、少し大きめに見積もる補正が必要です。
そのため、割る数を1つ減らして「n−1」にするのです(不偏分散の考え方)。
分散の公式と計算ステップ
母分散の公式(全体のデータが分かっているとき)
\(\sigma^2 = \frac{1}{n} \sum_{i=1}^{n}(x_i – \mu)^2\)- \(x_i\):各データ
- \(\mu\):平均(期待値)
- n:データの数
標本分散の公式(一部サンプルだけ使うとき)
\(s^2 = \frac{1}{n-1} \sum_{i=1}^{n}(x_i – \bar{x})^2\)- \(\bar{x}\):標本平均
- n-1 で割る理由は、「小さめに出るバイアス(偏り)」を補正するためです。
分散の意味
分散というのは、平均から離れている度合いの指標です。
でも単位が「点数の2乗(点²)」になってしまうので、
現実的にはこの「分散」の平方根をとった標準偏差(σ)をよく使います。
6. 母分散と標本分散の使い分け
状況 | 使用する分散 | 割り方 | 使用例 |
---|---|---|---|
全データ(母集団)が揃っている | 母分散(σ²) | nで割る | 工場の全製品寸法を測定したとき |
一部サンプルのみ(標本) | 標本分散(s²) | n−1で割る | 抜き取り検査や調査のとき |
分散の具体例①(母分散を使う)
例題:次のテスト点数(5人分)の分散を求めてください
【データ】60点、70点、80点、90点、100点
ステップ①:平均(期待値)を求める
\(\mu = \frac{60 + 70 + 80 + 90 + 100}{5} = \frac{400}{5} = 80\)ステップ②:「各値 − 平均」を計算
データ x_i | 差 x_i – \mu | 2乗 (x_i – \mu)^2 |
---|---|---|
60 | -20 | 400 |
70 | -10 | 100 |
80 | 0 | 0 |
90 | +10 | 100 |
100 | +20 | 400 |
ステップ③:「差の2乗」の平均を求める(母分散)
\(\sigma^2 = \frac{400 + 100 + 0 + 100 + 400}{5} = \frac{1000}{5} = 200\)ステップ④:結果(母分散)
\(\boxed{200}\)分散の具体例②(標本分散を使う)
例題:次の代表5人の身長から分散を求めてください
5人の身長のデータ(単位:cm)
168, 170, 172, 169, 171
ステップ①: 平均\((\bar{x})\)を求める
\(\bar{x} = \frac{168 + 170 + 172 + 169 + 171}{5} = 170\)ステップ②: 偏差を求める(各データ − 平均)
- 168 − 170 = −2
- 170 − 170 = 0
- 172 − 170 = +2
- 169 − 170 = −1
- 171 − 170 = +1
ステップ③: 偏差の2乗を求める
- (−2)² = 4
- (0)² = 0
- (+2)² = 4
- (−1)² = 1
- (+1)² = 1
合計:4 + 0 + 4 + 1 + 1 = 10
ステップ④: 標本分散を求める(n−1 = 4 で割る)
\(s^2 = \frac{10}{4} = 2.5\)7. ビジネス現場での「分散」の活用法
QC検定や品質管理におけるポイント!
- 異常値の有無や、工程の安定性を判断する基礎資料として分散が活躍!
- 製品のバラツキが小さい=品質が安定している証拠!
使い分ける具体的な事例
シーン | 使うべき分散 | 理由・背景 |
---|---|---|
社内の全従業員100人の給料データを全件持っている | 母分散 | 母集団を全て観測しているため |
全国の高校生の身長を調査するため、100人を無作為に抽出 | 標本分散 | 母集団はあくまで「全国の高校生」なので、サンプルを使って推定する必要あり |
工場の製品1万個のうち、100個だけ測定 | 標本分散 | 全体を測れていないため、バラつきを推定する必要がある |
まとめ:分散のポイントをおさらい!
項目 | 内容 |
---|---|
分散とは | 平均からのデータのばらつきを数値化したもの |
標本分散の式 | \(s^2 = \frac{1}{n-1} \sum(x_i – \bar{x})^2\) |
母分散の式 | \(\sigma^2 = \frac{1}{n} \sum(x_i – \mu)^2\) |
違い | 標本分散は「n−1」で割る。不偏推定のため |
単位 | 元の単位の2乗。標準偏差にすると単位が元通り |
活用 | 品質管理、異常検知、工程能力指数などに必須! |
次に知っておきたい!分散からの発展
- 分散の平方根が「標準偏差」
- 分散が小さい ⇒ 工程が安定
- 工程能力指数(CpやCpk)にも分散や標準偏差が関係!
次回の記事予告
次回は、この分散も出てくる「基本統計量」について、詳しく解説していきます!
おすすめ学習資料(QC検定対策におすすめ)
【テキスト】QC検定2級対応
【問題集】徹底攻略QC検定2級
コメント