ベイズの定理は、確率論の中でも特に「現代社会で役立つ数学」として知られています。医療検査、AI、機械学習、スパムメール判定、天気予報など、実はさまざまな場所で使われています。
しかし、学校の教科書では数式だけで説明されることも多く、「結局何を求めているのかわからない」と感じる人も少なくありません。
この記事では、ベイズの定理を「条件付き確率」の基本から、実際の具体例まで、なるべくわかりやすく整理して解説します。
ベイズの定理とは何か
ベイズの定理を一言でいうと、
「ある結果が出たあとで、原因の確率を逆算する方法」
です。
例えば、病院の検査で陽性になったとします。
このとき知りたいのは、
「陽性だった → 本当に病気なのか?」
です。
ここでベイズの定理が使われます。
普通の確率は「病気なら陽性になる確率」を考えますが、ベイズの定理は逆方向、つまり「陽性なら病気である確率」を求めます。
まずは条件付き確率を理解する
ベイズの定理を理解するには、「条件付き確率」が重要です。
条件付き確率とは、
「ある条件が成立しているときの確率」
のことです。
例えば、
- トランプ52枚
- 赤いカード26枚
- ハート13枚
だった場合、
「赤いカードだとわかっている状態で、ハートを引く確率」
を考えます。
赤いカードは26枚あり、そのうちハートは13枚なので、
となります。
これが条件付き確率です。
ベイズの定理の公式
ベイズの定理の公式は次の形です。
記号だけだと難しく見えますが、意味を分解すると理解しやすくなります。
| 記号 | 意味 |
|---|---|
| P(A) | Aが起こる元々の確率 |
| P(B|A) | AのときBになる確率 |
| P(A|B) | Bが起きた後でAだった確率 |
つまり、
「結果Bが出たあとで、原因Aの可能性を更新する」
のがベイズの定理です。
病気検査の具体例で理解する
ベイズの定理で最も有名なのが病気検査です。
例えば、
- 病気の人は1%
- 病気なら99%で陽性
- 健康でも5%は誤って陽性
とします。
このとき、「陽性だった人が本当に病気の確率」を求めます。
まず人数を1万人と仮定します。
| 状態 | 人数 |
|---|---|
| 病気 | 100人 |
| 健康 | 9900人 |
病気100人のうち99人が陽性。
健康9900人のうち5%の495人が誤陽性。
つまり陽性者は合計594人。
そのうち本当に病気なのは99人なので、
つまり約16.7%しかありません。
「99%正確な検査なのに、陽性でも病気とは限らない」というのがベイズの定理の有名なポイントです。
なぜ直感とズレるのか
多くの人は、
「99%正確なら、陽性=ほぼ病気」
と思ってしまいます。
しかし実際には、病気の人そのものが非常に少ないため、誤陽性が大量に発生します。
これを「ベースレート(事前確率)の無視」と呼びます。
ベイズの定理は、この「元々どれくらい珍しいか」をちゃんと考慮する数学なのです。
AIや機械学習でも使われている
ベイズの定理は現代のAI技術でも重要です。
例えば迷惑メール判定では、
- 「無料」
- 「当選」
- 「今すぐ」
などの単語が含まれると、スパム確率を更新していきます。
これが「ナイーブベイズ分類器」と呼ばれる有名なアルゴリズムです。
また、ChatGPTのようなAIも、大量の確率推定を利用しています。
ベイズの定理を理解するコツ
ベイズの定理は、数式だけ見ると難しく感じます。
しかし、
- 人数で考える
- 表を書く
- 「原因→結果」と「結果→原因」を区別する
この3つを意識すると理解しやすくなります。
特に「逆向きの確率を求める」という感覚を持つことが重要です。
まとめ
ベイズの定理とは、
「ある結果が出たあとで、原因の確率を更新する方法」
です。
医療検査・AI・機械学習・迷惑メール判定など、現代社会のさまざまな分野で利用されています。
最初は数式が難しく感じられますが、具体的な人数や表を使うとイメージしやすくなります。
特に、「陽性なら病気か?」のような“逆方向の確率”を扱うのがベイズの定理最大の特徴です。


コメント