ベイズの定理とは?初心者向けに「条件付き確率」を図解イメージでわかりやすく解説

数学

ベイズの定理は、確率論の中でも特に「現代社会で役立つ数学」として知られています。医療検査、AI、機械学習、スパムメール判定、天気予報など、実はさまざまな場所で使われています。

しかし、学校の教科書では数式だけで説明されることも多く、「結局何を求めているのかわからない」と感じる人も少なくありません。

この記事では、ベイズの定理を「条件付き確率」の基本から、実際の具体例まで、なるべくわかりやすく整理して解説します。

ベイズの定理とは何か

ベイズの定理を一言でいうと、

「ある結果が出たあとで、原因の確率を逆算する方法」

です。

例えば、病院の検査で陽性になったとします。

このとき知りたいのは、

「陽性だった → 本当に病気なのか?」

です。

ここでベイズの定理が使われます。

普通の確率は「病気なら陽性になる確率」を考えますが、ベイズの定理は逆方向、つまり「陽性なら病気である確率」を求めます。

まずは条件付き確率を理解する

ベイズの定理を理解するには、「条件付き確率」が重要です。

条件付き確率とは、

「ある条件が成立しているときの確率」

のことです。

例えば、

  • トランプ52枚
  • 赤いカード26枚
  • ハート13枚

だった場合、

「赤いカードだとわかっている状態で、ハートを引く確率」

を考えます。

赤いカードは26枚あり、そのうちハートは13枚なので、

となります。

これが条件付き確率です。

ベイズの定理の公式

ベイズの定理の公式は次の形です。

記号だけだと難しく見えますが、意味を分解すると理解しやすくなります。

記号 意味
P(A) Aが起こる元々の確率
P(B|A) AのときBになる確率
P(A|B) Bが起きた後でAだった確率

つまり、

「結果Bが出たあとで、原因Aの可能性を更新する」

のがベイズの定理です。

病気検査の具体例で理解する

ベイズの定理で最も有名なのが病気検査です。

例えば、

  • 病気の人は1%
  • 病気なら99%で陽性
  • 健康でも5%は誤って陽性

とします。

このとき、「陽性だった人が本当に病気の確率」を求めます。

まず人数を1万人と仮定します。

状態 人数
病気 100人
健康 9900人

病気100人のうち99人が陽性。

健康9900人のうち5%の495人が誤陽性。

つまり陽性者は合計594人。

そのうち本当に病気なのは99人なので、

つまり約16.7%しかありません。

「99%正確な検査なのに、陽性でも病気とは限らない」というのがベイズの定理の有名なポイントです。

なぜ直感とズレるのか

多くの人は、

「99%正確なら、陽性=ほぼ病気」

と思ってしまいます。

しかし実際には、病気の人そのものが非常に少ないため、誤陽性が大量に発生します。

これを「ベースレート(事前確率)の無視」と呼びます。

ベイズの定理は、この「元々どれくらい珍しいか」をちゃんと考慮する数学なのです。

AIや機械学習でも使われている

ベイズの定理は現代のAI技術でも重要です。

例えば迷惑メール判定では、

  • 「無料」
  • 「当選」
  • 「今すぐ」

などの単語が含まれると、スパム確率を更新していきます。

これが「ナイーブベイズ分類器」と呼ばれる有名なアルゴリズムです。

また、ChatGPTのようなAIも、大量の確率推定を利用しています。

ベイズの定理を理解するコツ

ベイズの定理は、数式だけ見ると難しく感じます。

しかし、

  • 人数で考える
  • 表を書く
  • 「原因→結果」と「結果→原因」を区別する

この3つを意識すると理解しやすくなります。

特に「逆向きの確率を求める」という感覚を持つことが重要です。

まとめ

ベイズの定理とは、

「ある結果が出たあとで、原因の確率を更新する方法」

です。

医療検査・AI・機械学習・迷惑メール判定など、現代社会のさまざまな分野で利用されています。

最初は数式が難しく感じられますが、具体的な人数や表を使うとイメージしやすくなります。

特に、「陽性なら病気か?」のような“逆方向の確率”を扱うのがベイズの定理最大の特徴です。

コメント

タイトルとURLをコピーしました