ゲーム理論のナッシュ均衡をわかりやすく解説|なぜ「x+y=100」が均衡になるのか

大学数学

ゲーム理論の問題では、略解だけを見ると「なぜそうなるのか分からない」と感じることがよくあります。

特にナッシュ均衡は、定義だけ暗記していても、実際の問題では理解しづらい分野です。

この記事では、戦略形ゲームの基本から、「なぜ x+y=100 がナッシュ均衡になるのか」を順番に整理しながら解説します。

まず問題の設定を整理する

プレイヤーはAとBの2人です。

それぞれ、0〜100の間の数を自由に選びます。

プレイヤー 選ぶ値
A x
B y

利得関数は次のように与えられています。

f(x,y)=x (ただし x+y≦100 のとき)

f(x,y)=0 (ただし x+y>100 のとき)

Bも同様に、条件を満たすと y を得点として受け取ります。

つまり、「合計が100以下なら自分の数字がそのまま得点になる」というゲームです。

プレイヤーは何を考えるのか

Aは、自分の得点 x をできるだけ大きくしたいです。

しかし、xを大きくしすぎて、

x+y>100

になると、得点が0になります。

つまりAは、

  • なるべく大きい数字を取りたい
  • でも100を超えたくない

というジレンマを抱えています。

Bもまったく同じです。

なぜ「x+y=100」が重要なのか

ここが最大のポイントです。

例えば、Bが y=40 を選んだとします。

するとAはどう考えるでしょうか。

x+y≦100 にしたいので、

x≦60

でなければなりません。

しかもAは得点を最大化したいので、可能なら x=60 を選びたいです。

つまり、Bが40なら、Aの最適反応は60です。

逆に、Aが60なら、Bの最適反応は40になります。

このとき、

x+y=100

となっています。

ナッシュ均衡とは何か

ナッシュ均衡とは、

「相手の戦略を固定したとき、自分だけ変えても得しない状態」

のことです。

例えば、(60,40) を考えます。

  • Aは60を得ている
  • Bは40を得ている

ここでAが61に変えるとどうなるでしょうか。

61+40=101 なので条件違反になります。

するとAの利得は0になります。

つまり、Aは60より大きくできません。

逆に59にすると得点が下がるだけです。

したがってAは60を変えたくありません。

Bも同じです。

だから (60,40) はナッシュ均衡になります。

なぜ「x+y<100」は均衡でないのか

例えば (30,40) を考えてみます。

このとき、

30+40=70

です。

まだ余裕があります。

するとAは、30を31や35に増やせます。

しかも条件違反になりません。

つまり、Aはもっと得できます。

したがって、(30,40) はナッシュ均衡ではありません。

つまり均衡になるには、これ以上増やせない状態である必要があります。

なぜ(100,100)も均衡なのか

一見すると不思議ですが、(100,100) もナッシュ均衡です。

このとき、

100+100=200

なので両者の利得は0です。

しかし、Aだけ戦略を変えてもどうでしょうか。

Bが100のままなら、Aがどんな正の値を選んでも合計が100を超えます。

つまりAの利得は0のままです。

Aは一人では改善できません。

Bも同様です。

したがって、定義上は (100,100) もナッシュ均衡になります。

この問題の本質

このゲームでは、

  • ギリギリ100まで攻めたい
  • でも超えると全部失う

という駆け引きが本質です。

そのため、最適反応を考えると、自然に

x+y=100

という境界線が重要になります。

ゲーム理論では、この「相手の行動を見ながら自分の最適行動を決める」という考え方が非常に大切です。

まとめ

この問題では、各プレイヤーは「できるだけ大きな数字を選びたいが、合計100を超えると0になる」という状況にあります。

そのため、お互いに最適反応を考えると、

x+y=100

がナッシュ均衡になります。

また、(100,100) も、一人だけ戦略を変えても利得を改善できないため、定義上はナッシュ均衡になります。

ナッシュ均衡は、「誰も単独では得をできない状態」と考えると理解しやすくなります。

コメント

タイトルとURLをコピーしました