ゲーム理論の問題では、略解だけを見ると「なぜそうなるのか分からない」と感じることがよくあります。
特にナッシュ均衡は、定義だけ暗記していても、実際の問題では理解しづらい分野です。
この記事では、戦略形ゲームの基本から、「なぜ x+y=100 がナッシュ均衡になるのか」を順番に整理しながら解説します。
まず問題の設定を整理する
プレイヤーはAとBの2人です。
それぞれ、0〜100の間の数を自由に選びます。
| プレイヤー | 選ぶ値 |
|---|---|
| A | x |
| B | y |
利得関数は次のように与えられています。
f(x,y)=x (ただし x+y≦100 のとき)
f(x,y)=0 (ただし x+y>100 のとき)
Bも同様に、条件を満たすと y を得点として受け取ります。
つまり、「合計が100以下なら自分の数字がそのまま得点になる」というゲームです。
プレイヤーは何を考えるのか
Aは、自分の得点 x をできるだけ大きくしたいです。
しかし、xを大きくしすぎて、
x+y>100
になると、得点が0になります。
つまりAは、
- なるべく大きい数字を取りたい
- でも100を超えたくない
というジレンマを抱えています。
Bもまったく同じです。
なぜ「x+y=100」が重要なのか
ここが最大のポイントです。
例えば、Bが y=40 を選んだとします。
するとAはどう考えるでしょうか。
x+y≦100 にしたいので、
x≦60
でなければなりません。
しかもAは得点を最大化したいので、可能なら x=60 を選びたいです。
つまり、Bが40なら、Aの最適反応は60です。
逆に、Aが60なら、Bの最適反応は40になります。
このとき、
x+y=100
となっています。
ナッシュ均衡とは何か
ナッシュ均衡とは、
「相手の戦略を固定したとき、自分だけ変えても得しない状態」
のことです。
例えば、(60,40) を考えます。
- Aは60を得ている
- Bは40を得ている
ここでAが61に変えるとどうなるでしょうか。
61+40=101 なので条件違反になります。
するとAの利得は0になります。
つまり、Aは60より大きくできません。
逆に59にすると得点が下がるだけです。
したがってAは60を変えたくありません。
Bも同じです。
だから (60,40) はナッシュ均衡になります。
なぜ「x+y<100」は均衡でないのか
例えば (30,40) を考えてみます。
このとき、
30+40=70
です。
まだ余裕があります。
するとAは、30を31や35に増やせます。
しかも条件違反になりません。
つまり、Aはもっと得できます。
したがって、(30,40) はナッシュ均衡ではありません。
つまり均衡になるには、これ以上増やせない状態である必要があります。
なぜ(100,100)も均衡なのか
一見すると不思議ですが、(100,100) もナッシュ均衡です。
このとき、
100+100=200
なので両者の利得は0です。
しかし、Aだけ戦略を変えてもどうでしょうか。
Bが100のままなら、Aがどんな正の値を選んでも合計が100を超えます。
つまりAの利得は0のままです。
Aは一人では改善できません。
Bも同様です。
したがって、定義上は (100,100) もナッシュ均衡になります。
この問題の本質
このゲームでは、
- ギリギリ100まで攻めたい
- でも超えると全部失う
という駆け引きが本質です。
そのため、最適反応を考えると、自然に
x+y=100
という境界線が重要になります。
ゲーム理論では、この「相手の行動を見ながら自分の最適行動を決める」という考え方が非常に大切です。
まとめ
この問題では、各プレイヤーは「できるだけ大きな数字を選びたいが、合計100を超えると0になる」という状況にあります。
そのため、お互いに最適反応を考えると、
x+y=100
がナッシュ均衡になります。
また、(100,100) も、一人だけ戦略を変えても利得を改善できないため、定義上はナッシュ均衡になります。
ナッシュ均衡は、「誰も単独では得をできない状態」と考えると理解しやすくなります。


コメント