ゲーム理論トレーニング

2003年12月 8日 23:59 daiya | 個別ページ | コメント(1) | トラックバック(1)

■ナッシュ均衡とパレート最適

ゲーム理論で有名なケースは、メリル・フラッドとメルビン・ドレッシャーによる囚人のジレンマである。この本にもゲーム理論の代表例として登場する。

囚人Aと囚人Bがいる。

１　二人とも黙秘すると懲役1年ずつ
２　二人とも自白すると懲役2年ずつ
３　一人が自白し、一人が黙秘すると、自白した方は釈放、黙秘した方は懲役3年

この状況で、あなたが囚人Aだった場合、自白すべきか、黙秘すべきか、を考える。

有名な理論にはナッシュ均衡とパレート最適がある。ナッシュ均衡は、囚人同士が利己的に考え、自分の損得のみを合理的に考え必死になっている（均衡点）状況での、非協力ゲームを前提としている。この本での定義は「自分以外の全プレイヤーが均衡点の戦略をとるとき、自分もそれをとらないと得にならない」状態のことである。

ナッシュ均衡の戦略を両者が取ると、裏切りあうことで「自白ー自白」になる。結果として両者共に2年の懲役に服すことになる。

経済学者ビルフレート・パレートが考えたパレート最適とは、この本の言葉では「全員の状態を動かしてかまわない」条件下で、「自分の利益を増やすには、他人の利益を減らすしかない」ような状態のことである。つまり全体にとっての合理性を目指す。

パレート最適の戦略では、協調することになり「黙秘ー黙秘」になる。その結果、両者共に1年の刑に服すことになる。これ以上にどちらか片方が得をしようとすると相手を裏切り、自分だけが自白する必要がある。まさにそういう状況に落ち着いている。

結局、必死に自分だけの利益を考え相手を裏切ると両者ともに懲役2年になるが、全体の合理性を考えて両者が協調して行動すると、懲役1年で済む。

■Webで囚人のジレンマを体験してみる

この囚人のジレンマは一回だけではこれといった戦略を考えるのが難しいが、何度もゲームを繰り返すプロセスでは、相手のこれまでの出方から相手の戦略、信用度などが推測できるようになる。

本から少しはなれてWebで囚人のジレンマを体験できるサイトを紹介する。（Javaアプレット）

・The Prisoner's Dilemma
http://www.xs4all.nl/~helfrich/prisoner/

このサイトでは囚人のジレンマで、以下のような報酬を設定する。報酬は高いほど良い（懲役年数が少ないということ）。ユーザはJavaAppletでbの値を上下させる。つまり裏切る場合の報酬を設定すると、相手との間で、協調と裏切りがどのようなパターンで発生するかをアニメーションとして、確認できる。

the payoff matrix（報酬計算表）
		opponent（相手）
		cooperate（協調）	defect（裏切り）
player（あなた）	cooperate（協調）	１点	０点
player（あなた）	defect（裏切り）	b点（設定）	０点

b=0の例　これだと裏切る意味がないので協調（青）ばかり
View image
b=1の例　この段階でも協調の方がリスクが少ない
View image
b=1.85の例　裏切り（赤）が限りなく活性化している
View image
b=2の例　裏切りばかりが圧倒優勢
View image
b=3の例　ひたすら裏切るのがよいので勢力全開
View image

では、次に一回一回の戦略を体験できるアプレットもある。

・Repeated Prisoner's Dilemma Applet
http://www.gametheory.net/Web/PDilemma/Pdilemma.html

こちらでは、Collude（協調）とCheat（裏切り）を毎回選択する。相手はこちらの戦略を学習して、対応してくる。協調が続けば相手も協調し続けるが、こちらが裏切ると相手も裏切ってくる。また初回は何を出すか分からない。

報酬表は以下のようになっている。

the payoff matrix（報酬計算表）
		opponent（相手）
		Collude（協調）	Cheat（裏切り）
player（あなた）	Collude（協調）	あなた２０：相手２０	あなた０：相手３０
player（あなた）	Cheat（裏切り）	あなた３０：相手０	あなた１０：相手１０

25回の選択を5ラウンド繰り返し、コンピュータに勝てるかどうかを競う。だまされたらだまし返して、やられっぱなしでは終わらないことを示す「しっぺ返し」戦略の有効性や、初回から協調を続けて25回目の最後で裏切って逃げる戦略などが考えられるがみなさん勝てるだろうか。結構難しく、単純な囚人のジレンマも奥深いことがわかってくる。

・GemeTheory.Net
http://www.gametheory.net/html/applets.html
このサイトには囚人のジレンマほかさまざまなゲーム理論シミュレーションのアプレットが公開されていて遊べる。

■ゲーム理論の展開

囚人のジレンマはもちろん基本中の基本なのでこの本ではさらに複雑な事象も広く触れられている。

ゲーム理論は株価分析と投資の決定や、取締役会の多数決、政治の選挙などの戦略に応用されている。この本でも投資にゲーム理論を使って巨額の富を得たジョージソロスの話や議席を減らしたことで逆に影響力を高めた日本の政党の例などが紹介されている。

著者は、数式を限りなく排除し、文系の人間向けにゲーム理論の応用範囲の広さや、面白さを、分かりやすく説明することに成功している。他の難解なゲーム理論の本と違って話題の選び方がとっつきやすく、理論の説明が無駄をそぎ落としており、シンプルである点が高く評価できる。

理論の解説を終えた後半の章では、ベンチャーの新規市場参入の戦略や、日本、アジア、世界経済の動きの読み方、企業のモラルハザード回避の仕組み、戦争と平和など、ゲームから見た現代の読み解きが行われる。ここも秀逸である。

評価：★★★☆☆

参考URL：

ところでナッシュ均衡を考えたナッシュ教授は苦難の人生に悩まされながら、晩年ノーベル経済学賞を受賞した、このアカデミー賞映画の主人公になった人である。

・ビューティフルマインド
B00006LSXR.09.MZZZZZZZ.jpg

私はかなり感動してしまいました。見てない方はお正月におすすめ。見るのであれば解説は読まないほうがいいです。

トラックバック(1)

このブログ記事を参照しているブログ一覧: ゲーム理論トレーニング

このブログ記事に対するトラックバックURL: http://www.ringolab.com/mt/mt-tb.cgi/1139

» ビューティフル・マインド！(今、「生きている」その日に感じた心を綴ろう！)~のトラックバック

素晴らしい映画を見た。ゲーム理論で１９９４年ノーベル経済学賞を受賞した、「ジョン・ナッシュ」の物語である。ビューティフル・マインド続きを読む

コメント(1)

四家正紀 :

この映画、エンディングのところでボロボロ泣いてしまいました。途中は本当に怖かったですけどね。好きな作品です。でもナッシュ均衡は未だに分かっていません…。

2003年12月 9日 14:42

コメントする

このページは、daiyaが2003年12月 8日 23:59に書いたブログ記事です。

次のブログ記事は「瞬間情報処理の心理学―人が二秒間でできること」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

ゲーム理論トレーニング

カテゴリ:

トラックバック(1)

コメント(1)

コメントする

このブログ記事について

検索