Weitere ähnliche Inhalte Mehr von Yosuke YASUDA (20) ゲーム理論とマーケットデザイン入門 --- ゲーム理論編2. イントロダクション
2
} テキスト
} 天谷研一『図解で学ぶゲーム理論』
} 参考図書
1. ジョン・マクミラン『市場を創る』
2. 安田洋祐「社会を変える新しい経済学」
} 講義用ウェブサイト
} https://sites.google.com/site/yosukeyasuda/jp/lecture/wo13
} 第一回:戦略的状況とは何か --- 4~27
} テキスト1~2章
} 第二回:ナッシュ均衡 --- 28~52
} テキスト2~3章
} 第三回:ビジネス競争のゲーム --- 53~74
} テキスト3章
3. イントロダクション
3
} 第四回:ゲームを後ろから解く --- 75~101
} テキスト4章
} 第五回:長期的関係と協力の発生 --- 102~123
} テキスト7章
【ここまでが「ゲーム理論入門」】
} 第六回:マッチングの理論と実践
} 参考図書1&2
} 第七回:オークションの理論と実践
} テキスト5章、参考図書1
} 第八回:メカニズムデザインの考え方
} 参考図書2
【後半三回は「マーケットデザイン入門」】
6. 数学は役に立つのか?
Lecture 16
自然現象
- 自然科学
} 一定のパターンに自然と従
う(自然法則)
} 分析対象に直接その理由を
聞くことができない
⇒数学や数理モデルが分析
に欠かせない
経済(社会)現象
- 社会科学
} 各人は自分の思うがままに
自由に行動する
} 分析対象に理由を聞くこと
ができる
⇒数学がなくても“分析”でき
るのではないだろうか?
7. 経済学の2つのアプローチ
Lecture 17
} 制度的知識: “事実”をじっくりと調べる
} 表面的な知識だけでは経済の動きを掴むことが難しい
} 理論的な指針がないと、何が“事実”かの特定も困難
} 経済理論: 現象の背後にある“法則”を探す
} 経済理論の構築に数学は絶大な効果を発揮!
} 制度的知識を補完:2つのアプローチはどちらも重要
Q: 経済(学)の法則っていったい何?
A: 各人は自分にとって得になるように行動する(「イン
センティブに従って行動する」と同じ意味)
11. 戦略的状況の例
Lecture 111
例: グーグル vs. アップル
} グーグルの最適な戦略はグーグルがアップルの行
動をどう予想するかによって決まる
} ここでアップルの行動はアップルがグーグルの行動をど
う予想するかによって決まる
} グーグルの最適な戦略はグーグルが「アップルが
グーグルの行動をどう予想するか」をどう予想する
かによって決まる
} グーグルの最適な戦略はグーグルが「アップルが
「グーグルがアップルの行動をどう予想するか」をど
う予想するか」によって決まる
以下、無限に続く… (予想の「無限後退」と呼ばれる)
15. ビューティフル・マインドの生んだ発見
Lecture 115
} John Nash (1950)がゲーム理
論のザ・解概念を確立!
} (ナッシュ)均衡においては、
(誰にとっても)自分一人が行
動を変えても得できない
} この解はほぼ常に存在する
} ジョン・ハーサ二とラインハー
ト・ゼルテンがその後ナッシュ
均衡を大幅に拡張
} ゲーム理論の爆発的な応用の
きっかけとなる
⇒ゲーム理論による革命!
天谷(14-15ページ)
17. 静かな革命はつづく…
Lecture 117
【1994以降のゲーム理論関連のノーベル賞(経済学)】
} 1996: マーリーズ、ヴィックリー
} for their fundamental contributions to the economic theory of
incentives under asymmetric information.
} 2001: アカロフ、スペンス、スティグリッツ
} for their analyses of markets with asymmetric information.
} 2005: オーマン、シェリング
} for having enhanced our understanding of conflict and
cooperation through game-theory analysis.
} 2007: ハーヴィッチ、マスキン、マイヤーソン
} for having laid the foundations of mechanism design theory.
20. 囚人のジレンマ:ストーリー
Lecture 120
} AさんとBさんの2人がある犯罪容疑で逮捕された!
} 有罪にするだけの証拠がなく、検事は自白が頼り(焦)
} そこで、次のような司法取引を容疑者に持ちかけた…
} 2人とも自白すれば、A、Bともに懲役3年
} 2人とも黙秘すれば、A、Bともに懲役1年
} Aが自白、Bが黙秘すれば、Aは釈放、Bは懲役5年
} Bが自白、Aが黙秘すれば、Bは釈放、Aは懲役5年
} まず、このゲームを表の形でまとめてみよう!
} プレイヤー、戦略、利得が一目で分かるようになる
天谷(20-21ページ)
23. 囚人のジレンマ:注意点
Lecture 123
} このゲームでは個々のプレーヤーが最適戦略を持つ
} 【最適戦略(支配戦略)】 他のプレーヤーたちがどのような行
動を選択しても、自分がある特定の行動Aを選ぶことによって
利得が最大化されるとき、行動Aを「支配戦略」と呼ぶ。
} 支配戦略の組み合わせは必ずナッシュ均衡になる!
} 支配戦略が存在しないゲームもたくさんある
} 各人の最適な意思決定 ≠
全体にとっての効率性
} ナッシュ均衡が全体にとって望ましい結果(パレート効率的な
結果)をもたらすとは限らない!
} 「アダム・スミスは間違っていた!」(映画『ビューティフル・マイ
ンド』のナッシュの台詞)を簡潔に体現している
天谷(24-25、40-41ページ)
25. 囚人のジレンマの応用例
Lecture 125
現象 プレイヤー 「協力」 「裏切り」
軍拡競争 国 軍縮 軍拡
国際貿易政策 国 関税引き下げ 税率据え置き
男女間の協力 カップル 相手に従う 相手に要求
公共財供給 地域住民 貢献/負担 ただ乗り
森林伐採 きこり 控えめに伐採 とれるだけ伐採
天谷(24-25ページ)
30. コーディネーションゲーム:分析1
Lecture 230
} 最適戦略(支配戦略)は存在しない!
} 相手がMacなら自分もMac、相手がWinなら自分もWinが得
} 最適な行動が相手の行動によって変化する!
} 個人の合理性だけからでは問題を解くことができない
} 囚人のジレンマのようにはいかない
} 「ナッシュ均衡」の考えを使う必要がある!
} 一見するとベストな結果(Mac, Mac)が選ばれそうだが…
} まずはナッシュ均衡の定義をおさらいしよう!
天谷(72-73、48-49ページ)
32. コーディネーションゲーム:分析2
Lecture 232
} このゲームには2つナッシュ均衡がある!
} (Mac, Mac)と(Win,Win)のどちらもナッシュ均衡
} ナッシュ均衡の見つけ方 →天谷(56-59ページ)
} コーディネーションゲームのように
} (一般に)ナッシュ均衡は複数存在する場合がある
} プレイヤー全員にとってあるナッシュ均衡よりも別のナッシュ均衡の
方が望ましい場合もある
} 良い均衡(Mac, Mac)ではなく悪い均衡(Win,Win)が選ばれ
てしまう危険性がある
} 「コーディネーションの失敗」と呼ばれる
} 失敗を防ぐには? →天谷(74-75ページ)
天谷(72-73ページ)
34. 男女の争い:分析
Lecture 234
} このゲームにもナッシュ均衡が2つ!
} (遊園地、遊園地)と(野球、野球)のどちらもナッシュ均衡
} 今回は “良い”(“悪い”)均衡は存在しない
} 双方にとって「より望ましい均衡」というものがない!
} 状況が対称的でどちらの均衡が実現しそうか分からない
} 理論以外の要素ーたとえば慣習や文化、規範などーに
よってどちらのナッシュ均衡が選ばれるかが決まる
} 例)レディファースト →(遊園地、遊園地)
} 例)男社会(?) →(野球、野球)
天谷(80-81ページ)
38. 1. 合理的な推論
Lecture 238
} 個々のプレーヤーの合理性だけで解けるゲームもある
} 合理性:自分にとってより高い利得をもたらす行動を選ぶ
} 最適戦略(支配戦略)がある場合:例)囚人のジレンマ
} すべてのプレーヤーに支配戦略が無いゲームでも解け
る場合がある
} 「支配される戦略の逐次消去」(後述)
} (お互いの行動に関する)「正しい予想の共有+合理性」
によってナッシュ均衡は実現する!
} いかにして正しい予想が形成されるかが重要…
39. 2. 目立つ均衡(フォーカル・ポイント)
Lecture 239
} 個々人の推測だけから正しい予想が共有されることも!
} 実験)都内の地下鉄の駅を一つを選んで駅名を紙に書く
} 一番多い答えを書いていれば勝ち(利得が1)
} それ以外は負け(利得は0)
} 周りのプレーヤーが書きそうな駅名をうまく予想するのがミソ
⇒どんな駅名が“目立つ”のかを考えよう!
} 潜在的なナッシュ均衡は駅名の数だけ存在する
} しかし、状況によって非常に目立つ均衡がある場合も
} トーマス・シェリングが最初に発見⇒「フォーカル・ポイント」
40. 3. 自発的に守られる口約束
Lecture 240
} ナッシュ均衡は、ゲームの外部で罰則や報酬がいっさい
与えられない状況でも口約束によって達成できる
} 相手が口約束にしたがって(ナッシュ均衡の)行動をとるので
あれば、自分にとっても約束した(ナッシュ均衡の)行動を選
ぶのが最適!⇒合意が“自己拘束的”
} ナッシュ均衡ではない結果は達成不可能
} 口約束の結果がナッシュ均衡ではないので、少なくとも一人
は約束をやぶって他の行動をとることで得できる人がいる
} ナッシュ均衡=「自己拘束的な合意」
41. 4. 試行錯誤の結果
Lecture 241
} 繰り返しゲームを行い経験を積むことで予想を共有
} コーディネーションゲームの例
} エスカレーター(左側と右側どちらに並ぶか)
} ビデオテープ規格(VHS vs. ベータ)
} キーボード配列(QWERTY型 vs. DVORAK型)
} ゲームが行われる初期の段階でどのような行動がとら
れたか、という“歴史”が均衡を決定する上で重要
} ポール・デイヴィットが提唱 → 「経路依存性」
42. 合理的なプレーヤーの行動
Lecture 242
} 合理的な(利得を最大化する)プレーヤーは
} 支配戦略があれば常にそれを選択する
} 強く支配される戦略は絶対にとらない
} 戦略Bが戦略Aに「強く支配される」
} 相手がどんな行動をとってきたとしても、自分が戦略Aを選ん
だ場合の利得が戦略Bを選んだときの利得よりも常に大きい
} 戦略Bが戦略Aに「弱く支配される」
} 相手がどんな行動をとってきたとしても、自分が戦略Aを選ん
だ場合の利得が必ず戦略Bを選んだときの利得以上になる
44. 合理的な豚:分析
Lecture 244
} 子豚には最適戦略(支配戦略)が存在する!
} 大豚の行動によらず「待つ」のが常に最適
} 子豚が合理的ならば絶対にスイッチを押さない
} 子豚の「スイッチを押す」は可能性から消去される
} 大豚は子豚が「待つ」を選ぶので「スイッチを押す」
} 子豚の行動を織り込んでしぶしぶスイッチを押す羽目に…
} (スイッチを押す、待つ)が実現される
} これがこのゲームの唯一のナッシュ均衡
} 合理的な推論からナッシュ均衡が導かれた!
天谷(44-45ページ)
47. 支配される戦略の逐次消去
Lecture 247
} 強く支配される戦略はとられないことに注目!
1. プレイヤー2の「右」は「真ん中」に強く支配される
} プレイヤー2の「右」を消去
2. プレイヤー1の「下」は「上」に強く支配される
} プレイヤー1の「下」を消去
3. プレイヤー2の「左」は「真ん中」に強く支配される
} プレイヤー2の「左」を消去
4. (上、真ん中)のみが逐次消去によって生き残る!
} この結果(上、真ん中)は唯一のナッシュ均衡に一致
} 一見すると複雑なゲームでも合理的な推論から解けた!
} 逐次消去で残った行動の組にナッシュ均衡は含まれる?
天谷(46-47ページ)
50. 鹿狩りゲーム:分析
Lecture 250
} このゲームには2つナッシュ均衡がある!
} (シカ、シカ)(ウサギ、ウサギ)のどちらもナッシュ均衡
} コーディネーションゲームの一種と考えられる
} どちらの均衡の方がもっともらしい?
} (シカ、シカ)は2人にとって望ましい効率的な均衡だが…
} (ウサギ、ウサギ)の方が実現しやすい可能性がある
} 相手がランダムに戦略を選んでくる場合には
} 「シカ」よりも「ウサギ」を選ぶ方が(期待)利得が高い!
} 「ウサギ」=リスク支配戦略、(ウサギ、ウサギ)=リスク支配均衡
} この例のように、リスク支配均衡が効率的とは限らない…
60. もう少し複雑なゲーム
Lecture 360
} 今まで扱ってきたゲームの共通点
1. ゲームを利得表で表すことができた
2. ナッシュ均衡が(ひとつは)必ず存在した
} 今回の講義で取り上げるゲーム
1. 利得表で表すことができない(難しい)ようなゲーム
} 戦略がたくさんある(無限個も含む)ゲーム
} プレーヤーが3人以上のゲーム(ただし今回は扱わない)
2. ナッシュ均衡が“ない”ゲーム
} 戦略を適切な形で拡張するとナッシュ均衡が“ある”
} ほとんどのゲームでこのナッシュ均衡がきちんと存在する
62. 立地ゲーム:ナッシュ均衡
Lecture 362
} このゲームにはナッシュ均衡がひとつだけ存在する
} どちらのお店も真ん中(=50)に立地する!
} 「最少差別化の原理」(Principle of Minimum Differentiation)
なぜこうなるのだろうか? 2つのお店が
1. 異なる場所を選ぶのは(ナッシュ)均衡にならない
} 相手の立地により近づくと必ずお客が増える
2. 真ん中以外の同じ場所を選ぶのも均衡にはならない
} 左右どちらかに少し動くとお客が急に増える
3. 真ん中をともに選ぶ場合はナッシュ均衡になる!
} どこに立地を変えても客の数が減ってしまう
天谷(90-91ページ)
63. 立地ゲーム:応用例
Lecture 363
} どのような現実の現象を説明できるのか?
1. できるだけ多くの客を獲得することを目的としている
2. ライバル同士が同じ土俵(プラットフォーム)で競争していて
3. 競争の結果として同じような戦略を取り合っている状況
プレイヤー
戦略
現象
政党(民主党と自民党)
政策スタンス
中道的な政策(2大政党
制のジレンマ)
コンビニ・チェーン
ロケーション
隣り合うコンビニ
テレビ局
放送時間
同ジャンル番組の集中
メーカー
製品の味や外見など
似たような無難な商品
(家電、コーラ、etc)
天谷(90-91ページ)
64. 合理性で立地ゲームは解けるか?
Lecture 364
} 最適戦略(支配戦略)は存在しない!
} 戦略が連続な数ではなく0から100の整数としよう
} 実は「支配される戦略の逐次消去」でゲームが解ける!
} 【ステップ1】 0は1に、100は99に強く支配される
} 合理的なプレイヤーは端の点(0と100)はとらない⇒消去!
} 【ステップ2】 1は2に、99は98に強く支配される
} 合理的なプレイヤーは端の点(1と99)はとらない⇒消去!
(以下このステップが続く)
} 【ステップ50】 49、51はそれぞれ50に強く支配される⇒消去
⇒どちらのプレーヤーも50(真ん中)を選ぶ!
66. 価格競争ゲーム:ナッシュ均衡
Lecture 366
} このゲームにはナッシュ均衡が一つだけ存在する
} どちらもコストに一致する価格をつける: p(価格) = c (コスト)
} つまり利潤がゼロに!
なぜこうなるのか? 2つの企業が
1. 異なる価格を付けるのは(ナッシュ)均衡にならない
} 必ずどちらか片方の企業は価格を変えて得できる
2. コスト以外の同じ価格をつけるにも均衡にならない
3. 限界費用と一致する価格を共につけるのは均衡!
} 値上げしても利潤は0のまま、値下げはマイナスの利益=損
⇒利得表や最適化の手法でなく論理的に均衡を導出!
67. ベルトラン・パラドックス
Lecture 367
} 2企業間の競争で価格が一気に限界費用まで下がる
} 1社増えるだけで1企業の独占価格から完全競争価格に!
} 実際には、ベルトランモデルのような価格競争が行われ
ている(ように見える)産業でも価格は急落しない
} 現実とのギャップ=「ベルトラン・パラドックス」
ベルトラン・パラドックスを解く3つの理由
} 【製品差別化】 相手よりも高くてもある程度は売れる
} 【生産量制約】 安価では市場需要をすべて満たせない
} 【動学的競争】 時間を通じて暗黙のカルテル、共謀
70. ベルトランかクールノーか?
Lecture 370
} 次のような疑問がわいてくるかもしれない
} 「どちらのモデルが優れているのか?」
} 「なぜ複数のモデルを必要とするのか?」
} ベルトランとクールノー、どちらのモデルも、各企業が価
格と数量(生産設備)を共に選べるような一般的な寡占
市場競争の一面を捉えたものと解釈できる
} 状況に応じてより適したモデルを採用すべき
} 【ベルトラン】 企業が数量(の上限)を価格よりも早く調整でき
るような産業: 例) ソフトウェア
} 【クールノー】 価格の方が数量よりも早く調整されるような産
業: 例) 小麦、セメント
71. ゲーム理論が変えた寡占市場の見方
Lecture 371
} 1970年代まで
} 戦略的な状況が生じる寡占市場(不完全競争)を分析する統
一的な視点がなく、バラバラな分析の寄せ集めだった
} 1980年代以降
} ゲーム理論が積極的に応用され、性質の異なる市場を異なる
ゲームとして定式化するようになった
} 市場ごとに異なる解が存在するのではなく、ナッシュ均衡とい
う単一の解で様々な寡占市場が統一的に分析できる
⇒きちんと個々の寡占市場の特徴を把握してゲームとして
定式化すれば、あとはナッシュ均衡を求めれば良い!
73. ナッシュ均衡が“ない”?
Lecture 373
} ゼロサムゲームの特徴
} 相手の裏をかくのが常に最適
} お互いが納得できるWin-Winの状況がない
} ゼロサムゲームの例
} 【ポーカー】 ブラフ(はったり)を「かける」か「かけない」
} 【戦争】 「海側」から攻める/守る、「陸側」から攻める/守る
} 【テニス】 「中央」にサーブ/備える、「端」にサーブ/備える
} プレーヤーは常に相手の裏をかこうとする
} 安定的な状況(ナッシュ均衡)は存在しない??
天谷(62-63ページ)
74. 混合戦略:行動を確率的に選択する
Lecture 374
} 混合戦略
} 複数の行動を確率的に混ぜてプレーする
} じゃんけんなどで無意識に行っている“戦略”
} 純粋戦略
} 特定の行動を確実に(確率1で)選ぶ:今までの“戦略”
} 混合戦略の特殊ケースとみなすことができる
} 戦略を混合戦略に拡張してナッシュ均衡を定義!
} すべてのプレーヤーにとって、自分一人だけが(混合)戦略を
変えても得できないような混合戦略の組み合わせ
} 合理的なプレーヤーは利得の「期待値」を最大化すると仮定
} ノイマン&モルゲンシュテルンによる「期待効用理論(仮説)」
天谷(62-63ページ)
78. 混合戦略(ナッシュ)均衡の確認
Lecture 478
} 無差別条件から q = p = 0.5 が求まった
} これはきちんと混合戦略均衡になっているか?
} どちらのプレーヤーも戦略を切り替えても利得が一定
} 相手が半々で表裏を選ぶ時に、自分も半々で表裏を選ぶの
が最適戦略のひとつにきちんとなっている
} お互いに最適な戦略を取り合っている →
ナッシュ均衡!
} 混合戦略均衡では、均衡戦略をとる強いインセンティブ
が無さそうに見えるが…
} お互いに相手の裏をかこうとすると自然とナッシュ均衡に!
天谷(64-67ページ)
82. 無差別条件を使って解く!
Lecture 482
} プレーヤー1の選択が無差別になるためには
} -2p’ + (1-p’) = p’ - (1-p’), よって p’ = 0.4.
} プレーヤー2の選択が無差別になるためには
} 2q’ - (1-q’) = -q’ + (1-q’), よって q’ = 0.4.
} 混合戦略の組 (p’, q’) = (0.4, 0.4) が唯一のナッシュ均衡
} 変形前の均衡 (p, q) = (0.5, 0.5) はもはや安定ではない
} 均衡においてプレイヤー2は、一見すると有利に見える「表」を
以前よりも低い40%の確率でしか選択しない!
天谷(64-67ページ)
84. 動学的なゲーム:参入ゲーム
Lecture 484
} プレーヤーは2種類の企業
} 既存企業と(潜在的な)参入企業
} まずはじめに参入企業がこの独占市場に「参入する」か「しな
い」かを決定する
} 後者の場合ゲームはただちに終了
} 参入企業は 0、既存企業は 4 の利得を得る
} 前者の場合、既存企業が次の意思決定を行う
} 参入が起こった場合に既存企業は「価格競争」するか「しな
い」かを決定する
} 前者の場合、両企業はそれぞれ -1 の損失を被る
} 後者の場合、両企業はそれぞれ 1 の利得を得る
天谷(94-95ページ)
91. 逐次手番ゲームの例:Not 21
Lecture 491
} 2人のプレーヤーが交互に数字を数え上げていく
} 各プレーヤーは1~3個の連続した数字を数える
} 最後に21の数字を数えたプレーヤーが負け
} 「Not XX」は一昔前に結構流行ったゲーム(のハズ)
} 先手もしくは後手に必勝戦略(必勝法)はあるだろうか?
} あるとしたらそれはいったいどんな戦略か?
} ネタバレになってしまうので必勝法は講義で…
} もしも数字が他の数だったらどのように必勝法は変わる?
92. ツェルメロの定理と“必勝法”
Lecture 492
} どのような動学的な2人ゲームにおいても
1. 結果が「勝ち」か「負け」しかなく
2. プレイヤーが交互に行動を選択し
3. 過去のプレーをすべて観察することができ
4. 偶然の要素による影響が全くなく
5. 必ず有限回の手番でゲームが終わる
のであれば、どちらかのプレイヤーに必ず必勝戦略がある
} 【必勝戦略】 相手がどんなプレーをしてきても、必ず自分が
最終的に勝利できるような(動学的な)戦略
} 上の条件を満たせば必勝法は必ず存在する!
} オセロ、チェス、将棋、囲碁には必ず必勝戦略がある!
95. シュタッケルベルグ・モデル
Lecture 495
} クールノー・モデルの逐次手番バージョン
} メーカーA(リーダー)が先に生産量を決定
} それを見た後にB(フォロワー)が生産量を決定
} ゲームを後ろから解くと…
} メーカーAの生産量と利潤が増えて、Bのそれらは減る
} 「コミットメント」による利益
} Aは少なくともクールノー・モデルの利潤は獲得できる
} 400を選べばクールノー・モデルと同じ結果になるから
} Bは情報をたくさん得ているが、むしろ利得は低下してしまう
} 戦略的な状況では情報が多いほど有利とは限らない!
101. コミットメントの具体例
Lecture 4101
} 家電量販店などの「最低価格保証」
} 他店よりも1円でも高い商品があれば値下げします
} 事後的には最適ではない「価格競争」にコミットすることにより、
ライバル店の値下げを牽制する効果が期待できる!
} 代理人(エージェント)へ交渉や仕事を依頼する
} 代理人には条件を譲歩する権限が無い
} 交渉の余地がないことをコミットすることができる
} ソフトウェアの「オープンソース」化
} 市場を独占化しないことにコミットする
} ユーザーが安心してそのソフトを使えるように
天谷(108-109、116-117ページ)
107. 有限回繰り返しゲーム
Lecture 5107
} 動学ゲームの一種 → 後ろ(最終期)から解くべし!
1. 一番最後のステージゲームのナッシュ均衡を求める
2. その結果をもとに、最後から二番目のゲームを分析
3. 以下、順番に最初までさかのぼって全体のゲームの均衡
(これを「部分ゲーム完全均衡」と呼ぶ)を求める
} ステージゲームにナッシュ均衡が一つしかない場合
} 毎期(それまでの歴史と関係なく)そのナッシュ均衡をプレーし
続けるのが、唯一の部分ゲーム完全均衡となる
} ステージゲームのナッシュ均衡が複数の場合
} 様々な結果が均衡として実現できる → 詳しくは後述
天谷(196-197ページ)
110. 有限回繰り返しゲームの罠
Lecture 5110
} Tはどんなに大きい数でも構わない
} いつかこの世界(人類の歴史)は終わる → Tは有限
} 疑問) だとすると、今すぐお金が使えなくなるのでは?
} 「有限の長さでゲームが終わる」のと「T期でゲームが終
わることが確実に分かっている」のは全く異なる状況
} ゲームを後ろから解くためには、プレーヤーたちがいつゲー
ムが終わるのかをお互いに正確に知っている必要がある
} 知らない場合には、常に将来の可能性を考慮するはず!
} 例) 今期裏切ったら、将来お仕置きされるかもしれない…
} 実は「無限回繰り返しゲーム」として分析する方が適切
111. 将来の価値を「割り引く」とは?
Lecture 5111
} 無限回繰り返しゲームでは、将来の利得を「割り引く」
} 来期の利得は、今期と比べて小さく(δ倍で)評価される
} この(1より小さい)δを「割引因子」(discount factor)と呼ぶ
} 割引因子が大きい = 将来を重視(忍耐強い)
} 割引因子が小さい = 現在を重視(刹那的?)
} さまざまな理由によって将来は割り引かれる
} 利子の存在: 金銭リターンは利回りで調整して評価する
} 主観的割引: 今すぐもらえる利得を将来の利得より重視する
} ゲーム終了リスク: ゲームが終わる危険性を考慮する
天谷(184-185ページ)
116. 協力を達成するための条件
Lecture 5116
} 次の形で定義される「トリガー戦略」を考える
} 最初の期には(協力、協力)をプレーする
} 過去に誰も裏切らない限り、(協力、協力)をプレーし続ける
} もしも誰かが裏切った場合には、次の期以降ずっと(その後に
何が起きようが)(裏切り、裏切り)をプレーし続ける
} 協力を達成するためには、裏切りがもたらす将来の損失
が短期的な利益よりも大きくないといけない
3/12
1
1
...221...2223 22
≥⇔
−
≤⇔
++≤⇔+++≤
δ
δ
δ
δδδδ
天谷(182-183、186-189ページ)
119. 共有地の悲劇と共有地の統治
Lecture 5119
} 一般に、共有資源(コモンズ)の管理は難しい
} 各人に消費/利用し過ぎるインセンティブが発生
} 例) 漁場の乱獲、森林破壊、環境汚染、温泉の枯渇
} 「共有地の悲劇」(Tragedy of Commons)と呼ばれる
} 伝統的な経済学による解決策
} 私有化: 共有地を区切って私有化してしまう
} 政府管理: 政府に直接管理を委ねて、利用料を適切に課す
} 「共有地の統治」 by オストロム(2009年ノーベル賞)
} 共有地を地元住民が(長期的関係を通じて)自分たちで統治
122. 複数のナッシュ均衡をうまく使う
Lecture 5122
} ステージゲームにナッシュ均衡が3つある
} 第2期はこの3つのどれかをプレーせざるを得ない
} 第1期のプレーに応じて、第2期のプレーを変えられる!
1 ╲ 2
X
Y
Z
A
7, 7
4, 8
1, 9
B
8, 4
5, 5
0, 0
C
9, 1
0, 0
0, 0
1が裏切った場合
2が裏切った場合
(A,X)がプレー
された場合