人間の意思決定を機械学習でモデル化できるか

人間の意思決定を機械学習でモデル化できるのか
意思決定理論と機械学習 (ニューラルネット) の融合

意思決定理論と機械学習
人間の意思決定のメカニズムを機械学習によってモデル化できるか
意思決定理論
合理性のない判断をすることもある
(サンクコスト効果、決定回避...)
機械学習
データに基づいて判断を下す
(ニューラルネット、SVM…)

文献情報
● タイトル：
Using large-scale experiments and machine learning to discover theories of human
decision-making
● 著者：Peterson et al. ← プリンストン大のコンピュータサイエンス
● ジャーナル：Science
● 出版年：2021
● サマリ：
機械学習を用いて、人間の意思決定を説明するモデルを探索しようという論文。「既存モデ
ルをベースにした機械学習モデル」、「既存モデルを使わない機械学習モデル」、「既存モ
デルに選択を加えた混合の機械学習モデル」の3つでよいパフォーマンスを実現できた。

どちらのくじを引きたい？
A: 確実に1600円もらえるくじ
B: {60%→100円、10%→4400円、10%→4800円、20%→5000円} のくじ
A: 1600円を確実に引けるくじ B: 確率によって報酬がかわるくじ

意思決定理論
● 意思決定理論とは、「人々はどのように意思決定（複数の選択肢からどれを
選ぶか）を行っているのか？」という問いの探求
● 社会科学（特に経済学）では、合理的な人間観の上に立てられたモデルが多
数。
○ 合理的とは、一貫した物差しで選択肢を比べ、それに従ってより良い選択をするということ
● しかし実際は、人間が一貫した物差しで合理的な行動をするとは限らない！
○ 先ほどの例だと、くじAの期待値が1600円、くじBの期待値が1980円で、期待値を最大化す
るという合理的な行動を取るならくじBを引くはずだが、必ずしもそうはならない

意思決定のモデル化の歴史
● 期待効用理論
○ サンクトペテルブルクのパラドックス (人間が必ずしも期待値を元に意思決定をしないことを表す)
■ 極めて小さい確率で極めて大きな報酬が発生することにより発散した期待値が、現実の感覚と相反す
るという現象
○ 必ずしも「金額 = 効用(嬉しさ)」ではない
● プロスペクト理論
○ アレのパラドックス
■ 期待効用理論における独立性の公理に対する反例
■ リスクがある選択では、発生確率によって一貫性のない選択を行う現象
○ 必ずしも「実際の確率 = 人が感じる確率」ではない
● その後も、パラドックスを手がかりに理論を探索・拡張。
累積プロスペクト理論など、たくさんのモデルの乱立。

機械学習アプローチと2つの工夫
くじを入力にして人間の意思決定を出力とする“理論”の探索は難しい
∵ 入出力ともに広大な探索空間（くじの選択肢がd個なら。）
1. 大量のデータ
a. 今までで最大の研究の30倍以上（約9000種類のくじ）
2. 解釈可能性を保つ
a. 既存の理論的な枠組みを機械学習で表す

既存の意思決定のモデルから機械学習のモデルへ
● 意思決定には様々な変数が考えられ、それを元に多くの意思決定モデルが構
築されている
● 意思決定を機械学習のモデルで表現する
期待値
効用
感覚的な確率
・・・
意思決定モデル
(e.g. 期待効用理論, プロスペクト理論)
機械学習のモデル

期待効用理論とプロスペクト理論をNNで探索
● 期待効用（Expected Utility）理論の場合
○ くじAの価値：
ただし、x は金額、p は確率、u(•) が効用関数（例えば右上の図）。
○ 機械学習(Neural Nets)は、効用関数の形の探索に限定。“Neural EU”と呼ぶ。
● プロスペクト理論（Prospect Theory）では主観確率も考えるようにモデル
を拡張
○ くじAの価値：
ただし、π(•) は主観確率関数。NNはuとπの形の探索にのみ使う。“Neural PT”と呼ぶ。

Neural EU vs Neural PT
1. Neural EUは、古典的に提案されてきたモデルを上回った。
a. ただし、モデルの評価は、cross-validationによって行う。
→ 汎化性能を測っているので、複雑なモデルの過学習への罰則も考慮されている。
b. 学習された効用関数 u(•) の形は、既存理論と整合的。（逓減する・損失と利得で非対称）
2. Neural PTはNeural EUを上回った。
a. つまり、恐らく主観確率の効果は重要。
b. 主観確率関数 π(•) の形には、2~3割の確率を過大評価する傾向という新しい発見があった。

既存意思決定モデルを使わない機械学習のモデル
● 既存のモデルを無視してデータのみから機械学習のモデルを構築
● 機械学習のブラックボックスの話と同じように、解釈は困難になる
期待値
効用
感覚的な確率
・・・
意思決定モデル
(e.g. 期待効用理論, プロスペクト理論)
既存の意思決定モデルは使わない

既存意思決定モデルを使わない機械学習のモデルの精度
事前にモデルを仮定しないモデルが、非常に良い精度に至った。
● くじAを（くじBに対して）選ぶ確率：
→ ただし、滑らかな関数である以外に制約はなく、関数の解釈はムリ。
● くじAの価値が、くじBとの比較においてのみ決まるので、
“文脈依存的（context-dependent）”なモデルだと言える。
学習データの量
汎化誤差

複数の意思決定のモデルを混合した機械学習モデル
● 人は状況に応じて選択の戦略を変える
● 複数の意思決定モデルを使って機械学習モデルを構築
期待値
効用
感覚的な確率
・・・
複数の意思決定モデル

複数の意思決定のモデルを混合した機械学習モデルの性能
二つのモデル（EUとPT）を使い分ける混合モデルが、少ないデータ量で汎化誤
差が小さくなり、Context-Dependentモデルと同等の精度を達成した。
○ 既存のモデルが新しいモデルにもよい影響を与えている！
○ EU/PTの u・π の形は、それぞれ既存理論に整合的。（下図B）
○ さらに、モデルの使い分けは、くじの確率 (probability-based) よりも結果報酬 (outcome-
based) に依存していることがわかった。
学習データの量
汎化誤差

まとめ
● 大量データがあれば機械学習で意思決定モデルを探索が可能。
● 「既存の意思決定モデルをベースにしたモデル」と「意思決定モデルを仮定しないContext-
Dependentモデル」と「意思決定モデルを選択させる混合モデル」の3つを解説。
○ 既存の意思決定モデルベースにしたモデルは、既存モデルでもよい性能を示した。
○ Context-Dependentモデルは、解釈は困難だがデータが多量にあるときに最もよい性能を示した。
○ 混合モデルは、Context-Dependentモデルより少ないデータで同等のパフォーマンスを示した。
● 「少ない確率のとき過大評価する」、「戦略の選択は確率よりも報酬が影響する」という発
見もあった。
● 1) 大量のデータを集め、
2) 既存の理論を帰納の枠組みとして生かしながら、
3) 機械学習技術をフルに使って（汎化誤差の最小化をアルゴリズミックに行い）、
4) 広大な空間から理論を探索する
という方法論は強力で、意思決定理論以外（例えば、道徳的判断やリスク認知など）同様の革新的な研究をも足ら
せる可能性がある

チャンネル紹介
● チャンネル名: 【経営xデータサイエンスx開発】西岡賢一郎のチャンネル
● URL: https://www.youtube.com/channel/UCpiskjqLv1AJg64jFCQIyBg
● チャンネルの内容
○ 経営・データサイエンス・開発に関する情報を発信しています。
○ 例: アジャイル開発、データパイプライン構築、AIで使われるアルゴリズム4種類など
● noteでも情報発信しています → https://note.com/kenichiro

人間の意思決定を機械学習でモデル化できるか

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (20)

Mehr von 西岡賢一郎

Mehr von 西岡賢一郎 (20)

Kürzlich hochgeladen

Kürzlich hochgeladen (11)