4. 4
● “The Bitter Lesson” (苦い教訓) http://www.incompleteideas.net/IncIdeas/BitterLesson.html
○ 強化学習の創始者 Richard Sutton の投稿
○ 長期的に見ると、
“人間のドメイン知識を利用したアプローチ” よりも
“シンプルで汎用的な方法を用いて計算力に頼る” 方法が効果的であった。
○ 例1:チェス
○ 例2:画像認識
長期的に価値の出る研究方針
既存研究
人間の理解やチェス独自の構造を取
り入れたアルゴリズム
Deep Blue
膨大な探索
1997 World Championに勝利
既存研究
edge, cylinder, SHIFTといった特徴量
の抽出を人手で設計
Covolutional Neural Network (CNN)
シンプルな計算の層を積み重ね、
計算力に頼って、自動で特徴抽出を 学習
2012 画像認識コンペでスコア大幅更新
5. 5
● “The Bitter Lesson” (苦い教訓) http://www.incompleteideas.net/IncIdeas/BitterLesson.html
○ まとめ
○ One thing that should be learned from the bitter lesson is the great power of general purpose methods, of
methods that continue to scale with increased computation even as the available computation becomes very great.
The two methods that seem to scale arbitrarily in this way are search and learning.
○
○ 10年くらいの長いスパンで見てみると、汎用的な手法を用いて
計算能力の向上の恩恵を直接受けられるメリットが大きくなる。
○ 特に探索と学習はどこまでもスケールする。
長期的に価値の出る研究方針
14. 14
● 画像生成
○ DALL-E2, Imagen, Midjourney, Stable Diffusion
○ 汎用的に使える。いろいろなタスクに使える。
● “a gentleman otter in a 19th century portrait” by Stable Diffusion
Foundation Model (基盤モデル)
https://replicate.com/api/models/stability-ai/stable-diffusion/fi
les/8d6a8069-b91f-4e61-8136-fa7c0775532c/out-0.png