Weitere ähnliche Inhalte
Mehr von NTC.im(Notch Training Center) (7)
從Alpha go四勝一敗。看Deep Learning 發展趨勢 - 台大電機系 于天立教授
- 3. 從 DeepBlue 到 AlphaGo
• 1997 IBM DeepBlue 擊敗 Kasparov (一秒評估約 108 盤面狀況).
• 2012 Zen (on 4 PCs) 在被讓四、五子下擊敗武宮正樹
• 2013 CrazyStone 在被讓四子下擊敗石田芳夫
• 2015 10月 AlphaGo 在分先以 5:0 擊敗歐洲圍棋冠軍華裔法籍棋
士樊麾二段。電腦圍棋程式第一次公平擊敗職業圍棋棋手。此一
結果刊載在Nature期刊。
• 2016 3月 AlphaGo 4:1 擊敗李世石九段(近十年來最多次世界冠
軍得主,目前GoRating排名第5)
• AlphaGo目前GoRating排名第2, 獲職業九段認証
- 14. 結合supervised learning and RL
• AlphaGo 從KGS上蒐集了160,000個業餘棋譜共約30,000,000個
盤面狀況 (大數據分析) 訓練policy network
• 透過自我對奕,勝方增強P(a|s),輸方減低P(a|s)
• Value network也利用搜尋的結果來做RL,進而學習到更精準的
勝率估計
- 17. 分散式及平行運算
• 單機版 AlphaGo: 48 CPU + 8 GPU。
• 分散式版 AlphaGo:1202 CPU + 176 GPU。
• GPU: TESLA S1070
• 960 核 (1.3 GHzs)
- 18. 越多核就越快?
• Amdahl’s Law
• 若一演算化有一半可被平行化,則
就算給無窮的運算資源也僅僅能加
速兩倍。
• 若考慮產生/結束執行緒的cost,
有時使用過多的核心數反而效能降
低。
加速 =
1
1 − 可平行化比例 +
可平行化比例
核心數