SlideShare ist ein Scribd-Unternehmen logo
1 von 22
從AlphaGo四勝一敗
看Deep Learning發展趨勢
臺大電機系
于天立
tianliyu@ntu.edu.tw
Outline
• 電腦圍棋進展
• 傳統技術
• 蒙地卡羅法
• Convolutional 神經網路
• 加強式學習
• 分散式/平行運算
• Deep Learning 應用及未來展望
從 DeepBlue 到 AlphaGo
• 1997 IBM DeepBlue 擊敗 Kasparov (一秒評估約 108 盤面狀況).
• 2012 Zen (on 4 PCs) 在被讓四、五子下擊敗武宮正樹
• 2013 CrazyStone 在被讓四子下擊敗石田芳夫
• 2015 10月 AlphaGo 在分先以 5:0 擊敗歐洲圍棋冠軍華裔法籍棋
士樊麾二段。電腦圍棋程式第一次公平擊敗職業圍棋棋手。此一
結果刊載在Nature期刊。
• 2016 3月 AlphaGo 4:1 擊敗李世石九段(近十年來最多次世界冠
軍得主,目前GoRating排名第5)
• AlphaGo目前GoRating排名第2, 獲職業九段認証
MiniMax 搜尋
• 兩人零和回合制對局
Pruning
• 並非每個節點都需要搜尋
• 即使不去評估某些節點,我們仍知道左邊是最佳選擇
MAX
MIN
MAX
圍棋的困難度
• 19x19,第一手即有361種可能,
雖然考慮對稱性並沒那麼多,
但對稱在第4、5手後即幾乎消
失殆盡。
• 估計約 2×10170 種合法盤面
• 西洋棋約為1047 種合法盤面
• DeepBlue所使用的MiniMax及
Alpha-Beta Pruning難以實現。
蒙地卡羅法
• 隨機產生x=0~1, y=0~1.
• x2+y2 < 1 的機率為𝜋/4
• 加權蒙地卡羅法被使用於各式市調
蒙地卡羅樹狀搜尋(MCTS)
• 利用隨機隨算來搜尋
雖不廣,但可較深
• 早期做法即為
uniform隨機
• 配合多臂吃角子老虎
機技術,對較有希望
的走法做更深入的搜
尋
Neural Networks
• 從perceptron開始(1943)
• 線性分割
• 多層架構
• 可map任意函數
Neural Networks 的衰退
• 1969 MIT Minsky & Papert
• 異同問題
• 連接問題
• 90s 新的結構
Convolutional Neural Networks (CNN)
• 模仿人類視神經
• 利用多層、深度架構,讓網路自行產生特徵
結合CNN和MCTS
• DeepMind (2014被Google收購)
• 兩個CNN,用來縮減MCTS的深度和寬度
• Policy network
在一狀態下執行一動作的可能性(頻率)
P(a|s)
• Value network
估計勝率
加強式學習(RL)
• 將環境的reward (or punishment) 回饋給agent,用來調整每個
狀態的utility (好處)
當前的獎勵 未來可能的好處
結合supervised learning and RL
• AlphaGo 從KGS上蒐集了160,000個業餘棋譜共約30,000,000個
盤面狀況 (大數據分析) 訓練policy network
• 透過自我對奕,勝方增強P(a|s),輸方減低P(a|s)
• Value network也利用搜尋的結果來做RL,進而學習到更精準的
勝率估計
AlphaGo能下出自我風格
• 第一局,李世乭開局使出新招,AlphaGo應
對正確
• 第二局,換AlphaGo開局使出新招
• 第一、二局AlphaGo避劫?
• 第四局AlphaGo亂下、故意輸?
• AlphaGo 中所使用的蒙地卡羅法,所搜尋的
是最大勝率的一步,而並非最好的一步。
分散式/平行運算的威力
• 摩爾定律
• 18~24個月晶片”效能”提高一倍
• 單核效能已接近物理極限
• 往多核心技術發展
分散式及平行運算
• 單機版 AlphaGo: 48 CPU + 8 GPU。
• 分散式版 AlphaGo:1202 CPU + 176 GPU。
• GPU: TESLA S1070
• 960 核 (1.3 GHzs)
越多核就越快?
• Amdahl’s Law
• 若一演算化有一半可被平行化,則
就算給無窮的運算資源也僅僅能加
速兩倍。
• 若考慮產生/結束執行緒的cost,
有時使用過多的核心數反而效能降
低。
加速 =
1
1 − 可平行化比例 +
可平行化比例
核心數
Deep Learning 應用
• 視覺(靜態、動態)、手寫、語音辨識
• 醫療診斷
• 金融分析、預測
• 發明新藥(預測化學反應)
• 資安
AlphaGo打敗李世乭的意義
• 硬體大廠  軟體大廠
• 開發者需正視分散/平行運算
• 半監督式學習架構
• 新的技術、新的結合、新的機會,我們必須與時俱進
• 人類應該害怕嗎?
• 等AlphaGo 不想下圍棋再說吧
下一步?
• 人類懂AlphaGo嗎?
• Convolutional neural network所學習的知識,如何為人類所用?
• 人類  程式語言  電腦
• 電腦  知識庫  人類
Thanks!
Q & A

Weitere ähnliche Inhalte

Andere mochten auch

簡報美學(20160121 於鴻海內湖總部)
簡報美學(20160121 於鴻海內湖總部)簡報美學(20160121 於鴻海內湖總部)
簡報美學(20160121 於鴻海內湖總部)
NTC.im(Notch Training Center)
 
尼爾森店內媒體調查專案公佈
尼爾森店內媒體調查專案公佈尼爾森店內媒體調查專案公佈
尼爾森店內媒體調查專案公佈
Jun-An Wu
 
動腦_數據分析工具_知己知彼百戰百勝_20150811
動腦_數據分析工具_知己知彼百戰百勝_20150811動腦_數據分析工具_知己知彼百戰百勝_20150811
動腦_數據分析工具_知己知彼百戰百勝_20150811
Kay Chen
 

Andere mochten auch (20)

簡報美學課程分享的資源連結(1/21於鴻海大樓)
簡報美學課程分享的資源連結(1/21於鴻海大樓)簡報美學課程分享的資源連結(1/21於鴻海大樓)
簡報美學課程分享的資源連結(1/21於鴻海大樓)
 
簡報美學(20160121 於鴻海內湖總部)
簡報美學(20160121 於鴻海內湖總部)簡報美學(20160121 於鴻海內湖總部)
簡報美學(20160121 於鴻海內湖總部)
 
台灣房地產售價與租價分析
台灣房地產售價與租價分析台灣房地產售價與租價分析
台灣房地產售價與租價分析
 
一夜臺北~訂房網站的大數據分析
一夜臺北~訂房網站的大數據分析一夜臺北~訂房網站的大數據分析
一夜臺北~訂房網站的大數據分析
 
NTC_TENSORFLOW深度學習快速上手班_Part3_電腦視覺應用
NTC_TENSORFLOW深度學習快速上手班_Part3_電腦視覺應用NTC_TENSORFLOW深度學習快速上手班_Part3_電腦視覺應用
NTC_TENSORFLOW深度學習快速上手班_Part3_電腦視覺應用
 
NTC_Tensor flow 深度學習快速上手班_Part4 -自然語言
NTC_Tensor flow 深度學習快速上手班_Part4 -自然語言NTC_Tensor flow 深度學習快速上手班_Part4 -自然語言
NTC_Tensor flow 深度學習快速上手班_Part4 -自然語言
 
TensorFlow 深度學習講座
TensorFlow 深度學習講座TensorFlow 深度學習講座
TensorFlow 深度學習講座
 
30 分鐘學會實作 Python Feature Selection
30 分鐘學會實作 Python Feature Selection30 分鐘學會實作 Python Feature Selection
30 分鐘學會實作 Python Feature Selection
 
資料視覺化 / 数据可视化 Data Visualization
資料視覺化 / 数据可视化 Data Visualization資料視覺化 / 数据可视化 Data Visualization
資料視覺化 / 数据可视化 Data Visualization
 
機器學習工具介紹 / 机器学习工具介绍 Demos for Machine Learning Tools
機器學習工具介紹 / 机器学习工具介绍 Demos for Machine Learning Tools機器學習工具介紹 / 机器学习工具介绍 Demos for Machine Learning Tools
機器學習工具介紹 / 机器学习工具介绍 Demos for Machine Learning Tools
 
TensorFlow 深度學習快速上手班--機器學習
TensorFlow 深度學習快速上手班--機器學習TensorFlow 深度學習快速上手班--機器學習
TensorFlow 深度學習快速上手班--機器學習
 
開放數據助力生態
開放數據助力生態開放數據助力生態
開放數據助力生態
 
CODE4HK - 香港城市數據的視覺化及應用 - 酷茶会95期:创客与城市数据 - 15 may15
CODE4HK - 香港城市數據的視覺化及應用 - 酷茶会95期:创客与城市数据 - 15 may15CODE4HK - 香港城市數據的視覺化及應用 - 酷茶会95期:创客与城市数据 - 15 may15
CODE4HK - 香港城市數據的視覺化及應用 - 酷茶会95期:创客与城市数据 - 15 may15
 
Bigdata 大資料分析實務 (進階上機課程)
Bigdata 大資料分析實務 (進階上機課程)Bigdata 大資料分析實務 (進階上機課程)
Bigdata 大資料分析實務 (進階上機課程)
 
wifi商圈分析-展店汰店
wifi商圈分析-展店汰店wifi商圈分析-展店汰店
wifi商圈分析-展店汰店
 
臺北智慧城市專案辦公室-公共住宅智慧服務座談會-智慧辦公室、區公所
臺北智慧城市專案辦公室-公共住宅智慧服務座談會-智慧辦公室、區公所臺北智慧城市專案辦公室-公共住宅智慧服務座談會-智慧辦公室、區公所
臺北智慧城市專案辦公室-公共住宅智慧服務座談會-智慧辦公室、區公所
 
尼爾森店內媒體調查專案公佈
尼爾森店內媒體調查專案公佈尼爾森店內媒體調查專案公佈
尼爾森店內媒體調查專案公佈
 
Airbox with Gemtek Lora
Airbox with Gemtek LoraAirbox with Gemtek Lora
Airbox with Gemtek Lora
 
NeuralArt 電腦作畫
NeuralArt 電腦作畫NeuralArt 電腦作畫
NeuralArt 電腦作畫
 
動腦_數據分析工具_知己知彼百戰百勝_20150811
動腦_數據分析工具_知己知彼百戰百勝_20150811動腦_數據分析工具_知己知彼百戰百勝_20150811
動腦_數據分析工具_知己知彼百戰百勝_20150811
 

Mehr von NTC.im(Notch Training Center)

Mehr von NTC.im(Notch Training Center) (7)

A io t_ganalfhuang_day3_2022q1
A io t_ganalfhuang_day3_2022q1A io t_ganalfhuang_day3_2022q1
A io t_ganalfhuang_day3_2022q1
 
A io t_ganalfhuang_day2_2022q1
A io t_ganalfhuang_day2_2022q1A io t_ganalfhuang_day2_2022q1
A io t_ganalfhuang_day2_2022q1
 
A io t_ganalfhuang_day1_2022q1
A io t_ganalfhuang_day1_2022q1A io t_ganalfhuang_day1_2022q1
A io t_ganalfhuang_day1_2022q1
 
粉絲團大數據分析
粉絲團大數據分析粉絲團大數據分析
粉絲團大數據分析
 
小心走 交通大數據
小心走 交通大數據小心走 交通大數據
小心走 交通大數據
 
評品理 影像識別應用
評品理  影像識別應用評品理  影像識別應用
評品理 影像識別應用
 
Make2win 線上課程分析
Make2win 線上課程分析Make2win 線上課程分析
Make2win 線上課程分析
 

從Alpha go四勝一敗。看Deep Learning 發展趨勢 - 台大電機系 于天立教授