5. 5
5번 대국
– 오전 공식경기: 제한시간 1시간, 30초 3회 초읽기
– 오후 비공식경기: 제한시간 없이 30초 3회 초읽기
결과
– 오전 : Fan Hui 0-5 AlphaGo
– 오후 : Fan Hui 2-3 AlphaGo
AlphaGo 사건
http://www.yonhapnews.co.kr/bulletin/2016/02/15/0200000000AKR20160215002700007.HTML
24. 24
100,000 simulation against open source Go program, Pachi
AlphaGo 구성
Training 13-layer policy network from 30million positions
2𝜇s of Rollout policy with weight 𝜋, 3ms of Policy network
25. 25
Agenda
Alpha Go 사건
바둑 프로그램의 한계
Alpha Go 구성
이세돌9단 대국 계획
대국 관전 포인트
Alpha Go 시사점
참고
27. 27
일정
– 1국 : 3월 9일 (수) 오후 1시
– 2국 : 3월 10일 (목) 오후 1시
– 3국 : 3월 12일 (토) 오후 1시
– 4국 : 3월 13일 (일) 오후 1시
– 5국 : 3월 15일 (화) 오후 1시
상대 : Aja Huang 아마 6단 (DeepMind 직원)
장소 : 서울 광화문 포시즌스 호텔 특별 대국장
규칙
– 중국규칙, 제한 시간 2시간, 1분 초읽기 3회 (4~5시간
예상)
상금 12억원($1M) (승자? 5판 모두 승리?)
이세돌 9단 대국 계획
28. 28
Agenda
Alpha Go 사건
바둑 프로그램의 한계
Alpha Go 구성
이세돌9단 대국 계획
대국 관전 포인트
Alpha Go 시사점
참고
34. 34
개발팀 20명
David Silver, Aja Huang, Chris J. Maddison, Arthur Guez, Laurent Sifre, George van den Driessche, Julian
Schrittwieser, Ioannis Antonoglou, Veda Panneershelvam, Marc Lanctot, Sander Dieleman, Dominik Grewe,
John Nham, Nal Kalchbrenner, Ilya Sutskever, Timothy Lillicrap, Madeleine Leach, Koray Kavukcuoglu, Thore
Graepel & Demis Hassabis
AlphaGo 시사점
37. 37
References
DeepMind, https://deepmind.com/alpha-go.html
Why the Chess Computer Deep Blue Played Like a
Human, http://nautil.us/issue/18/genius/why-the-chess-
computer-deep-blue-played-like-a-human
Monte Carlo Tree Search, http://mcts.ai/about/index.html
David Silver, etc, “Mastering the game of Go with deep
neural networks and tree search”,” Nature, p.484-489,
Jan. 2016
Volodymyr Mnih, etc,” Human-level control through
deep reinforcementlearning”, Nature, p.529-43, Feb.
2015
김석원 외, “AlphaGo의 인공지능”, SPRi Issue Report,
2016.02