Weitere ähnliche Inhalte
Mehr von 奈良先端大 情報科学研究科 (20)
多腕バンディット問題のアルゴリズムを用いた大貧民AI
- 1. NAISTスプリングセミナー2017
多腕バンディット問題とは?
強化学習の一手法
当たりの出る確率が未知のスロットを引
き続けて、報酬を最大に
トランプゲームの大貧民(大富豪)を
プレイする AI(人工知能)の作り方を
学習!
多腕バンディット問題を用いて強い AI を
作成
機械学習の知識は不要です。
使用プログラミング言語は任意です。
受講生のスキルに応じた実習内容
です。
多腕バンディット問題のアルゴリズムを用いた大貧民AI
大規模システム管理研究室 http://www-lsm.naist.jp
多腕バンディット問題
ゲーム木探索