hiroki yamaoka
1
Follower
Tags
強化学習
prml
機械学習
reinforcement learning
actor critic
sarsa
q学習
決定理論
dqn
ガウス過程
emアルゴリズム
reinforce
方策勾配
ベルマン残差
関数近似
スパースサンプリング
r-max
モデルベース
exponential family
指数型分布族
off policy
モンテカルロ
td学習
on policy
方策オン
方策オフ
方策オン
方策オフ
off policy
on policy
アドバンテージ関数
q-learning
ベルマン方程式
ベルマン作用素
ベルマン作用素
ベルマン方程式
planning
モデルフリー
探索と活用のトレードオフ
プランニング
machine learning
Mehr anzeigen
- Präsentationen
- Dokumente
- Infografiken
深層生成モデルに基づく音声合成技術
NU_I_TODALAB
•
Vor 1 Jahr
最適輸送の解き方
joisino
•
Vor 2 Jahren
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
SSII
•
Vor 2 Jahren
音声の声質を変換する技術とその応用
NU_I_TODALAB
•
Vor 6 Jahren
計算論的学習理論入門 -PAC学習とかVC次元とか-
sleepy_yoshi
•
Vor 10 Jahren
Recent Advances on Transfer Learning and Related Topics Ver.2
Kota Matsui
•
Vor 4 Jahren
階層ベイズと自由エネルギー
Hiroshi Shimizu
•
Vor 6 Jahren
関数データ解析の概要とその方法
Hidetoshi Matsui
•
Vor 3 Jahren
古典的ゲームAIを用いたAlphaGo解説
suckgeun lee
•
Vor 6 Jahren
方策勾配型強化学習の基礎と応用
Ryo Iwaki
•
Vor 6 Jahren
NIPS2015読み会: Ladder Networks
Eiichi Matsumoto
•
Vor 8 Jahren
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
RyuichiKanoh
•
Vor 3 Jahren
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII
•
Vor 3 Jahren
[DL輪読会]Graph Convolutional Policy Network for Goal-Directed Molecular Graph Generation (NIPS2018)
Deep Learning JP
•
Vor 5 Jahren
深層学習の数理
Taiji Suzuki
•
Vor 4 Jahren
最適化超入門
Takami Sato
•
Vor 9 Jahren
グラフデータ分析 入門編
順也 山口
•
Vor 4 Jahren
Reinforcement Learning @ NeurIPS2018
佑 甲野
•
Vor 5 Jahren