hiroki yamaoka

1 Follower

15 SlideShares 1 Follower 1 Folgen

15 SlideShares 1 Follower 1 Folgen

強化学習 prml 機械学習 reinforcement learning actor critic sarsa q学習決定理論 dqn ガウス過程 emアルゴリズム reinforce 方策勾配ベルマン残差関数近似スパースサンプリング r-max モデルベース exponential family 指数型分布族 off policy モンテカルロ td学習 on policy 方策オン方策オフ方策オン方策オフ off policy on policy アドバンテージ関数 q-learning ベルマン方程式ベルマン作用素ベルマン作用素ベルマン方程式 planning モデルフリー探索と活用のトレードオフプランニング machine learning

Aktivität
Info

PRML2.4 指数型分布族

Vor 4 Jahren • 1384 Aufrufe

RL_chapter1_to_chapter4

Vor 3 Jahren • 302 Aufrufe

強化学習1章

Vor 3 Jahren • 363 Aufrufe

強化学習2章

Vor 3 Jahren • 425 Aufrufe

強化学習3章

Vor 3 Jahren • 241 Aufrufe

強化学習4章

Vor 3 Jahren • 205 Aufrufe

強化学習5章

Vor 3 Jahren • 166 Aufrufe

強化学習6章

Vor 3 Jahren • 208 Aufrufe

PRML5.5

Vor 3 Jahren • 55 Aufrufe

PRML4.3

Vor 3 Jahren • 40 Aufrufe

PRML9.3

Vor 3 Jahren • 19 Aufrufe

PRML6.4

Vor 3 Jahren • 108 Aufrufe

DQN

Vor 3 Jahren • 36 Aufrufe

PRML1.3

Vor 3 Jahren • 37 Aufrufe

PRML1.5

Vor 3 Jahren • 130 Aufrufe

深層生成モデルに基づく音声合成技術

NU_I_TODALAB • Vor 1 Jahr

最適輸送の解き方

joisino • Vor 2 Jahren

SSII2021 [TS2] 深層強化学習〜強化学習の基礎から応用まで〜

SSII • Vor 2 Jahren

音声の声質を変換する技術とその応用

NU_I_TODALAB • Vor 6 Jahren

計算論的学習理論入門 -PAC学習とかVC次元とか-

sleepy_yoshi • Vor 10 Jahren

Recent Advances on Transfer Learning and Related Topics Ver.2

Kota Matsui • Vor 4 Jahren

階層ベイズと自由エネルギー

Hiroshi Shimizu • Vor 6 Jahren

関数データ解析の概要とその方法

Hidetoshi Matsui • Vor 3 Jahren

古典的ゲームAIを用いたAlphaGo解説

suckgeun lee • Vor 6 Jahren

方策勾配型強化学習の基礎と応用

Ryo Iwaki • Vor 6 Jahren

NIPS2015読み会: Ladder Networks

Eiichi Matsumoto • Vor 8 Jahren

勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)

RyuichiKanoh • Vor 3 Jahren

SSII2020SS: グラフデータでも深層学習〜 Graph Neural Networks 入門〜

SSII • Vor 3 Jahren

[DL輪読会]Graph Convolutional Policy Network for Goal-Directed Molecular Graph Generation (NIPS2018)

Deep Learning JP • Vor 5 Jahren

深層学習の数理

Taiji Suzuki • Vor 4 Jahren

最適化超入門

Takami Sato • Vor 9 Jahren

グラフデータ分析入門編

順也山口 • Vor 4 Jahren

Reinforcement Learning @ NeurIPS2018

佑甲野 • Vor 5 Jahren

強化学習 prml 機械学習 reinforcement learning actor critic sarsa q学習決定理論 dqn ガウス過程 emアルゴリズム reinforce 方策勾配ベルマン残差関数近似スパースサンプリング r-max モデルベース exponential family 指数型分布族 off policy モンテカルロ td学習 on policy 方策オン方策オフ方策オン方策オフ off policy on policy アドバンテージ関数 q-learning ベルマン方程式ベルマン作用素ベルマン作用素ベルマン方程式 planning モデルフリー探索と活用のトレードオフプランニング machine learning