AI帮你理解科学

AI 生成解读视频

AI抽取解析论文重点内容自动生成视频


pub
生成解读视频

AI 溯源

AI解析本论文相关学术脉络


Master Reading Tree
生成 溯源树

Directly Estimating the Variance of the λ-Return Using Temporal-Difference Methods.

arXiv: Artificial Intelligence, (2018)

被引用1|浏览44
EI
24小时获取PDF
引用

摘要

This paper investigates estimating the variance of a temporal-difference learning agentu0027s update target. Most reinforcement learning methods use an estimate of the value function, which captures how good it is for the agent to be in a particular state and is mathematically expressed as the expected sum of discounted future rewards (ca...更多

代码

数据

作者
Craig Sherstan
Craig Sherstan
Brendan Bennett
Brendan Bennett
Dylan R. Ashley
Dylan R. Ashley
您的评分 :
0

 

标签
评论
数据免责声明
页面数据均来自互联网公开来源、合作出版商和通过AI技术自动分析结果,我们不对页面数据的有效性、准确性、正确性、可靠性、完整性和及时性做出任何承诺和保证。若有疑问,可以通过电子邮件方式联系我们:report@aminer.cn
小科