谷歌发布开源Dopamine 2.0

6
回复
210
查看
[复制链接]

430

主题

433

帖子

8970

安币

手工艺人

发表于 2019-2-12 14:24:13 | 显示全部楼层 |阅读模式
去年八月,谷歌发布了 Dopamine,这是一款灵活的强化学习框架。初始版本专注于特定类型的 RL 研究:基于 Arcade 学习环境(一个成熟的、易于理解的基准)和四个基于值的代理 DQN、C51、Rainbow 代理的简化版本以及隐式分位数网络代理实现的。
据官方博客介绍:
开发小组收到的最常见的请求之一是对更多环境的支持。这证实了他们在内部看到的情况,在测试新算法时,OpenAI 的 Gym 支持的简单环境非常有用。于是,谷歌正式发布 Dopamine 2.0,这一版本包括了对离散域 Gym 环境 (如离散状态和动作) 的支持。框架的核心保持不变,只是简单地概括了与环境的接口。为了向后兼容,用户仍然可以下载 1.0 版本。
此外,新版本还包括两个经典控制环境的默认配置:CartPole 和 Acrobot;在这些环境中,用户可以在几分钟内训练 Dopamine 代理。与标准 Atari 2600 游戏的训练时间(标准 GPU 上大约 5 天)相比,这些环境允许研究人员在更大规模的 Atari 游戏上测试比之前更快地迭代研究思路。新版本还包括一个合作实验室,演示如何在 Cartpole 和 Acrobot 上训练代理。最后,GymPreprocessing 类为如何将 Dopamine 与其他自定义环境一起使用提供了示例。
47900bc58453453b9199ba1c1d9667c3.jpg

62

主题

9800

帖子

911

安币

代码手工艺人

学海无涯

Rank: 4

QQ达人

发表于 2019-2-12 14:30:54 | 显示全部楼层
不错不错,楼主辛苦了。。。

4

主题

9672

帖子

795

安币

代码手工艺人

Rank: 4

发表于 2019-2-12 14:57:12 | 显示全部楼层
不错不错,楼主辛苦了。。。

434

主题

1098

帖子

473

安币

手工艺人

发表于 2019-2-12 16:01:29 | 显示全部楼层
支持楼主,支持安卓巴士!

2

主题

9444

帖子

2478

安币

Android大神

Rank: 6Rank: 6

发表于 2019-2-12 16:46:33 | 显示全部楼层
感谢大神~

3

主题

7203

帖子

1748

安币

Android大神

Rank: 6Rank: 6

发表于 2019-2-12 17:47:44 | 显示全部楼层
帮帮顶顶!!

503

主题

1161

帖子

2044

安币

手工艺人

发表于 2019-2-12 18:25:03 | 显示全部楼层
楼主威武,以后多发干货,多办活动~!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

领先的中文移动开发者社区
18620764416
7*24全天服务
意见反馈:1294855032@qq.com

扫一扫关注我们

Powered by Discuz! X3.2© 2001-2019 Comsenz Inc.( 粤ICP备15117877号 )