ToDo List
- 简单易用的 DRL 框架
- 易于扩展的环境、Agen特性
- 丰富的算法、环境模块
- Python + Pytorch
- NN 网络构建
- 总结代表性工作与实现项目
- Gitbook - DRL Tutorial
- Base Class (构建通用模型)
- Agnet 组件,可灵活构建
- 简单 Agent, e.g., DQN, DDPG
- 近5年代表性工作
- 自定义环境
- 现有环境支持, e.g., Gym, Deepmind Lab
- 参数输入
- 控制训练过程、训练加速
- 结合 Agent 和 环境
- Log 记录
- 训练过程可视化
- Docker 部署