- 支持离散和连续动作
- 多进程采集数据
- 支持lstm
- 支持复杂输入(图像 与 向量)
- 支持rnd随机网络蒸馏(探索)
- 多任务训练、任务预测、任务自主选择
- 所有环境返回的obs,都必须为list,即使只有一个观测信息
python 3.8
torch 1.12.1
torchaudio 0.12.1
torchvision 0.13.1
gym 0.26.2
gymnasium 0.27.1