稳定版本v0.2.1.post2
Tongjilibo
released this
16 Mar 07:24
·
47 commits
to master
since this release
修复bug
- 避免训练空数据集error
- 修改run_callback=False的bug
- 修复ddp中mix_precision和torch的ddp重名导致的bug
功能优化
- 默认指标使用滑窗平滑,记录过去interval窗口内的平均指标
- BaseModelDDP修改的更易用,增加init_process_group
- mapping允许是函数(DDP训练的模型等更方便加载)
新增功能
- 训练异常时保存权重;训练异常时候可以保存当前batch数据用于debug
- Checkpoint的Callback增加save_on_train_end
- 增加SystemCallback用于监控gpu, cpu,内存等占用