Skip to content

稳定版本v0.2.1.post2

Compare
Choose a tag to compare
@Tongjilibo Tongjilibo released this 16 Mar 07:24
· 47 commits to master since this release

修复bug

  • 避免训练空数据集error
  • 修改run_callback=False的bug
  • 修复ddp中mix_precision和torch的ddp重名导致的bug

功能优化

  • 默认指标使用滑窗平滑,记录过去interval窗口内的平均指标
  • BaseModelDDP修改的更易用,增加init_process_group
  • mapping允许是函数(DDP训练的模型等更方便加载)

新增功能

  • 训练异常时保存权重;训练异常时候可以保存当前batch数据用于debug
  • Checkpoint的Callback增加save_on_train_end
  • 增加SystemCallback用于监控gpu, cpu,内存等占用