继续训练

使用说明

训练深度学习模型通常是一个耗时的过程,如训练中断会造成前期训练成果丢失,浪费计算资源。若训练过程因故中断,则可以使用该工具,基于训练日志路径恢复训练过程。此外,继续训练功能可实现日志续写,训练完成后,用户打开tensorboard即可看到完整的训练曲线。

继续训练得到的模型默认保存到训练中断前在模型训练工具设置的“模型存储路径”下,模型名称与模型训练工具中“模型名”保持一致。

参数说明

  • 训练日志路径:选择训练过程中断的模型训练日志文件夹。中断前训练的参数会被记录到日志文件夹中,继续训练时可自动复现参数。
  • 训练模型用途:需和原始训练的模型用途保持一致。
  • 处理器类型:可以使用计算机中央处理器(CPU)或图形处理单元(GPU)来处理数据。GPU具有较快的计算速度。
  • GPU编号:指定用于处理数据的GPU标识号,默认值为0,CPU推理固定为-1。若使用GPU推理,需要在系统命令行中通过“nvidia-smi”命令查询GPU编号,GPU编号以查询到的结果为准,如果有多个GPU,可以指定用于处理数据的GPU标识号。若需要使用多个GPU,请使用英文逗号“,”隔开,如:“0,2,3”,表示使用编号为0、2、3的GPU。

相关主题

训练数据生成

模型训练

模型评估