模型训练
模型训练的目的是使用生成的训练数据进行神经网络模型训练,根据设置参数,不断地对模型迭代评估,以得到可用的神经网络模型。
内置了Pytorch、PaddlePaddle 等开源框架,结合不同的数据集类别对机器学习或深度学习模型进行训练,整体训练过程通过多次迭代(epoch)的方式来得到训练结果更优的网络模型,同时在训练模型中使用基于大规模基础训练数据的预训练模型,减少训练时间,通过超参数调优(如:Batchsize)提升模型训练效率和准确度。
功能入口
- 功能入口:工具箱->机器学习->视频分析->模型训练。
参数说明
- 训练数据路径:选择通过图片样本管理生成的训练数据所在的文件夹。
- 模型算法:根据模型用途选择合适的模型算法。提供:YOLOv5x、YOLOv5l、YOLOv5m、YOLOv5s、YOLOv5m、YOLOv7-E6E、YOLOv7-D6、YOLOv7-E6、YOLOv7-W6、YOLOv7-X、YOLOv7、YOLOv7-Tiny。
- 训练次数:模型训练的次数(epoch),默认值为 10。随着训练次数的增多,模型拟合度越大,次数太多可能会出现过拟合的情况,用户可根据需求选择,训练次数与运行花费时间成正比。
- 训练图片大小:设置用于模型训练的图片大小,默认为640。图片越大,检测精度越高,但召回率会降低。因此需要根据实际情况给定训练图片大小,提高检测性能,同时要求图片大小必须是32的倍数。
- 单步运算量:一次训练中单步运算的图片数量(Batch Size),默认值为0。在合理范围内,单步运算的数量与内存(显存)占用成正比,与训练时间成反比。当模型算法为YOLOv7时,需要指定单步运算量大小,不自动计算。
- 加载预训练模型:若勾选该选项,可选择前一次训练的训练日志路径作为预训练模型的路径,会在前一次的基础上进行训练。注意:前后两次训练需要训练数据的尺寸、类别和用途相同。
- 模型存储路径:设置训练的结果模型存储路径。
- 模型名:设置模型的名称。
- 数据源:设置用于存储属性表和影像的数据源。
- 属性表:输出模型训练结果的属性表。在模型训练中,会生成.csv文件记录每次训练的模型精度等信息,训练结束后会将这些信息转换为属性表存储到数据源中。生成的.csv如下图:
- 影像:输出模型训练影像。模型训练结果会以图表的形式表示,如下图为输出结果的影像信息。