模型训练方法、装置及设备制造方法及图纸

技术编号:37246948 阅读:31 留言:0更新日期:2023-04-20 23:26
本申请实施例提供一种模型训练方法、装置及设备。该方法包括:获取第一数据集合,第一数据集合包括多张第一样本图像和每张第一样本图像的图像特征;通过第一数据集合进行模型训练,得到残差网络,残差网络包括至少一个卷积块和至少一个残差块;获取第二数据集合,第二数据集合包括多张第二样本图像、以及每张第二样本图像的标记结果,标记结果用于指示第二样本图像中的对象是否存在预设行为;通过第二数据集合进行模型训练得到目标模型,目标模型包括残差网络和多特征融合网络,多特征融合网络包括空间金字塔池化层和正则化卷积层,目标模型用于识别图像中的对象是否存在预设行为。提高了确定是否存在使用手机行为的准确性。高了确定是否存在使用手机行为的准确性。高了确定是否存在使用手机行为的准确性。

【技术实现步骤摘要】
模型训练方法、装置及设备


[0001]本申请实施例涉及计算机
,尤其涉及一种模型训练方法、装置及设备。

技术介绍

[0002]在工业制造场景(例如,工厂、加油站、车间等)下,使用手机会存在安全隐患。为了保证工业制造的安全性,需要实时监控工业制造场景下,是否存在使用手机的行为。
[0003]在相关技术中,可以通过如下方式确定是否存在使用手机的行为:通过监控视频获取工业制造场景下的图像,通过图像处理算法提取图像的手部轮廓特征信息。利用分类算法对手部轮廓特征信息进行分类,得到判断手部轮廓特征信息对应的类型信息。根据类型信息,判断是否存在打手机的动作。在上述过程中,由于只对手部的图像进行特征提取并分析,且不能识别特殊场景(例如,光照弱,拍摄位置偏等)下是否存在使用手机的行为,导致确定是否存在使用手机行为的准确性较低。

技术实现思路

[0004]本申请实施例提供一种模型训练方法、装置及设备,用以解决确定是否存在使用手机行为的准确性较低的问题。
[0005]第一方面,本申请实施例提供一种模型训练方法,包括:
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取第一数据集合,所述第一数据集合包括多张第一样本图像和每张第一样本图像的图像特征;通过第一数据集合进行模型训练,得到残差网络,所述残差网络包括至少一个卷积块和至少一个残差块,每个所述卷积块和所述残差块后包括平均池化层和卷积层;获取第二数据集合,所述第二数据集合包括多张第二样本图像、以及每张第二样本图像的标记结果,所述标记结果用于指示所述第二样本图像中的对象是否存在预设行为;通过第二数据集合进行模型训练得到目标模型,所述目标模型包括所述残差网络和多特征融合网络,所述多特征融合网络包括空间金字塔池化层和正则化卷积层,所述目标模型用于识别图像中的对象是否存在所述预设行为。2.根据权利要求1所述的方法,其特征在于,通过第二数据集合进行模型训练得到目标模型,包括:在所述第二数据集合中确定训练数据集和验证数据集;通过所述训练数据集进行模型训练,得到初始模型;通过所述验证数据集对所述初始模型进行训练,得到所述目标模型。3.根据权利要求2所述的方法,其特征在于,通过所述训练数据集进行模型训练,得到初始模型,包括:通过所述残差网络的模型参数,初始化第一模型的模型参数,得到初始化后的第一模型;对所述训练数据集进行多次图像增强处理,得到多个增强数据集;分别通过所述训练数据集和所述多个增强数据集,对所述初始化后的第一模型进行多次迭代训练,得到所述初始模型。4.根据权利要求3所述的方法,其特征在于,分别通过所述训练数据集和所述多个增强数据集,对所述初始化后的第一模型进行多次迭代训练,得到所述初始模型,包括:通过所述训练数据集对所述初始化后的第一模型进行第1次迭代训练,得到第一中间模型;通过第i个增强数据集对第i中间模型进行第i+1次迭代训练,得到第i+1中间模型,所述i依次取1、2、3、
……
,直至第i个中间模型收敛,且i大于或等于N时,将所述第i个中间模型确定为所述初始模型,所述N为大于1的整数。5.根据权利要求4所述的方法,其特征在于,所述标记结果中包括标记框的标记位置;通过第i个增强数据集对第i中间模型进行第i+1次迭代训练,得到第i+1中间模型,包括:通过所述第i中间模型对所述第i个增强数据集中的样本图像进行处理,得到预测结果,所述预测结果中包括预测框的预测位置;根据所述标记位置确定所述标记框的标记面积,以及根据所述预测位置确定所述预测框的预测面积;根据所述预测位置、所述预测面积、所述标记位置、所述标记面积、以及预设的损失函数,确定损失值;根据所述损失值更新所述第i中间模型的模型参数,得到所述第i+1中间模型。6.根据权利要求3

5任一项所述的方法,其特征在于,针对所述多次图像增强处理中的
任意一次图像增强处理;对所述训练数据集进行图像增强处理,得到增强数据集,包括:对所述训练数据集中的第二样本图像进行图像增强处理得到第三样本图像,所述图像增强处理包括如下至少一种:缩放处理、翻转处理、平移处理、旋转处理、灰度填补处理、均值化处理、方差标准化处理、颜色变换处理、混合图像处理、随机多尺度操...

【专利技术属性】
技术研发人员:陈纬刘志坚
申请(专利权)人:展讯通信上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1