一种用于图像数据识别模型构建的方法及系统技术方案

技术编号:38948051 阅读:10 留言:0更新日期:2023-09-25 09:44
本申请提供了一种用于图像数据识别模型构建的方法及系统。其方法包括:获取包括真值标注的图像数据集;基于图像数据集和教师网络模型,采用FSP方法对学生网络各层权重进行初始化,以得到至少两个网络结构相同的学生网络模型;基于包括真值标注的图像数据集,采用DML蒸馏方法训练每个学生网络模型,当训练后的学生网络模型都满足预设条件,将训练后的学生网络模型作为图像数据识别模型。通过该方法,从教师网络模型迁移学习,得到至少两个结构相同且完成各层权重初始化的学生网络模型,可避免数据少无法很好初始化神经网络等问题,且可降低训练难度,采用DML蒸馏方法,得到识别能力有保障的图像数据识别模型,训练周期短、速度快、易部署,适用性广。适用性广。适用性广。

【技术实现步骤摘要】
一种用于图像数据识别模型构建的方法及系统


[0001]本申请涉及图像数据处理
,尤其涉及一种用于图像数据识别模型构建的技术。

技术介绍

[0002]随着城市化进程的不断推进,通过在城市交通道路的路口、重点或重要场所安装摄像头,采集视频用于城市日常管理,比如道路交通安全管理、社会治安、消防预防等,已在当前的城市治理中发挥着不可替代的作用。
[0003]然而通常情况下只掌握摄像头的位置信息、编号信息和/或其组合,但对于摄像头采集的视频具体内容,需要识别后才能清楚,进一步地,才能根据识别后的内容进行分类,从而实现差异化监控、预防预警等。比如,基于消防预防目的,重点关注的是摄像头采集的主要内容包括加油站、油库等,基于社会治安目的,重点关注的是摄像头采集的主要内容是人员数量多、流动大的车站等。因为此类场景容易发生危险,此类场景内容被识别后应按照类别进行差异化监控、分类管理。如果统一交由后台工作人员进行人工甄别,需要投入极大的人力和物力,而且一旦人员疲劳,容易出错。
[0004]目前,已有基于深度神经网络的图像识别模型应用于城市管理,但此类模型通常采用的深度神经网络的结构深度或宽度非常大,包含大量参数,要处理的数据量大,不但对硬件要求高,而且处理时间长。另外,此类模型同时是基于大量样本训练而得到的,要求用于训练的数据集规模大,对于数据样本通常较少、部署的硬件计算存储能力有限的应用场景,训练耗时大,训练模型很难收敛,效果并不好,现有基于深度神经网络的图像识别模型并不太适用。

技术实现思路

[0005]本申请的目的是提供一种用于图像数据识别模型构建的方法及系统,在图像数据集小、计算存储资源有限的应用场景中,构建参数少、指标高的图像数据识别模型,用以对图像数据进行识别。
[0006]根据本申请的一个方面,提供了一种用于图像数据识别模型构建的方法,其特征在于,所述方法包括:
[0007]获取图像数据集,并对所述图像数据集的每个图像数据进行真值标注,得到包括真值标注的图像数据集;
[0008]基于所述图像数据集和教师网络模型,采用FSP方法对学生网络各层权重进行初始化,以得到至少两个网络结构相同的学生网络模型,其中,所述教师网络模型是经过预训练已完成各层权重初始化的神经网络,所述教师网络模型和所述学生网络包括相同数量的阶段,每个阶段包括若干数量的残差块,其中,所述教师网络模型的每个阶段包括的残差块的数量大于或者等于所述学生网络的对应阶段包括的残差块的数量;
[0009]基于包括真值标注的图像数据集,采用DML蒸馏方法训练每个学生网络模型,当训
练后的学生网络模型都满足预设条件,将训练后的学生网络模型作为图像数据识别模型。
[0010]可选地,其中,在对所述图像数据集的每个图像数据进行真值标注后,采用GAN网络对所述图像数据集进行图像数据扩充。
[0011]可选地,其中,所述基于所述图像数据集和教师网络模型,采用FSP方法对学生网络各层权重进行初始化,以得到至少两个网络结构相同的学生网络模型包括:
[0012]基于所述图像数据集和所述教师网络模型,同步训练所述学生网络,以迁移学习所述教师网络模型的知识;
[0013]分别计算所述教师网络模型和所述学生网络对应的每个阶段的FSP矩阵的L2损失,并根据全部L2损失,计算总的L2损失,作为第一损失;
[0014]若所述第一损失满足预设第一阈值,则完成训练,得到至少两个网络结构相同的学生网络模型,其中,每个学生网络模型之间的各层权重值不完全相同。
[0015]可选地,其中,若第一损失不满足预设第一阈值,所述方法还包括:
[0016]根据第一损失的计算公式,进行反向传播,更新学生网络各层权重值;
[0017]基于所述图像数据集和所述教师网络模型,同步训练各层权重值更新后的学生网络。
[0018]可选地,其中,所述FSP矩阵通过计算相应阶段的输入特征图和输出特征图的内积确定。
[0019]可选地,其中,所述基于包括真值标注的图像数据集,采用DML蒸馏方法训练每个学生网络模型,当训练后的学生网络模型都满足预设条件,将训练后的学生网络模型作为图像数据识别模型包括:
[0020]基于包括真值标注的图像数据集,同步相互训练每个学生网络模型;
[0021]判断每个学生网络模型的指标,若训练后的学生网络模型的指标满足预设条件,则完成训练,将训练后的学生网络模型作为图像数据识别模型。
[0022]可选地,其中,在判断每个学生网络模型的指标之前,所述方法还包括:
[0023]分别计算每个学生网络模型的KL散度,并计算每个学生网络模型的CE损失,根据每个学生网络模型的KL散度与CE损失,确定每个学生网络模型的第二损失;
[0024]当每个学生网络模型的第二损失都满足预设第二阈值,再判断每个学生网络模型的指标。
[0025]可选地,其中,每个学生网络模型的KL散度的计算包括:
[0026]基于图像数据集,得到每个学生网络模型对应所述图像数据集的预测结果;
[0027]基于学生网络模型的预测结果,计算每个学生网络模型的KL散度。
[0028]可选地,其中,若训练后的学生网络模型的指标不满足预设条件,所述方法还包括:
[0029]根据第二损失的计算公式,进行反向传播,更新所述学生网络模型各层权重值;
[0030]基于包括真值标注的图像数据集,同步训练各层权重值更新后的所述学生网络模型。
[0031]可选地,其中,所述指标至少包括以下一项:精确率、召回率、准确率、F

Score。
[0032]可选地,所述一种用于图像数据识别模型构建的方法还包括:
[0033]将待识别图像数据输入所述图像数据识别模型,确定所述待识别图像数据的类
别。
[0034]可选地,所述一种用于图像数据识别模型构建的方法还包括:
[0035]将待识别图像数据的类别作为其真值标注,扩充所述包括真值标注的图像数据集;
[0036]基于扩充后的包括真值标注的图像数据集、教师网络模型和学生网络,重新训练,以得到升级迭代的图像数据识别模型。
[0037]可选地,所述一种用于图像数据识别模型构建的方法还包括:
[0038]根据所述待识别图像数据的类别,对所述待识别图像数据进行差异化处理。
[0039]根据本申请的另一方面,提供了一种用于图像数据识别模型构建的系统,其特征在于,所述系统包括:
[0040]第一模块,用于获取图像数据集,并对所述图像数据集的每个图像数据进行真值标注,得到包括真值标注的图像数据集;
[0041]第二模块,用于基于所述图像数据集和教师网络模型,采用FSP方法对学生网络各层权重进行初始化,以得到至少两个网络结构相同的学生网络模型,其中,所述教师网络模型是经过预训练已完成各层权重初始化的神经网络,所述教师网络模型和所述学生网络本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于图像数据识别模型构建的方法,其特征在于,所述方法包括:获取图像数据集,并对所述图像数据集的每个图像数据进行真值标注,得到包括真值标注的图像数据集;基于所述图像数据集和教师网络模型,采用FSP方法对学生网络各层权重进行初始化,以得到至少两个网络结构相同的学生网络模型,其中,所述教师网络模型是经过预训练已完成各层权重初始化的神经网络,所述教师网络模型和所述学生网络包括相同数量的阶段,每个阶段包括若干数量的残差块,其中,所述教师网络模型的每个阶段包括的残差块的数量大于或者等于所述学生网络的对应阶段包括的残差块的数量;基于包括真值标注的图像数据集,采用DML蒸馏方法训练每个学生网络模型,当训练后的学生网络模型满足预设条件,将训练后的学生网络模型作为图像数据识别模型。2.根据权利要求1所述的方法,其特征在于,在对所述图像数据集的每个图像数据进行真值标注后,采用GAN网络对所述图像数据集进行图像数据扩充。3.根据权利要求1所述的方法,其特征在于,所述基于所述图像数据集和教师网络模型,采用FSP方法对学生网络各层权重进行初始化,以得到至少两个网络结构相同的学生网络模型包括:基于所述图像数据集和所述教师网络模型,同步训练所述学生网络,以迁移学习所述教师网络模型的知识;分别计算所述教师网络模型和所述学生网络对应的每个阶段的FSP矩阵的L2损失,并根据全部L2损失,计算总的L2损失,作为第一损失;若所述第一损失满足预设第一阈值,则完成训练,得到至少两个网络结构相同的学生网络模型,其中,每个学生网络模型之间的各层权重值不完全相同。4.根据权利要求3所述的方法,其特征在于,若第一损失不满足预设第一阈值,所述方法还包括:根据第一损失的计算公式,进行反向传播,更新学生网络各层权重值;基于所述图像数据集和所述教师网络模型,同步训练各层权重值更新后的学生网络。5.根据权利要求3所述的方法,其特征在于,所述FSP矩阵通过计算相应阶段的输入特征图和输出特征图的内积确定。6.根据权利要求1所述的方法,其特征在于,所述基于包括真值标注的图像数据集,采用DML蒸馏方法训练每个学生网络模型,当训练后的学生网络模型满足预设条件,将训练后的学生网络模型作为图像数据识别模型包括:基于包括真值标注的图像数据集,同步相互训练每个学生网络模型;判断每个学生网络模型的指标,若训练后的学生网络模型的指标满足预设条件,则完成训练,将训练后的学生网络模型作为图像数据识别模型。7.根据权利要求6所述的方法,其特征在于,在判断每个学生网络模型的指标之前,所述方法还包括:分别计算每个学生网络模型的KL散度,并计算每个学生网络模型的CE损失,根据每个学生网络模型的KL散度与CE损失,确定每个学生网...

【专利技术属性】
技术研发人员:岳腾飞章曙涵王夷张剑吴翔
申请(专利权)人:上海芯翌智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1