当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于动态强度的物体检测神经网络混合训练方法及系统技术方案

技术编号:24459062 阅读:40 留言:0更新日期:2020-06-10 16:26
本发明专利技术公开了一种基于动态强度的物体检测神经网络混合训练方法,缓解了检测网络的数据记忆问题,改善了检测网络的在测试集上的泛化性。通过构建混合数据,一定程度扩充了数据集,并且额外添加了不同类别数据间的线性关系,提升了模型的表现力。而通过动态混合参数的设置,降低了混合训练方法在检测网络上的训练难度,平滑了训练过程,从而更容易得到最优模型。相比于其他训练方法,训练出的模型具有更好的泛化性。

A hybrid training method and system of neural network for object detection based on dynamic strength

【技术实现步骤摘要】
一种基于动态强度的物体检测神经网络混合训练方法及系统
本专利技术涉及计算机应用、计算机视觉
,涉及一种神经网络优化方法,具体涉及一种基于动态强度的物体检测神经网络混合训练方法及系统。
技术介绍
神经网络是一种处理计算机视觉问题的一种常见方法。其主要通过卷积层、池化层、全连接层、激活函数等组件以某种方式组合成一个网络,再以足量的任务相关的数据对网络进行训练。当网络得到足够的训练,能够处理训练数据以外的数据时便表示网络已经训练完成。此时得到的网络便可以作为一个黑盒函数用以解决我们的问题。神经网络的训练方法指的是神经网络训练时所采取的训练策略,当神经网络采取不同的训练策略时可能最后会得到效果不同的模型。训练方法一般包括几个部分:数据预处理,训练用的辅助网络,损失函数。其中每一个部分的改动都会影响神经网络的训练过程及最后的结果。本申请专利技术人在实施本专利技术的过程中,发现现有技术的方法,至少存在如下技术问题:现有的训练方法过分依赖于原始数据集,训练难度较大。
技术实现思路
有鉴于此,本专利技术提供了一本文档来自技高网...

【技术保护点】
1.一种基于动态强度的物体检测神经网络混合训练方法,其特征在于,包括:/nS1:构建物体检测神经网络,并初始化物体检测神经网络的所有参数;/nS2:获取原始训练数据,并对原始训练数据进行预处理,其中,原始训练数据包括图像数据和标签数据,标签数据包括图像内所有的标记物体的类别信息和位置信息;/nS3:获取动态混合参数,从预处理后的训练数据中随机选取第一数据和第二数据,将动态混合参数作为混合强度调节参数对选取出的第一数据和第二数据进行混合,获得混合后的数据对,其中,混合后的数据对包括混合后的图像数据、第一数据对应的标签数据以及第二数据对应的标签数据;/nS4:基于混合后的数据对获得扩展后的数据集;...

【技术特征摘要】
1.一种基于动态强度的物体检测神经网络混合训练方法,其特征在于,包括:
S1:构建物体检测神经网络,并初始化物体检测神经网络的所有参数;
S2:获取原始训练数据,并对原始训练数据进行预处理,其中,原始训练数据包括图像数据和标签数据,标签数据包括图像内所有的标记物体的类别信息和位置信息;
S3:获取动态混合参数,从预处理后的训练数据中随机选取第一数据和第二数据,将动态混合参数作为混合强度调节参数对选取出的第一数据和第二数据进行混合,获得混合后的数据对,其中,混合后的数据对包括混合后的图像数据、第一数据对应的标签数据以及第二数据对应的标签数据;
S4:基于混合后的数据对获得扩展后的数据集;
S5:根据扩展后的数据集中的混合数据、第一数据对应的标签数据以及第二数据对应的标签数据,设置目标混合损失函数,其中,目标混合损失函数包括分类损失和位置损失;
S6:将扩展后的数据集作为训练数据,结合混合损失函数,采用随机梯度下降法对物体检测神经网络进行训练,得到训练好的物体检测神经网络。


2.如权利要求1所述的方法,其特征在于,S1包括:
S1.1:使用卷积层、全连接层、池化层、激活层构建神经网络或者使用现有的神经网络作为物体检测神经网络;
S1.2:采用随机参数初始化方法初始化物体检测神经网络的所有参数。


3.如权利要求1所述的方法,其特征在于,S2中对原始训练数据进行预处理,具体包括:
S2.1:对原始训练数据中的图像数据进行像素值归一化;
S2.2:进行图片裁剪;
S2.3:进行图片翻转。


4.如权利要求3所述的方法,其特征在于,S3具体包括:
S3.1:根据公式生成动态混合参数λ,具体公式如下:



其中,是预设的最大λ值,α为变化速率调节参数,n为转折迭代数,epoch为训练过程的当前迭代数;
S3.2:从预处理后的训练数据中随机选取第一数据和第二数据作为混合的原数据,将两个数据按照动态混合参数λ的比例进行线性混合,具体操作为:
x=λx1+(1-λ)x2
得到的混合后的数据对为(x,y1,y2),其中,x为混合后的图像数据,y1为第一数据x1所对应的标签数据,y2为第二数据x2所对应的标签数据。


5.如权利要求1所述的方法,其特征在于,S4包括将混合后的数据对整合为扩展后的数据集



其中,λ为动态混合参数,xp、xq表示进行混合的两个数据,yp表示xp的标签数据,yq表示xq的标签数据,为原始训练数据集。


6.如权利要求1所述的方法,其特征在于,S5具体包括:
S5.1:将混合后的图像数据作为输入图像数据,分别与其相关的两个标签数据ypi,yqi的类别信息求损失,
losscls(θ)=λlossi(θ)+(1-λ)lossj(θ)






其中为扩展后的数据集,m为扩展后的数据的规模,θ为神经网络中的所需要优化的参数,LCE为交叉熵函...

【专利技术属性】
技术研发人员:何发智全权李博文邓杰希舒凌轩
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1