一种网络模型的训练方法及装置制造方法及图纸

技术编号:22723324 阅读:36 留言:0更新日期:2019-12-04 05:53
公开了一种网络模型的训练方法及装置,包括:通过待训练网络确定样本图像对应的第一特征向量;将所述样本图像划分为两个以上的区域图像;通过监督网络根据所述两个以上的区域图像确定两个以上的第二特征向量;基于所述第一特征向量与所述两个以上的第二特征向量,确定所述待训练网络的第一损失值;若所述第一损失值符合第一预设条件,调整所述待训练网络的权重参数;通过第一特征向量与第二特征向量之间的相互学习训练,使待训练网络解析的特征向量可以更好的对应目标物的特定局部区域,因此利用训练后得到的待训练网络能够准确的完成基于目标物局部区域的识别。

A training method and device of network model

A training method and device of network model are disclosed, including: determining the first eigenvector corresponding to the sample image through the network to be trained; dividing the sample image into more than two area images; determining more than two second eigenvectors based on the two area images through the supervision network; determining more than two second eigenvectors based on the first eigenvector and the second eigenvector Two feature vectors to determine the first loss value of the network to be trained; if the first loss value meets the first preset condition, adjust the weight parameters of the network to be trained; through the mutual learning training between the first feature vector and the second feature vector, the feature vector to be analyzed by the network to be trained can better correspond to the specific local area of the object, so the training is used After that, the network to be trained can accurately complete the recognition based on the local area of the object.

【技术实现步骤摘要】
一种网络模型的训练方法及装置
本公开涉及图像分析
,尤其涉及一种网络模型的训练方法及装置。
技术介绍
在图像识别的一些具体场景下,由于图像中的目标物可能会被部分遮挡,所以无法通过网络模型对图像解析得到目标物完整的特征图以及特征向量,而只能利用可获得的目标物局部对应的特征图以及特征向量,完成分析和识别。但是在利用网络模型解析得到特征图的过程中,图像中的信息会出现一定程度的糅杂,以至于在特征图上无法更好的确定图像中目标物的局部区域。在这种情况下,现有的网络模型无法准确的提取出图像中目标物的局部区域对应的特征图以及特征向量。
技术实现思路
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种网络模型的训练方法及装置;在网络模型训练过程中,基于通过整体的样本图像得到的第一特征向量,与通过区域图像得到的第二特征向量进行,使训练得到的待训练网络能够准确的提取出图像中目标物的特定局部对应特征向量。根据本公开的第一个方面,提供了一种网络模型的训练方法,包括:通过待训练网络确定样本图像对应的第一特征向量;将所述样本图像划分为两个以上的区域图像;通过监督网络根据所述两个以上的区域图像确定两个以上的第二特征向量;基于所述第一特征向量与所述两个以上的第二特征向量,确定所述待训练网络的第一损失值;若所述第一损失值符合第一预设条件,调整所述待训练网络的权重参数。根据本公开的第二个方面,提供了一种网络模型的训练装置,包括:第一特征向量确定模块,用于通过待训练网络确定样本图像对应的第一特征向量;图像划分模块,用于将所述样本图像划分为两个以上的区域图像;第二特征向量确定模块,用于通过监督网络根据所述两个以上的区域图像确定两个以上的第二特征向量;第一损失模块,用于基于所述第一特征向量与所述两个以上的第二特征向量,确定所述待训练网络的第一损失值;参数调整模块,用于在所述第一损失值符合第一预设条件时,调整所述待训练网络的权重参数。根据本公开的第三方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述第一方面中所述的网络模型的训练方法。根据本公开的第四方面,提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述可执行指令以实现上述第一方面中所述的网络模型的训练方法。本公开提供的网络模型的训练方法及装置,通过将样本图像划分为至少两个区域图像,并根据区域图像确定第二特征向量,使第二特征向量可以更好的对应目标物的特定局部区域;进而通过第一特征向量与第二特征向量之间的相互学习训练,使待训练网络解析的特征向量可以更好的对应目标物的特定局部区域,因此利用训练后得到的待训练网络能够准确的完成基于目标物局部区域的识别。附图说明通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。图1为本公开一示例性实施例提供的网络模型的训练系统的结构示意图;图2为本公开一示例性实施例提供的网络模型的训练方法的流程示意图;图3为本公开一示例性实施例提供的网络模型的训练方法的流程示意图;图4为本公开一示例性实施例提供的网络模型的训练方法中涉及的模型结构示意图;图5为本公开一示例性实施例提供的网络模型的训练方法中将样本图像划分为区域图像的示意图;图6为本公开一示例性实施例提供的网络模型的训练方法的流程示意图;图7为本公开一示例性实施例提供的网络模型的训练方法中涉及的目标物识别流程示意图;图8为本公开一示例性实施例提供的网络模型的训练方法的流程示意图;图9为本公开一示例性实施例提供的网络模型的训练方法的流程示意图;图10为本公开一示例性实施例提供的网络模型的训练装置的结构示意图;图11为本公开一示例性实施例提供的网络模型的训练装置中第一损失模块的结构示意图;图12为本公开一示例性实施例提供的网络模型的训练装置中第二特征向量确定模块的结构示意图;图13为本公开一示例性实施例提供的网络模型的训练装置中第一特征向量确定模块的结构示意图;图14为本公开一示例性实施例提供的网络模型的训练装置的结构示意图;图15为本公开一示例性实施例提供的网络模型的训练装置中初始待训练网络训练模块的结构示意图;图16为本公开一示例性实施例提供的网络模型的训练装置中初始监督网络训练模块的结构示意图;图17为本公开一示例性实施例提供的电子设备的结构图。具体实施方式下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。申请概述本公开中涉及识别的目标物,通常为人物。但在其他情况下,也可以是动物、植物、车辆等各种其他物体。在一些情况下,图像中的目标物可能会被部分遮挡,所以无法通过网络模型对图像解析得到目标物完整的特征图以及特征向量,而只能利用可获得的目标物局部区域对应的特征图以及特征向量,完成分析和识别。但是在利用网络模型解析得到特征图的过程中,图像中的信息会出现一定程度的糅杂,以至于在特征图上,无法更好的确定图像中目标物的特定局部区域。例如,通过卷积神经网络模型(ConvolutionalNeuralNetworks,简称CNN)对图像进行卷积操作而得到的特征图中,这种糅杂现象便非常明显。以目标物为人像并且目标物的特定局部区域为“头部”为例。在图像中,表示人像的“头部”的所有像素,都会明显的集中在图像的某个范围内。由于信息出现糅杂,所以特征图中表示“头部”的“特征”并不是完全集中在同一范围。而在特征图中“头部”的“特征”相对较集中的范围内,也并非只有“头部”的“特征”,也会糅杂进来一些附近其他局部区域(如肩部)的“特征”。所以在这种情况下,现有的网络模型无法准确的提取出图像中目标物的特定局部区域对应的特征图,以及基于特征图进一步确定的特征向量,也就难以准确的针对目标物的局部进行分析和识别。本公开提供的网络模型的训练方法及装置,将在训练过程中,基于通过整体的样本图像得到的第一特征向量,与通过区域图像得到的第二特征向量进行相互学习,使训练得到的待训练网络能够准确的提取出图像中目标物的特定局部对应特征向量。示例性系统图1为本公开涉及的网络模型的训练系统的结构示意图。该系统中,将利用待训练网络和监督网络共同进行训练。完成训练后得到的待训练网络,可应用于目标物识别的过程当中。上述的网络模型具体可以是基于卷积神本文档来自技高网...

【技术保护点】
1.一种网络模型的训练方法,包括:/n通过待训练网络确定样本图像对应的第一特征向量;/n将所述样本图像划分为两个以上的区域图像;/n通过监督网络根据所述两个以上的区域图像确定两个以上的第二特征向量;/n基于所述第一特征向量与所述两个以上的第二特征向量,确定所述待训练网络的第一损失值;/n若所述第一损失值符合第一预设条件,调整所述待训练网络的权重参数。/n

【技术特征摘要】
1.一种网络模型的训练方法,包括:
通过待训练网络确定样本图像对应的第一特征向量;
将所述样本图像划分为两个以上的区域图像;
通过监督网络根据所述两个以上的区域图像确定两个以上的第二特征向量;
基于所述第一特征向量与所述两个以上的第二特征向量,确定所述待训练网络的第一损失值;
若所述第一损失值符合第一预设条件,调整所述待训练网络的权重参数。


2.根据权利要求1所述方法,所述基于所述第一特征向量与所述两个以上的第二特征向量,确定所述待训练网络的第一损失值包括:
利用预设的损失函数,确定所述第一特征向量与所述第二特征向量之间的距离损失值和散度损失值;
根据所述距离损失值和散度损失值,确定所述第一损失值。


3.根据权利要求1所述方法,所述通过监督网络根据所述两个以上的区域图像确定两个以上的第二特征向量包括:
基于所述监督网络的骨架结构层,确定所述两个以上的区域图像各自对应的第二特征图,得到两个以上的第二特征图;
基于所述监督网络的池化层,将所述两个以上的第二特征图分别进行全局最大池化,得到两个以上的初始第二特征向量;
基于所述监督网络的特征层,对所述两个以上的初始第二特征向量进行降维,获得两个以上的第二特征向量。


4.根据权利要求1所述方法,所述通过待训练网络确定样本图像对应的第一特征向量包括:
基于所述待训练网络的骨架结构层,确定所述样本图像对应的第一特征图;
基于所述待训练网络的池化层,对所述第一特征图进行全局最大池化,得到初始第一特征向量;
基于所述待训练网络的特征层,对所述初始第一特征向量进行降维,获得第一特征向量。


5.根据权利要求1所述方法,还包括:
若所述第一损失值不符合第一预设条件,利用所述待训练网络进行目标物识别。

【专利技术属性】
技术研发人员:张慧中朱亚旋郭少博
申请(专利权)人:南京人工智能高等研究院有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1