一种领域自适应方法及装置制造方法及图纸

技术编号:17139235 阅读:31 留言:0更新日期:2018-01-27 14:58
本发明专利技术实施例公开了一种领域自适应方法及装置,在利用源领域的训练样本完成神经网络的训练过程之后,在原网络的BN层重新统计目标领域的各维特征的第二统计信息,并利用目标领域的各位特征的第二统计信息分别代替训练得到的对应BN层的第一输出模型中的第一统计信息。从而,减小源领域样本和目标领域样本在每一层输出后的分布差异,得到适应目标领域的神经网络的模型。该方法在神经网络的每一层都加入了领域自适应的调整,而且,在浅层的调整经过复杂的神经网络后,能够让最后的特征经过更复杂的转换,从而得到最优的效果。

A domain adaptive method and device

The embodiment of the invention discloses a device and a domain adaptive method, after the completion of the training process of neural network using the source domain of training samples, second statistical information of each feature in the original network BN layer recount the target domain, the first statistical information of the first output model of second statistical information and use the target domain feature you respectively instead of the corresponding BN layer trained in. Thus, the distribution difference between the sample in the source domain and the target domain after the output of each layer is reduced, and the neural network model adapts to the target domain. This method adds domain adaptive adjustment to every layer of neural network. Moreover, after adjusting the shallow layer through complex neural network, the final feature can be transformed more complex, so as to get the best result.

【技术实现步骤摘要】
一种领域自适应方法及装置
本专利技术涉及计算机
,特别是涉及一种领域自适应方法及装置。
技术介绍
基于机器学习的算法,通常是利用一个或多个特定领域(即,源领域)的训练样本进行学习,得到模型。然后,利用学习到的模型对目标领域中的测试样本进行测试,得到测试结果。通常情况下,不同领域的样本的分布不一,有着各自的特点。如果不进行领域自适应,直接将在源领域的样本集上训练得到的模型应用到目标领域的测试样本中,测试效果较差。例如,如图1所示,源领域的训练样本是网络卖家的图片,其背景一致,且物体正面居中;如图2所示,目标领域的测试样本是买家实拍的图片,特点是背景杂乱、图像质量低。如果不进行领域自适应,利用网络卖家提供的图片训练得到的图片分类模型,对买家实拍的图片进行分类时效果较差。领域自适应算法的核心在于衡量和减小不同领域之间样本的分布差异。利用源领域的样本集和目标领域的样本集,经过自适应算法,提升训练得到的模型在目标领域样本集中的测试效果。领域自适应算法的典型应用包括文本识别、图片分类和语音识别等。现有技术中,基于深度神经网络的领域自适应方法,通常采取源领域的样本特征分布和目标领域的样本特征分布进行对齐的方式。典型的方法包括,在求得源领域和目标领域的样本特征后,分别计算两个领域的样本集特征的均值和协方差,然后将源领域的特征进行“白化”和“重新着色”,使得其均值和协方差分布分别与目标领域的样本集的均值和协方差一致,从而达到领域自适应的效果。但是,这类方法只对模型输出的特征进行领域自适应的调整,并没有在提取特征环节中考虑不同领域样本差异的问题,因此领域自适应的效果较差
技术实现思路
本专利技术实施例中提供了一种领域自适应方法及装置,以解决现有技术中领域自适应效果较差的问题。为了解决上述技术问题,本专利技术实施例公开了如下技术方案:第一方面,本专利技术提供一种领域自适应方法,应用于包含批规范化BN层的神经网络中,所述方法包括:对于所述神经网络中的每一个BN层,利用源领域的训练样本集合训练得到所述BN层的第一输出模型,所述第一输出模型包含所述BN层输入的样本特征的第一统计信息;对于所述神经网络中的每一个BN层,获取所述BN层输入的来自目标领域的样本特征的第二统计信息;对于所述神经网络中的每一个BN层,利用所述BN层的第二统计信息代替所述BN层的第一输出模型中的第一统计信息,得到所述BN层对应、且能自适应所述目标领域的第二输出模型。可选地,所述第一统计信息包括输入到所述BN层的训练样本的样本特征的均值和方差;所述第二统计信息包括输入到所述BN层的测试样本的样本特征的均值和方差。可选地,所述对于所述神经网络中的每一个BN层,利用所述BN层的第二统计信息代替所述BN层的第一输出模型中的第一统计信息,得到所述BN层对应、且能自适应所述目标领域的第二输出模型,包括:对于所述神经网络中的每一个BN层,利用输入所述BN层的测试样本的样本特征的均值代替所述BN层的第一输出模型中的均值;利用所述BN层的测试样本的样本特征的方差代替所述BN层的第一输出模型中的方差,得到所述BN层对应的第二输出模型。可选地,当所述训练样本分别来自至少两个源领域时,所述利用源领域的训练样本集合训练得到所述BN层的第一输出模型,包括:按照分批统计方式,计算全部训练样本输入到所述BN层的样本特征的均值和方差,其中每一批中的训练样本来自同一个源领域;利用分批统计方式计算得到的所述样本特征的均值和方差,训练得到所述第一输出模型。可选地,所述对于所述神经网络中的每一个BN层,获取所述BN层输入的来自目标领域的样本特征的第二统计信息,包括:对于每一个BN层,利用分批统计方式计算全部测试样本输入到所述BN层的样本特征的均值和方差,得到所述第二统计信息。第二方面,提供一种领域自适应装置,应用于包含批规范化BN层的神经网络中,所述装置包括:训练模块,用于对于所述神经网络中的每一个BN层,利用源领域的训练样本集合训练得到所述BN层的第一输出模型,所述第一输出模型包含所述BN层输入的样本特征的第一统计信息;统计信息获取模块,用于对于所述神经网络中的每一个BN层,获取所述BN层输入的来自目标领域的样本特征的第二统计信息;输出模型获取模块,用于对于所述神经网络中的每一个BN层,利用所述BN层的第二统计信息代替所述BN层的第一输出模型中的第一统计信息,得到所述BN层对应、且能自适应所述目标领域的第二输出模型。可选地,所述第一统计信息包括输入到所述BN层的训练样本的样本特征的均值和方差;所述第二统计信息包括输入到所述BN层的测试样本的样本特征的均值和方差。可选地,所述输出模型获取模块包括:第一替换子模块,用于对于所述神经网络中的每一个BN层,利用输入所述BN层的测试样本的样本特征的均值代替所述BN层的第一输出模型中的均值;第二替换子模块,用于对于所述神经网络中的每一个BN层,利用所述BN层的测试样本的样本特征的方差代替所述BN层的第一输出模型中的方差,得到所述BN层对应的第二输出模型。可选地,当所述训练样本来自至少两个源领域时,所述训练模块包括:分批统计子模块,用于按照分批统计方式,计算输入到所述BN层的样本特征的均值和方差,其中每一批中的训练样本来自同一个源领域;训练子模块,用于利用所述分批统计子模块得到的所述样本特征的均值和方差,训练得到所述第一输出模型。可选地,所述统计信息获取模块,具体用于:对于每一个BN层,利用分批统计方式计算全部测试样本输入到所述BN层的样本特征的均值和方差,得到所述第二统计信息。由以上技术方案可见,本专利技术实施例提供的领域自适应方法,在利用源领域的训练样本完成神经网络的训练过程之后,在原网络的BN(BatchNormalization,批规范化)层重新统计目标领域的各维特征的第二统计信息,并利用目标领域的各位特征的第二统计信息分别代替训练得到的对应BN层的第一输出模型中的第一统计信息。从而,减小源领域样本和目标领域样本在每一层输出后的分布差异,得到适应目标领域的神经网络的模型。该方法在神经网络的每一层都加入了领域自适应的调整,而且,在浅层的调整经过复杂的神经网络后,能够让最后的特征经过更复杂的转换,从而得到最优的效果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为一种源领域训练样本图片的示意图;图2为一种目标领域测试样本图片的示意图;图3为本专利技术实施例一种领域自适应方法的流程示意图;图4为本专利技术实施例一种领域自适应装置的框图;图5为本专利技术实施例一种训练模块的框图;图6为本专利技术实施例一种输出模型获取模块的框图。具体实施方式在详细介绍本专利技术提供的领域自适应方法之前,首先相关术语进行解释说明:神经网络:由众多神经元分层连接而成,通常的神经网络包括全连接,池化以及非线性变换等操作对输入信号进行特征提取。神经网络能够学习和存储大量的输入-输出模式映射关系,学习规则(即,训练过程)是通过反向传播算法,即给定样本的标签,计算标签与网络输出之间的误差,并将此误差逐层回传到之前的层中。通过反向传播来本文档来自技高网
...
一种领域自适应方法及装置

【技术保护点】
一种领域自适应方法,应用于包含批规范化BN层的神经网络中,其特征在于,所述方法包括:对于所述神经网络中的每一个BN层,利用源领域的训练样本集合训练得到所述BN层的第一输出模型,所述第一输出模型包含所述BN层输入的样本特征的第一统计信息;对于所述神经网络中的每一个BN层,获取所述BN层输入的来自目标领域的样本特征的第二统计信息;对于所述神经网络中的每一个BN层,利用所述BN层的第二统计信息代替所述BN层的第一输出模型中的第一统计信息,得到所述BN层对应、且能自适应所述目标领域的第二输出模型。

【技术特征摘要】
1.一种领域自适应方法,应用于包含批规范化BN层的神经网络中,其特征在于,所述方法包括:对于所述神经网络中的每一个BN层,利用源领域的训练样本集合训练得到所述BN层的第一输出模型,所述第一输出模型包含所述BN层输入的样本特征的第一统计信息;对于所述神经网络中的每一个BN层,获取所述BN层输入的来自目标领域的样本特征的第二统计信息;对于所述神经网络中的每一个BN层,利用所述BN层的第二统计信息代替所述BN层的第一输出模型中的第一统计信息,得到所述BN层对应、且能自适应所述目标领域的第二输出模型。2.根据权利要求1所述的方法,其特征在于,所述第一统计信息包括输入到所述BN层的训练样本的样本特征的均值和方差;所述第二统计信息包括输入到所述BN层的测试样本的样本特征的均值和方差。3.根据权利要求2所述的方法,其特征在于,所述对于所述神经网络中的每一个BN层,利用所述BN层的第二统计信息代替所述BN层的第一输出模型中的第一统计信息,得到所述BN层对应、且能自适应所述目标领域的第二输出模型,包括:对于所述神经网络中的每一个BN层,利用输入所述BN层的测试样本的样本特征的均值代替所述BN层的第一输出模型中的均值;利用所述BN层的测试样本的样本特征的方差代替所述BN层的第一输出模型中的方差,得到所述BN层对应的第二输出模型。4.根据权利要求1所述的方法,其特征在于,当所述训练样本分别来自至少两个源领域时,所述利用源领域的训练样本集合训练得到所述BN层的第一输出模型,包括:按照分批统计方式,计算全部训练样本输入到所述BN层的样本特征的均值和方差,其中每一批中的训练样本来自同一个源领域;利用分批统计方式计算得到的所述样本特征的均值和方差,训练得到所述第一输出模型。5.根据权利要求1所述的方法,其特征在于,所述对于所述神经网络中的每一个BN层,获取所述BN层输入的来自目标领域的样本特征的第二统计信息,包括:对于每一个BN层,利用分批统计方式计算全部测试样本输入...

【专利技术属性】
技术研发人员:王乃岩
申请(专利权)人:北京图森未来科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1