The embodiment of the invention discloses a device and a domain adaptive method, after the completion of the training process of neural network using the source domain of training samples, second statistical information of each feature in the original network BN layer recount the target domain, the first statistical information of the first output model of second statistical information and use the target domain feature you respectively instead of the corresponding BN layer trained in. Thus, the distribution difference between the sample in the source domain and the target domain after the output of each layer is reduced, and the neural network model adapts to the target domain. This method adds domain adaptive adjustment to every layer of neural network. Moreover, after adjusting the shallow layer through complex neural network, the final feature can be transformed more complex, so as to get the best result.
【技术实现步骤摘要】
一种领域自适应方法及装置
本专利技术涉及计算机
,特别是涉及一种领域自适应方法及装置。
技术介绍
基于机器学习的算法,通常是利用一个或多个特定领域(即,源领域)的训练样本进行学习,得到模型。然后,利用学习到的模型对目标领域中的测试样本进行测试,得到测试结果。通常情况下,不同领域的样本的分布不一,有着各自的特点。如果不进行领域自适应,直接将在源领域的样本集上训练得到的模型应用到目标领域的测试样本中,测试效果较差。例如,如图1所示,源领域的训练样本是网络卖家的图片,其背景一致,且物体正面居中;如图2所示,目标领域的测试样本是买家实拍的图片,特点是背景杂乱、图像质量低。如果不进行领域自适应,利用网络卖家提供的图片训练得到的图片分类模型,对买家实拍的图片进行分类时效果较差。领域自适应算法的核心在于衡量和减小不同领域之间样本的分布差异。利用源领域的样本集和目标领域的样本集,经过自适应算法,提升训练得到的模型在目标领域样本集中的测试效果。领域自适应算法的典型应用包括文本识别、图片分类和语音识别等。现有技术中,基于深度神经网络的领域自适应方法,通常采取源领域的样本特征分布和目标领域的样本特征分布进行对齐的方式。典型的方法包括,在求得源领域和目标领域的样本特征后,分别计算两个领域的样本集特征的均值和协方差,然后将源领域的特征进行“白化”和“重新着色”,使得其均值和协方差分布分别与目标领域的样本集的均值和协方差一致,从而达到领域自适应的效果。但是,这类方法只对模型输出的特征进行领域自适应的调整,并没有在提取特征环节中考虑不同领域样本差异的问题,因此领域自适应的效果较差 ...
【技术保护点】
一种领域自适应方法,应用于包含批规范化BN层的神经网络中,其特征在于,所述方法包括:对于所述神经网络中的每一个BN层,利用源领域的训练样本集合训练得到所述BN层的第一输出模型,所述第一输出模型包含所述BN层输入的样本特征的第一统计信息;对于所述神经网络中的每一个BN层,获取所述BN层输入的来自目标领域的样本特征的第二统计信息;对于所述神经网络中的每一个BN层,利用所述BN层的第二统计信息代替所述BN层的第一输出模型中的第一统计信息,得到所述BN层对应、且能自适应所述目标领域的第二输出模型。
【技术特征摘要】
1.一种领域自适应方法,应用于包含批规范化BN层的神经网络中,其特征在于,所述方法包括:对于所述神经网络中的每一个BN层,利用源领域的训练样本集合训练得到所述BN层的第一输出模型,所述第一输出模型包含所述BN层输入的样本特征的第一统计信息;对于所述神经网络中的每一个BN层,获取所述BN层输入的来自目标领域的样本特征的第二统计信息;对于所述神经网络中的每一个BN层,利用所述BN层的第二统计信息代替所述BN层的第一输出模型中的第一统计信息,得到所述BN层对应、且能自适应所述目标领域的第二输出模型。2.根据权利要求1所述的方法,其特征在于,所述第一统计信息包括输入到所述BN层的训练样本的样本特征的均值和方差;所述第二统计信息包括输入到所述BN层的测试样本的样本特征的均值和方差。3.根据权利要求2所述的方法,其特征在于,所述对于所述神经网络中的每一个BN层,利用所述BN层的第二统计信息代替所述BN层的第一输出模型中的第一统计信息,得到所述BN层对应、且能自适应所述目标领域的第二输出模型,包括:对于所述神经网络中的每一个BN层,利用输入所述BN层的测试样本的样本特征的均值代替所述BN层的第一输出模型中的均值;利用所述BN层的测试样本的样本特征的方差代替所述BN层的第一输出模型中的方差,得到所述BN层对应的第二输出模型。4.根据权利要求1所述的方法,其特征在于,当所述训练样本分别来自至少两个源领域时,所述利用源领域的训练样本集合训练得到所述BN层的第一输出模型,包括:按照分批统计方式,计算全部训练样本输入到所述BN层的样本特征的均值和方差,其中每一批中的训练样本来自同一个源领域;利用分批统计方式计算得到的所述样本特征的均值和方差,训练得到所述第一输出模型。5.根据权利要求1所述的方法,其特征在于,所述对于所述神经网络中的每一个BN层,获取所述BN层输入的来自目标领域的样本特征的第二统计信息,包括:对于每一个BN层,利用分批统计方式计算全部测试样本输入...
【专利技术属性】
技术研发人员:王乃岩,
申请(专利权)人:北京图森未来科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。