基于迁移学习的训练神经网络模型的方法和装置制造方法及图纸

技术编号:24800740 阅读:19 留言:0更新日期:2020-07-07 21:14
本说明书实施例提供一种基于迁移学习的训练神经网络模型的方法和装置,方法包括:第一神经网络模型包括第一私有层、第二私有层、第一共享层、第二共享层和第一融合层,第一融合层接收第一私有层的输出和第一共享层的输出,得到第一融合结果和第二融合结果,将第一融合结果输出给第二私有层,将第二融合结果输出给第二共享层;第二神经网络模型包括第三私有层、第四私有层、第一共享层、第二共享层和第二融合层,第二融合层接收第三私有层的输出和第一共享层的输出,得到第三融合结果和第四融合结果,将第三融合结果输出给第四私有层,将第四融合结果输出给第二共享层。能够提升模型的泛化性。

【技术实现步骤摘要】
基于迁移学习的训练神经网络模型的方法和装置
本说明书一个或多个实施例涉及计算机领域,尤其涉及基于迁移学习的训练神经网络模型的方法和装置。
技术介绍
监督学习是机器学习的一个研究领域,通过给定的训练样本训练神经网络模型,利用训练后的神经网络模型来对待测样本进行预测,通常地,监督学习的训练样本包括样本标签,样本标签可以有多种形式,例如样本标签为正样本或负样本。对于目标领域的预测任务,如果目标领域的训练样本充足,则可以直接基于目标领域的训练样本训练神经网络模型;如果目标领域的训练样本不足,则可以基于迁移学习训练神经网络模型,也就是说,通过利用数据相对丰富的源领域的训练样本或模型信息等,帮助构建针对目标领域的神经网络模型,从而使得模型能够在目标领域的未见数据上有好的表现。现有技术中,在基于迁移学习训练神经网络模型时,不能灵活的适应不同场景的迁移学习诉求,泛化性不佳。因此,希望能有改进的方案,在基于迁移学习训练神经网络模型时,能够提升模型的泛化性。
技术实现思路
本说明书一个或多个实施例描述了一种基于迁本文档来自技高网...

【技术保护点】
1.一种基于迁移学习的训练神经网络模型的方法,所述方法包括:/n获取源领域的第一样本,以及目标领域的第二样本,所述第一样本包括第一样本标签,所述第二样本包括第二样本标签;/n将所述第一样本输入第一神经网络模型,得到第一预测结果,基于所述第一预测结果与所述第一样本标签之间的差异,训练所述第一神经网络模型;其中,所述第一神经网络模型至少包括第一私有层、第二私有层、第一共享层、第二共享层和第一融合层,所述第一融合层接收所述第一私有层的输出和所述第一共享层的输出作为其输入,分别得到第一融合结果和第二融合结果,将所述第一融合结果输出给所述第二私有层,将所述第二融合结果输出给所述第二共享层;/n将所述第二...

【技术特征摘要】
1.一种基于迁移学习的训练神经网络模型的方法,所述方法包括:
获取源领域的第一样本,以及目标领域的第二样本,所述第一样本包括第一样本标签,所述第二样本包括第二样本标签;
将所述第一样本输入第一神经网络模型,得到第一预测结果,基于所述第一预测结果与所述第一样本标签之间的差异,训练所述第一神经网络模型;其中,所述第一神经网络模型至少包括第一私有层、第二私有层、第一共享层、第二共享层和第一融合层,所述第一融合层接收所述第一私有层的输出和所述第一共享层的输出作为其输入,分别得到第一融合结果和第二融合结果,将所述第一融合结果输出给所述第二私有层,将所述第二融合结果输出给所述第二共享层;
将所述第二样本输入第二神经网络模型,得到第二预测结果,基于所述第二预测结果与所述第二样本标签之间的差异,训练所述第二神经网络模型;其中,所述第二神经网络模型至少包括第三私有层、第四私有层、所述第一共享层、所述第二共享层和第二融合层,所述第二融合层接收所述第三私有层的输出和所述第一共享层的输出作为其输入,分别得到第三融合结果和第四融合结果,将所述第三融合结果输出给所述第四私有层,将所述第四融合结果输出给所述第二共享层;
所述源领域对应于第一类用户,所述第一类用户使用过目标业务;所述目标领域对应于第二类用户,所述第二类用户未使用过所述目标业务;所述第一神经网络模型用于针对所述第一类用户进行预测;所述第二神经网络模型用于针对所述第二类用户进行预测。


2.如权利要求1所述的方法,其中,所述第一私有层和所述第一共享层接收所述第一样本作为其输入。


3.如权利要求1所述的方法,其中,所述第三私有层和所述第一共享层接收所述第二样本作为其输入。


4.如权利要求1所述的方法,其中,所述第一神经网络模型还包括第五私有层,所述第五私有层接收所述第二私有层的输出和所述第二共享层的输出作为其输入,所述第五私有层的输出作为所述第一神经网络模型的输出结果。


5.如权利要求1所述的方法,其中,所述第二神经网络模型还包括第六私有层,所述第六私有层接收所述第四私有层的输出和所述第二共享层的输出作为其输入,所述第六私有层的输出作为所述第二神经网络模型的输出结果。


6.如权利要求1所述的方法,其中,所述方法还包括:
将所述源领域的第一待测样本输入训练后的所述第一神经网络模型,得到所述第一待测样本的预测结果。


7.如权利要求1所述的方法,其中,所述方法还包括:
将所述目标领域的第二待测样本输入训练后的所述第二神经网络模型,得到所述第二待测样本的预测结果。


8.如权利要求1所述的方法,其中,所述第一神经网络模型用于预测所述第一类用户是否使用所述目标业务;所述第二神经网络模型用于预测所述第二类用户是否使用所述目标业务。


9.如权利要求8所述的方法,其中,所述第一样本和/或所述第二样本包括:用户的属性特征的特征值和可选权益的属性特征的特征值;所述可选权益为备选权益集合中的一项或多项权益。


10.如权利要求9所述的方法,其中,所述方法还包括:
从所述备选权益集合包括的各项权益中选取一项或多项权益,以形成多组可选权益;
根据目标用户的属性特征的特征值和每组可选权益中的各项权益分别对应的属性特征的特征值,确定目标用户对应于每组可选权益的样本;
将所述目标用户对应于每组可选权益的样本输入训练后的所述第一神经网络模型或所述第二神经网络模型,得到所述目标用户对应于每组可选权益的预测结果;
根据所述目标用户对应于每组可选权益的预测结果,从所述多组可选权益中选择向所述目标用户发放的一组可选权益。


11.一种基于迁移学习的训练神经网络模型的装置,所述装置包括:
获取单元,用于获取源领域的第一样本,以及目标领域的第二样本,所述第一样本包括第一样本标签,所述第二样本包括第二样本标签;
第一训练单元,用于将所述获取单元获取的第一样本输入第一神经网络模型,得到第一预测结果,基于所述第一预测结果与所述获取单元...

【专利技术属性】
技术研发人员:张雅淋李龙飞
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1