一种迁移学习训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号：32209378 阅读：14 留言：0更新日期：2022-02-09 17:15

本公开提供了一种迁移学习训练方法、装置、电子设备及存储介质，涉及数据处理技术领域，尤其涉及深度学习技术领域，包括：获取源域样本；利用一阶段模型计算每个源域数据的第一交叉熵并根据第一交叉熵计算相似度权重；获取目标域样本；利用二阶段模型计算每个源域数据和每个目标域数据的第二交叉熵；根据每个源域数据和每个目标域数据的第二交叉熵与相似度权重计算每个源域数据和每个目标域数据的第三交叉熵；根据每个源域数据和每个目标域数据的第三交叉熵对二阶段模型进行参数更新；将参数更新后的二阶段模型对业务数据进行预估或排序。排序。排序。

全部详细技术资料下载

【技术实现步骤摘要】
一种迁移学习训练方法、装置、电子设备及存储介质

[0001]本公开涉及数据处理
，尤其涉及深度学习

技术介绍

[0002]现有的迁移学习训练方法是直接利用源域样本的数据与目标域样本的数据对目标域模型进行联合训练，但源域的场景的数据分布与当前场景也就是目标域的场景的数据分布并不一致，甚至有较大的差异性，直接进行全量的联合训练会对当前场景的模型产生负迁移现象，不但无法提升反而会降低当前场景的模型的性能，而抽样的联合训练控制了引入的源域样本的数量，但由于并没有解决源域样本数据分布与当前场景数据分布的差异性，只能从一定程度上减轻负迁移现象，同样很难改变数据差异对当前场景模型的影响，而利用迁移学习效果较好的网络结构，虽然能够有效地减缓负迁移现象，但是针对不同的业务场景需要耗费大量的人力成本去调整网络结构的模型参数。

技术实现思路

[0003]本公开提供了一种迁移学习训练方法、装置、电子设备及存储介质。
[0004]根据本公开的一方面，提供了一种迁移学习训练方法，包括：
[0005]获取源域样本，所述源域样本中包含多个源域数据和与源域数据对应的标签值；
[0006]利用一阶段模型计算每个源域数据的第一交叉熵并根据第一交叉熵计算相似度权重；
[0007]获取目标域样本，所述目标域样本中包含多个目标域数据和与目标域数据对应的标签值；
[0008]利用二阶段模型计算每个源域数据和每个目标域数据的第二交叉熵；
[0009]根据每个源域数据和每个目标域数据的第

【技术保护点】

【技术特征摘要】
1.一种迁移学习训练方法，包括：获取源域样本，所述源域样本中包含多个源域数据和与源域数据对应的标签值；利用一阶段模型计算每个源域数据的第一交叉熵并根据第一交叉熵计算相似度权重；获取目标域样本，所述目标域样本中包含多个目标域数据和与目标域数据对应的标签值；利用二阶段模型计算每个源域数据和每个目标域数据的第二交叉熵；根据每个源域数据和每个目标域数据的第二交叉熵与相似度权重计算每个源域数据和每个目标域数据的第三交叉熵；根据每个源域数据和每个目标域数据的第三交叉熵对所述二阶段模型进行参数更新；将参数更新后的二阶段模型对业务数据进行预估或排序。2.根据权利要求1所述的方法，所述利用一阶段模型计算每个源域数据的第一交叉熵并根据第一交叉熵计算相似度权重，包括：利用一阶段模型提取每个源域数据在预设N个维度上的特征数据；根据每个源域数据中在预设N个维度上的特征数据对该源域数据进行预估，得到每个源域数据对应的预估值；根据每个源域数据的标签值与预估值计算该源域数据的第一交叉熵；根据每个源域数据的第一交叉熵计算该源域数据的相似度权重。3.根据权利要求2所述的方法，所述利用二阶段模型计算每个源域数据和每个目标域数据的第二交叉熵，包括：利用二阶段模型提取每个源域数据和每个目标域数据在预设M个维度上的特征数据，所述预设M个维度比预设N个维度多出L个维度，所述L个维度上的特征数据能够表征源域数据和目标域数据的差异性；根据每个源域数据和每个目标域数据在预设M个维度上的特征数据对每个源域数据和每个目标域数据进行预估，得到每个源域数据和每个目标域数据的预估值；根据每个源域数据和每个目标域数据的标签值与预估值计算每个源域数据和每个目标域数据的第二交叉熵。4.根据权利要求1所述的方法，所述利用一阶段模型计算每个源域数据的第一交叉熵之后，还包括：利用所述一阶段模型计算每个源域数据的第一交叉熵之后不对所述一阶段模型进行参数更新。5.根据权利要求1所述的方法，所述利用一阶段模型计算每个...

【专利技术属性】
技术研发人员：吴学超，周杨，白云龙，秦才霞，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人