基于虚拟样本的模型训练方法及设备技术

技术编号：19344136 阅读：29 留言：0更新日期：2018-11-07 14:37

本发明专利技术实施例提供一种基于虚拟样本的模型训练方法及设备，包括：该方法包括：根据用户的历史操作数据获取真实样本，所述真实样本包括第一样本特征和所述第一样本特征对应的第一标签，所述第一标签是根据所述第一样本特征所属的分类确定的分类值；获取虚拟样本，所述虚拟样本包括第二样本特征和所述第二样本特征对应的第二标签，所述第二标签是根据预设分类确定的分类值，所述第二样本特征所属的分类被设定为所述预设分类；根据所述真实样本和所述虚拟样本对待训练的模型进行训练，得到训练后的模型。本发明专利技术实施例通过在样本层面实现探索，不需要改变模型的代码等，降低了成本。

Model training method and equipment based on virtual samples

The embodiment of the present invention provides a model training method and device based on virtual samples, including: the method includes acquiring real samples according to user's historical operation data, the real samples include the first sample feature and the first label corresponding to the first sample feature, and the first label is based on the first sample feature. The virtual sample includes the second sample feature and the second label corresponding to the second sample feature, the second label is the classification value determined according to the preset classification, and the classification of the second sample feature is set to the preset classification according to the preset classification. The real sample and the virtual sample train the training model and obtain the training model. The embodiment of the invention reduces the cost by exploring at the sample level without changing the code of the model, etc.

全部详细技术资料下载

【技术实现步骤摘要】
基于虚拟样本的模型训练方法及设备
本专利技术实施例涉及机器学习领域，尤其涉及一种基于虚拟样本的模型训练方法及设备。
技术介绍
随着人工智能(ArtificialIntelligence，AI)技术的快速发展及突破，机器学习技术的应用越来越普遍。目前，机器学习技术最常使用的模型为监督学习模型或半监督学习模型。现有技术中，待训练的监督学习模型的输入为从大量的历史经验中获取的样本，该样本包括样本特征以及该样本特征对应的标签(期望输出)，该标签可以理解为对样本特征的分类结果。在样本输入模型后，进行训练得到训练完成的监督学习模型(可以理解为一个函数)。在使用该监督学习模型时，该监督学习模型可以将输入的数据映射为相应的输出，对输出进行简单的判断从而实现分类的目的。该监督学习模型可以应用到智能推荐系统或智能检索系统，上述系统可以基于该监督学习模型进行贪心决策，以获得整体收益的最大化。一般而言，模型的泛化能力是有限的。例如在一个推荐系统中，对于某个用户而言，其样本都是非常稀疏的，不可能覆盖所有的被推荐物品。如果一个新用户A只点击过物品B(“用户A和物品B”为样本特征，分类结果为“点击”，标签可设为1)，那么基于贪心算法只会给该用户推荐物品B，而不会尝试别的可能更好的推荐，这种决策明显不合理。为了让贪心策略之外的其他策略也有执行的机会，现有技术在模型中引入探索策略，例如随机探索策略等，从而向新用户可以推荐更多的物品，尽可能的将收益最大化。然而，在模型中引入探索策略涉及模型的代码学习、开发、效果评估、测试、上线等环节，不仅使得模型的获取难度高，还导致成本高。
技术实现思路
本专利...

【技术保护点】
1.一种基于虚拟样本的模型训练方法，其特征在于，包括：根据用户的历史操作数据获取真实样本，所述真实样本包括第一样本特征和所述第一样本特征对应的第一标签，所述第一标签是根据所述第一样本特征所属的分类确定的分类值；获取虚拟样本，所述虚拟样本包括第二样本特征和所述第二样本特征对应的第二标签，所述第二标签是根据预设分类确定的分类值，所述第二样本特征所属的分类被设定为所述预设分类；根据所述真实样本和所述虚拟样本对待训练的模型进行训练，得到训练后的模型。

【技术特征摘要】
1.一种基于虚拟样本的模型训练方法，其特征在于，包括：根据用户的历史操作数据获取真实样本，所述真实样本包括第一样本特征和所述第一样本特征对应的第一标签，所述第一标签是根据所述第一样本特征所属的分类确定的分类值；获取虚拟样本，所述虚拟样本包括第二样本特征和所述第二样本特征对应的第二标签，所述第二标签是根据预设分类确定的分类值，所述第二样本特征所属的分类被设定为所述预设分类；根据所述真实样本和所述虚拟样本对待训练的模型进行训练，得到训练后的模型。2.根据权利要求1所述的方法，其特征在于，所述获取虚拟样本，包括：根据所述历史操作数据和启发式算法，得到所述第二样本特征，或者，在预设样本特征空间中均匀采样，得到所述第二样本特征；根据所述预设分类设置所述第二样本特征对应的第二标签。3.根据权利要求1所述的方法，其特征在于，所述根据所述真实样本和所述虚拟样本对待训练的模型进行训练，得到训练后的模型，包括：获取第一数量的真实样本和第二数量的虚拟样本；其中，所述第一数量与所述第二数量满足预设映射关系；根据所述第一数量的真实样本和所述第二数量的虚拟样本对所述待训练的模型进行训练，得到训练后的模型。4.根据权利要求1所述的方法，其特征在于，所述根据所述真实样本和所述虚拟样本对待训练的模型进行训练，得到训练后的模型，包括：在每个训练周期内，获取第三数量的真实样本和第四数量的虚拟样本；根据所述第三数量的真实样本和第一学习率对所述待训练的模型进行训练，得到更新后的模型；根据所述第四数量的虚拟样本和第二学习率对所述更新后的模型进行训练，得到本周期训练后的模型；其中，所述本周期训练后的模型为下一周期待训练的模型，所述第三数量与所述第四数量相等，所述第二学习率与所述第一学习率不同。5.根据权利要求4所述的方法，其特征在于，在不同的训练周期内，所述真实样本的第一学习率相同；随着训练周期次序的逐渐递增，各所述虚拟样本的第二学习率逐渐衰减。6.根据权利要求1所述的方法，其特征在于，所述待训练的模型包括输入层、隐层以及输出层；所述根据所述真实样本和所述虚拟样本对待训练的模型进行训练，得到训练后的模型，包括：通过所述输入层将所述第一样本特征和所述第二样本特征输入至所述待训练的模型，并根据所述第一标签和所述第二标签对所述待训练的模型进行训练，得到训练后的模型。7.根据权利要求1所述的方法，其特征在于，所述待训练的模型包括输入层、隐层以及输出层；所述获取虚拟样本，包括：获取所述隐层的特征空间，根据所述隐层的特征空间，获取虚拟样本；所述根据所述真实样本和所述虚拟样本对待训练的模型进行训练，得到训练后的模型，包括：通过所述输入层将所述第一样本特征输入至所述待训练的模型，以及通过所述隐层将所述第二样本特征输入至所述待训练的模型；根据所述第一标签和所述第二标签对所述待训练的模型进行训练，得到训练后的模型。8.根据权利要求1至7任一项所述的方法，其特征在于，所述待训练的模型为监督学习模型或半监督学习模型。9.一种基于虚拟样本的模型训练设备，其特征在于，包括：真实样本获取模块，用于根据用户的历史操作数据获取真实样本，所述真实样本包括第一样本特征...

【专利技术属性】
技术研发人员：梁华盛，王帆，陈梦婷，田浩，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人