【技术实现步骤摘要】
一种样本生成方法、装置以及设备
[0001]本说明书涉及机器学习
,尤其涉及一种样本生成方法、装置以及设备。
技术介绍
[0002]随着计算机和互联网技术的发展,人工智能的应用也越加广泛,其中比较常见的是通过训练模型,来实现相应的功能,比如,通过模型对用户的偏好和行为进行预测、图像分析识别、用户情感计算等。
[0003]通常来说,需要采集大量的训练样本,通过该样本训练生成模型。然而,在一些场合中,可能会由于客观情况,导致所采集的样本数量过少、特征平衡性不足等情况发生。
[0004]基于此,需要一种能够提高模型准确度的样本生成方案。
技术实现思路
[0005]本说明书一个或多个实施例提供一种样本生成方法、装置、设备以及存储介质,用以解决如下技术问题:需要一种能提高证模型准确度的样本生成方案。
[0006]为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
[0007]本说明书一个或多个实施例提供的一种样本生成方法,包括:
[0008]根据物品特征,以及用户对所述物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分,所述第一偏好分高于所述第二偏好分;
[0009]根据设定的注意力扰动参数,对所述第一样本用户的注意力特征进行调整,并根据所述调整后的注意力特征,对所述第一偏好分和所述第二偏好数据进行更新;
[0010]以减小所述更新后的第一偏好分与第二偏好分之间的差距为目标,学习所述注意力扰动参数的目 ...
【技术保护点】
【技术特征摘要】
1.一种样本生成方法,包括:根据物品特征,以及用户对所述物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分,所述第一偏好分高于所述第二偏好分;根据设定的注意力扰动参数,对所述第一样本用户的注意力特征进行调整,并根据所述调整后的注意力特征,对所述第一偏好分和所述第二偏好数据进行更新;以减小所述更新后的第一偏好分与第二偏好分之间的差距为目标,学习所述注意力扰动参数的目标取值;在所述目标取值下,若所述更新后的第一偏好分低于第二偏好分,则根据所述调整后的注意力特征,生成第二样本用户,用于训练所述模型。2.如权利要求1所述的方法,所述注意力扰动参数与所述第一样本用户的注意力特征为维度相同的向量;所述根据设定的注意力扰动参数,对所述第一样本用户的注意力特征进行调整,具体包括:通过将设定的注意力扰动参数与所述第一样本用户的注意力特征相加,对所述注意力特征中的各维分别叠加对应的变化量,以完成对所述第一样本用户的注意力特征的调整。3.如权利要求1所述的方法,所述以减小所述更新后的第一偏好分与第二偏好分之间的差距为目标,学习所述注意力扰动参数的目标取值,具体包括:以有条件地最小化所述更新后的第一偏好分与第二偏好分之间的差距,以及所述注意力扰动参数的扰动程度为目标,学习所述注意力扰动参数的目标取值。4.如权利要求2所述的方法,所述学习所述注意力扰动参数的目标取值,具体包括:根据设定的屏蔽向量,将所述注意力扰动参数中的部分维度屏蔽,得到局部扰动参数;以有条件地最小化所述局部扰动参数的扰动程度为目标,学习所述屏蔽向量和所述局部扰动参数的目标取值。5.如权利要求3所述的方法,所述以有条件地最小化所述更新后的第一偏好分与第二偏好分之间的差距,以及所述注意力扰动参数的扰动程度为目标,学习所述注意力扰动参数的目标取值,具体包括:确定反映所述注意力扰动参数的扰动程度的L2范数项;确定反映所述更新后的第一偏好分与第二偏好分之间的差距的对数项;确定包含所述L2范数项和所述对数项的目标函数,并以最小化所述目标函数的取值为目标,学习所述注意力扰动参数的目标取值。6.如权利要求5所述的方法,所述确定包含所述L2范数项和所述对数项的目标函数,具体包括:确定反映所述注意力扰动参数的扰动程度的L1范数项,用于学习稀疏结构的所述注意力扰动参数;确定包含所述L1范数项、所述L2范数项和所述对数项的目标函数。7.如权利要求1所述的方法,所述第一物品和所述第二物品属于同一个商品推荐系统;所述方法还包括:利用所述第一样本用户和所述第二样本用户,训练所述模型;
通过所述训练后的模型,预测第三用户分别所述第一物品和所述第二物品的偏好分,并根据所述预测的结果,为所述第三用户推荐商品。8.如权利要求7所述的方法,所述根据物品特征,以及用户对所述物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分之前,所述方法还包括:采集第一样本用户在所述商品推荐系统中发表的评论信息;通过所述评论信息,确定所述第一样本用户对各物品特征的注意力特征;所述根据所述调整后的注意力特征,生成第二样本用户,用于训练所述模型,具体包括:根据所述调整后的注意力特征,生成第二样本用户,用于训练所述模型以及用于学习所述注意力特征。9.如权利要求7所述的方法,所述根据所述调整后的注意力特征,生成第二样本用户之前,所述方法还包括:获取所述第一样本用户所在的样本用户集合,以及所述推荐系统针对的物品集合;确定所述样本用户集合内的用户针对所述物品集合内的物品的评论积极度;根据所述第一样本用户的评论积极度与样本用户集合内的其他用户的评论积极度之间的关系,确定根据所述第一样本用户生成所述第二样本用户的生成概率,以使所述生成概率与所述第一样本用户的评论积极度负相关。10.一种样本生成装置,包括:偏好分预测模块,根据物品特征,以及用户对所述物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物...
【专利技术属性】
技术研发人员:赵鑫,陈旭,胡斌斌,张志强,周俊,
申请(专利权)人:中国人民大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。