一种样本生成方法、装置以及设备制造方法及图纸

技术编号:34256039 阅读:17 留言:0更新日期:2022-07-24 12:42
本说明书实施例公开了一种样本生成方法、装置以及设备。方案包括:根据物品特征,以及用户对物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分,第一偏好分高于第二偏好分;根据设定的注意力扰动参数,对第一样本用户的注意力特征进行调整,并根据调整后的注意力特征,对第一偏好分和第二偏好数据进行更新;以减小更新后的第一偏好分与第二偏好分之间的差距为目标,学习注意力扰动参数的目标取值;在目标取值下,若更新后的第一偏好分低于第二偏好分,则根据调整后的注意力特征,生成第二样本用户,用于训练模型。用于训练模型。用于训练模型。

A sample generation method, device and equipment

【技术实现步骤摘要】
一种样本生成方法、装置以及设备


[0001]本说明书涉及机器学习
,尤其涉及一种样本生成方法、装置以及设备。

技术介绍

[0002]随着计算机和互联网技术的发展,人工智能的应用也越加广泛,其中比较常见的是通过训练模型,来实现相应的功能,比如,通过模型对用户的偏好和行为进行预测、图像分析识别、用户情感计算等。
[0003]通常来说,需要采集大量的训练样本,通过该样本训练生成模型。然而,在一些场合中,可能会由于客观情况,导致所采集的样本数量过少、特征平衡性不足等情况发生。
[0004]基于此,需要一种能够提高模型准确度的样本生成方案。

技术实现思路

[0005]本说明书一个或多个实施例提供一种样本生成方法、装置、设备以及存储介质,用以解决如下技术问题:需要一种能提高证模型准确度的样本生成方案。
[0006]为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
[0007]本说明书一个或多个实施例提供的一种样本生成方法,包括:
[0008]根据物品特征,以及用户对所述物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分,所述第一偏好分高于所述第二偏好分;
[0009]根据设定的注意力扰动参数,对所述第一样本用户的注意力特征进行调整,并根据所述调整后的注意力特征,对所述第一偏好分和所述第二偏好数据进行更新;
[0010]以减小所述更新后的第一偏好分与第二偏好分之间的差距为目标,学习所述注意力扰动参数的目标取值;
[0011]在所述目标取值下,若所述更新后的第一偏好分低于第二偏好分,则根据所述调整后的注意力特征,生成第二样本用户,用于训练所述模型。
[0012]本说明书一个或多个实施例提供的一种样本生成装置,包括:
[0013]偏好分预测模块,根据物品特征,以及用户对所述物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分,所述第一偏好分高于所述第二偏好分;
[0014]特征调整模块,根据设定的注意力扰动参数,对所述第一样本用户的注意力特征进行调整,并根据所述调整后的注意力特征,对所述第一偏好分和所述第二偏好数据进行更新;
[0015]扰动参数学习模块,以减小所述更新后的第一偏好分与第二偏好分之间的差距为目标,学习所述注意力扰动参数的目标取值;
[0016]样本用户生成模块,在所述目标取值下,若所述更新后的第一偏好分低于第二偏好分,则根据所述调整后的注意力特征,生成第二样本用户,用于训练所述模型。
[0017]本说明书一个或多个实施例提供的一种样本生成设备,包括:
[0018]至少一个处理器;以及,
[0019]与所述至少一个处理器通信连接的存储器;其中,
[0020]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
[0021]根据物品特征,以及用户对所述物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分,所述第一偏好分高于所述第二偏好分;
[0022]根据设定的注意力扰动参数,对所述第一样本用户的注意力特征进行调整,并根据所述调整后的注意力特征,对所述第一偏好分和所述第二偏好数据进行更新;
[0023]以减小所述更新后的第一偏好分与第二偏好分之间的差距为目标,学习所述注意力扰动参数的目标取值;
[0024]在所述目标取值下,若所述更新后的第一偏好分低于第二偏好分,则根据所述调整后的注意力特征,生成第二样本用户,用于训练所述模型。
[0025]本说明书一个或多个实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
[0026]根据物品特征,以及用户对所述物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分,所述第一偏好分高于所述第二偏好分;
[0027]根据设定的注意力扰动参数,对所述第一样本用户的注意力特征进行调整,并根据所述调整后的注意力特征,对所述第一偏好分和所述第二偏好数据进行更新;
[0028]以减小所述更新后的第一偏好分与第二偏好分之间的差距为目标,学习所述注意力扰动参数的目标取值;
[0029]在所述目标取值下,若所述更新后的第一偏好分低于第二偏好分,则根据所述调整后的注意力特征,生成第二样本用户,用于训练所述模型。
[0030]本说明书一个或多个实施例采用的上述至少一个技术方案能够达到以下有益效果:
[0031]通过注意力扰动参数调整后的注意力特征,重新对第一样本用户进行偏好分的预测。若第一偏好分低于第二偏好分,则说明通过对第一样本用户的注意力特征调整后,其更偏好的物品已经由第一物品变为了第二物品,此次调整决策对于用户的影响很大,也就说明本次调整的向量对于该用户来说是较为重要的向量。此时根据调整后的注意力特征生成第二样本用户,能够在增加样本数量的同时,相比于随机改变第一样本用户的注意力特征生成新的样本等其他方式,由于增加了不同标签(偏好物品的改变,导致了样本标签的变化)的样本,还能够提高样本中的平衡性。通过平衡性更高的样本训练,也就提高了训练得到的模型的准确度。
附图说明
[0032]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是
本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0033]图1为本说明书一个或多个实施例提供的一种样本生成方法的流程示意图;
[0034]图2为本说明书一个或多个实施例提供的,一种应用场景下的偏好分比较的示意图;
[0035]图3为本说明书一个或多个实施例提供的,一种应用场景下的注意力扰动参数的调整示意图;
[0036]图4为本说明书一个或多个实施例提供的一种样本生成装置的结构示意图;
[0037]图5为本说明书一个或多个实施例提供的一种样本生成设备的结构示意图。
具体实施方式
[0038]本说明书实施例提供一种样本生成方法、装置、设备以及存储介质。
[0039]为了使本
的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0040]图1为本说明书一个或多个实施例提供的一种样本生成方法的流程示意图。该方法可以应用于不同的业务领域,比如,人工智能领域、电商业务领域、互联网金融业务领本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种样本生成方法,包括:根据物品特征,以及用户对所述物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分,所述第一偏好分高于所述第二偏好分;根据设定的注意力扰动参数,对所述第一样本用户的注意力特征进行调整,并根据所述调整后的注意力特征,对所述第一偏好分和所述第二偏好数据进行更新;以减小所述更新后的第一偏好分与第二偏好分之间的差距为目标,学习所述注意力扰动参数的目标取值;在所述目标取值下,若所述更新后的第一偏好分低于第二偏好分,则根据所述调整后的注意力特征,生成第二样本用户,用于训练所述模型。2.如权利要求1所述的方法,所述注意力扰动参数与所述第一样本用户的注意力特征为维度相同的向量;所述根据设定的注意力扰动参数,对所述第一样本用户的注意力特征进行调整,具体包括:通过将设定的注意力扰动参数与所述第一样本用户的注意力特征相加,对所述注意力特征中的各维分别叠加对应的变化量,以完成对所述第一样本用户的注意力特征的调整。3.如权利要求1所述的方法,所述以减小所述更新后的第一偏好分与第二偏好分之间的差距为目标,学习所述注意力扰动参数的目标取值,具体包括:以有条件地最小化所述更新后的第一偏好分与第二偏好分之间的差距,以及所述注意力扰动参数的扰动程度为目标,学习所述注意力扰动参数的目标取值。4.如权利要求2所述的方法,所述学习所述注意力扰动参数的目标取值,具体包括:根据设定的屏蔽向量,将所述注意力扰动参数中的部分维度屏蔽,得到局部扰动参数;以有条件地最小化所述局部扰动参数的扰动程度为目标,学习所述屏蔽向量和所述局部扰动参数的目标取值。5.如权利要求3所述的方法,所述以有条件地最小化所述更新后的第一偏好分与第二偏好分之间的差距,以及所述注意力扰动参数的扰动程度为目标,学习所述注意力扰动参数的目标取值,具体包括:确定反映所述注意力扰动参数的扰动程度的L2范数项;确定反映所述更新后的第一偏好分与第二偏好分之间的差距的对数项;确定包含所述L2范数项和所述对数项的目标函数,并以最小化所述目标函数的取值为目标,学习所述注意力扰动参数的目标取值。6.如权利要求5所述的方法,所述确定包含所述L2范数项和所述对数项的目标函数,具体包括:确定反映所述注意力扰动参数的扰动程度的L1范数项,用于学习稀疏结构的所述注意力扰动参数;确定包含所述L1范数项、所述L2范数项和所述对数项的目标函数。7.如权利要求1所述的方法,所述第一物品和所述第二物品属于同一个商品推荐系统;所述方法还包括:利用所述第一样本用户和所述第二样本用户,训练所述模型;
通过所述训练后的模型,预测第三用户分别所述第一物品和所述第二物品的偏好分,并根据所述预测的结果,为所述第三用户推荐商品。8.如权利要求7所述的方法,所述根据物品特征,以及用户对所述物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分之前,所述方法还包括:采集第一样本用户在所述商品推荐系统中发表的评论信息;通过所述评论信息,确定所述第一样本用户对各物品特征的注意力特征;所述根据所述调整后的注意力特征,生成第二样本用户,用于训练所述模型,具体包括:根据所述调整后的注意力特征,生成第二样本用户,用于训练所述模型以及用于学习所述注意力特征。9.如权利要求7所述的方法,所述根据所述调整后的注意力特征,生成第二样本用户之前,所述方法还包括:获取所述第一样本用户所在的样本用户集合,以及所述推荐系统针对的物品集合;确定所述样本用户集合内的用户针对所述物品集合内的物品的评论积极度;根据所述第一样本用户的评论积极度与样本用户集合内的其他用户的评论积极度之间的关系,确定根据所述第一样本用户生成所述第二样本用户的生成概率,以使所述生成概率与所述第一样本用户的评论积极度负相关。10.一种样本生成装置,包括:偏好分预测模块,根据物品特征,以及用户对所述物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物...

【专利技术属性】
技术研发人员:赵鑫陈旭胡斌斌张志强周俊
申请(专利权)人:中国人民大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1