获取用户特征表示和目标对象推荐方法、装置和设备制造方法及图纸

技术编号:34119966 阅读:18 留言:0更新日期:2022-07-14 12:47
本申请公开了一种获取用户特征表示和目标对象推荐方法、装置和设备,涉及计算机技术领域。通过自动编码器对用户行为序列进行编码后,基于该用户特征表示向量对用户进行域判别,当无法判别用户所属的用户域时,则得到了用户的通用特征表示,从而通过对抗训练的方式使得模型能够对各个用户域的用户进行通用表示,以从根本上解决重跨域推荐数据稀疏的问题,也就解决了不重合的用户没有办法实现跨域增强的问题,实现不同用户域的通用特征表示,进而为后续单域中的序列推荐奠定基础。进而为后续单域中的序列推荐奠定基础。进而为后续单域中的序列推荐奠定基础。

【技术实现步骤摘要】
获取用户特征表示和目标对象推荐方法、装置和设备


[0001]本申请涉及计算机
,尤其涉及智能推荐
,提供一种获取用户特征表示和目标对象推荐方法、装置和设备。

技术介绍

[0002]目前,通过大数据分析得到用户喜好,进而为用户推荐符合其喜好的内容,可以为用户提供更优质的网络浏览体验。任何的推荐系统都需要建立在庞大的数据基础上,数据稀疏则会直接影响最终的推荐效果。
[0003]序列推荐模型通过对每个用户的行为序列进行建模得到用户的偏好来预测用户未来可能感兴趣的物品,所以相对而言,序列推荐对用户行为的丰富度的要求会比其传统推荐算法更高,因此受到数据稀疏的影响也会更大。为了解决序列推荐系统中数据稀疏的问题,可以利用跨域信息做跨域推荐。跨域推荐能够利用从源域中学到的辅助信息来改善目标域中的数据稀疏的问题从而增强目标域的推荐。
[0004]但是,目前大多数现有的跨域推荐解决方案只能作用于两个域中重叠部分的用户,而对于不重合的用户没有办法实现跨域增强。然而实际系统中两个域重合用户占比很小,所以这类方案对于提高目标域整体的推荐效果是有限的。

技术实现思路

[0005]本申请实施例提供一种获取用户特征表示和目标对象推荐方法、装置和设备,用于解决不重合的用户没有办法实现跨域增强的问题,实现不同用户域的通用特征表示。
[0006]一方面,提供一种获取用户特征表示的方法,所述方法包括:
[0007]根据目标用户域内的目标用户针对目标对象的操作行为,得到所述目标用户的历史行为序列,所述历史行为序列包括所述目标用户在所述目标用户域内操作过的多个目标对象;
[0008]通过已训练的用户特征表示模型对所述历史行为序列进行特征编码,得到所述目标用户的用户特征表示向量;
[0009]其中,所述用户特征表示模型是根据多个用户域内各个用户的样本行为序列训练得到的,且在对所述用户特征表示模型进行训练时,通过所述用户特征表示模型分别获得各个样本行为序列对应的用户特征表示向量,并基于每个用户特征表示向量获得相应用户属于各个用户域的概率值,当获得的相应用户属于各个用户域的概率值中,任意两个概率值之间的差异度不大于预设差异度阈值时,所述用户特征表示模型收敛。
[0010]一方面,提供一种目标对象推荐方法,所述方法包括:
[0011]获取目标用户在目标用户域中的历史行为序列;
[0012]通过上述方面中获取用户特征表示的方法对所述历史行为序列进行特征编码,得到所述目标用户的第一用户特征表示向量;
[0013]根据所述第一用户特征表示向量与所述目标用户的短期行为序列,通过已训练的
目标对象推荐模型确定为所述目标用户推荐的至少一个目标对象;所述短期行为序列包括所述历史行为序列中距离当前时刻最近的M个目标对象;
[0014]其中,所述目标对象推荐模型是根据多个训练样本训练得到的,每个训练样本包括一个用户的用户特征表示向量以及历史行为序列,且在每一次训练过程中,所述目标对象推荐模型根据每个训练样本包括的用户特征表示向量,以及所述历史行为序列包括的N个目标对象中前M个目标对象预测得到至少一个目标对象,并根据所述至少一个目标对象与剩余的N

M个目标对象之间的差异度更新所述目标对象推荐模型,N和M为正整数。
[0015]可选的,根据所述第一用户特征表示向量与所述目标用户的短期行为序列,通过已训练的目标对象推荐模型确定为所述目标用户推荐的至少一个目标对象,包括:
[0016]对所述第一用户特征表示向量和所述短期用户行为序列进行特征编码,得到所述目标用户的第二用户特征表示向量;
[0017]根据所述目标用户域包括的目标对象的对象特征表示向量,与所述第二用户特征表示向量之间的相似度,确定所述至少一个目标对象。
[0018]一方面,提供一种获取用户特征表示的装置,所述装置包括:
[0019]数据获取单元,用于根据目标用户域内的目标用户针对目标对象的操作行为,得到所述目标用户的历史行为序列,所述历史行为序列包括所述目标用户在所述目标用户域内操作过的多个目标对象;
[0020]特征编码单元,用于通过已训练的用户特征表示模型对所述历史行为序列进行特征编码,得到所述目标用户的用户特征表示向量;
[0021]其中,所述用户特征表示模型是根据多个用户域内各个用户的样本行为序列训练得到的,且在对所述用户特征表示模型进行训练时,通过所述用户特征表示模型分别获得各个样本行为序列对应的用户特征表示向量,并基于每个用户特征表示向量获得相应用户属于各个用户域的概率值,当获得的相应用户属于各个用户域的概率值中,任意两个概率值之间的差异度不大于预设差异度阈值时,所述用户特征表示模型收敛。
[0022]可选的,所述装置还包括模型训练单元、解码单元和域识别单元;
[0023]所述数据获取单元,还用于获得样本行为序列集合,所述样本行为序列集合包含多个用户域内各个用户的样本行为序列;
[0024]所述模型训练单元,用于基于所述样本行为序列集合,对所述用户特征表示模型进行循环迭代训练,其中,一次训练过程包括如下步骤:
[0025]调用所述特征编码单元对获得的各个样本行为序列进行特征编码,分别得到相应的用户特征表示向量;
[0026]调用所述域识别单元基于获得的所述各个用户特征表示向量,分别确定相应用户属于各个用户域的多个归属概率,每个用户域对应一个归属概率;
[0027]若基于和所述各个用户对应的多个归属概率,确定所述用户特征表示模型满足收敛条件,则训练结束;所述收敛条件至少包括:任一用户对应的多个归属概率中,任意两个归属概率之间的差异度不大于所述预设差异度阈值;
[0028]若基于所述各个用户对应的归属概率,确定所述用户特征表示模型未满足收敛条件时,则基于所述各个用户对应的归属概率,对所述用户特征表示模型进行参数调整。
[0029]可选的,所述模型训练单元,还用于:
[0030]调用所述解码单元基于获得的各个用户特征表示向量,分别针对相应用户获得预测行为序列,以及基于获得的各个预测行为序列与相应的样本行为序列的比对结果,确定损失值;
[0031]则所述收敛条件还包括:所述损失值不大于预设损失值阈值。
[0032]可选的,所述多个用户域中包括至少一个重合用户,所述重合用户在所述多个用户域中的用户标识相同,则所述收敛条件还包括:
[0033]针对每个重合用户,基于所述每个重合用户在各个用户域的样本行为序列获得的各个用户特征表示向量中,任意两个用户特征表示向量的相似度不小于预设相似度阈值。
[0034]可选的,所述特征编码单元,具体用于:
[0035]获取所述样本行为序列中每个目标对象的内容特征表示向量和位置特征表示向量;所述位置特征表示向量用于表征目标对象在所述样本行为序列中的位置信息;
[0036]根据获得的各个目标对象的内容特征表示向量和位置本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种获取用户特征表示的方法,其特征在于,所述方法包括:根据目标用户域内的目标用户针对目标对象的操作行为,得到所述目标用户的历史行为序列,所述历史行为序列包括所述目标用户在所述目标用户域内操作过的多个目标对象;通过已训练的用户特征表示模型对所述历史行为序列进行特征编码,得到所述目标用户的用户特征表示向量;其中,所述用户特征表示模型是根据多个用户域内各个用户的样本行为序列训练得到的,且在对所述用户特征表示模型进行训练时,通过所述用户特征表示模型分别获得各个样本行为序列对应的用户特征表示向量,并基于每个用户特征表示向量获得相应用户属于各个用户域的概率值,当获得的相应用户属于各个用户域的概率值中,任意两个概率值之间的差异度不大于预设差异度阈值时,所述用户特征表示模型收敛。2.如权利要求1所述的方法,其特征在于,所述用户特征表示模型是采用以下方式进行训练的:获得样本行为序列集合,所述样本行为序列集合包含多个用户域内各个用户的样本行为序列;基于所述样本行为序列集合,对所述用户特征表示模型进行循环迭代训练,其中,一次训练过程包括如下步骤:对获得的各个样本行为序列进行特征编码,分别得到相应的用户特征表示向量;基于获得的所述各个用户特征表示向量,分别确定相应用户属于各个用户域的多个归属概率,每个用户域对应一个归属概率;若基于所述各个用户对应的多个归属概率,确定所述用户特征表示模型满足收敛条件,则训练结束;所述收敛条件至少包括:任一用户对应的多个归属概率中,任意两个归属概率之间的差异度不大于所述预设差异度阈值;若基于所述各个用户对应的归属概率,确定所述用户特征表示模型未满足收敛条件时,则基于所述各个用户对应的归属概率,对所述用户特征表示模型进行参数调整。3.如权利要求2所述的方法,其特征在于,在对获得的各个样本行为序列进行特征编码,分别得到相应的用户特征表示向量之后,所述方法还包括:基于获得的各个用户特征表示向量,分别针对相应用户获得预测行为序列,以及基于获得的各个预测行为序列与相应的样本行为序列的比对结果,确定损失值;则所述收敛条件还包括:所述损失值不大于预设损失值阈值。4.如权利要求2所述的方法,其特征在于,所述多个用户域中包括至少一个重合用户,所述重合用户在所述多个用户域中的用户标识相同,则所述收敛条件还包括:针对每个重合用户,基于所述每个重合用户在各个用户域的样本行为序列获得的各个用户特征表示向量中,任意两个用户特征表示向量的相似度不小于预设相似度阈值。5.如权利要求1所述的方法,其特征在于,针对每一样本行为序列,对所述样本行为序列进行特征编码,得到相应的用户特征表示向量,包括:获取所述样本行为序列中每个目标对象的内容特征表示向量和位置特征表示向量;所述位置特征表示向量用于表征目标对象在所述样本行为序列中的位置信息;根据获得的各个目标对象的内容特征表示向量和位置特征表示向量,得到所述各个目
标对象的对象特征表示向量;根据获得的所述各个目标对象的对象特征表示向量,通过所述用户特征表示模型包括的至少一个编码器进行特征编码,分别得到所述各个目标对象的自注意力表示向量;所述至少一个编码器中相邻的两个编码器中前一编码器的输出为后一编码器的输入;在最后一个编码器输出的所述各个目标对象的自注意力表示向量中,选取一个自注意力表示向量,确定为与所述样本行为序列对应的用户特征表示向量。6.如权利要求5所述的方法,其特征在于,通过每一编码器进行特征编码时,包括以下步骤:根据所述各个目标对象的对象特征表示向量与一个编码器包括的至少一个注意力权重矩阵,分别获得所述各个目标对象各自对应的至少一个权重表示向量;其中,每个权重表示向量对应于一个注意力权重矩阵;根据所述各个目标对象各自对应的至少一个权重表示向量,分别获得所述各个目标对象的中间表示向量;对所述各个目标对象的中间表示向量进行激活处理,分别获得所述各个目标对象的自注意力表示向量。7.如权利要求6所述的方法,其特征在于,所述至少一个注意力权重矩阵包括查询向量权重矩阵、键向量权重矩阵和值向量权重矩阵;所述根据所述各个目标对象的对象特征表示向量与一个编码器包括的至少一个注意力权重矩阵,分别获得所述各个目标对象各自对应的至少一个权重表示向量,包括:根据各个目标对象的对象特征表示向量与所述查询向量权重矩阵、所述键向量权重矩阵和所述值向量权重矩阵,分别得到对应的查询向量、键向量和值向量;所述根据所述各个目标对象各自对应的至少一个权重表示向量,以及样本行为序列中其他目标对象各自对应的至少一个权重表示向量,分别获得所述各个目标对象的中间表示向量,包括:针对所述各个目标对象,分别执行以下操作:根据一个目标对象的查询向量与所述历史行为序列中各个目标对象的键向量,分别获得所述各个目标对象各自对应的注意力权重值;所述注意力权重值用于表征所述各个目标对象与所述一个目标对象的关联程度;根据所述各个目标对象...

【专利技术属性】
技术研发人员:李成林孔蓓蓓程磊杨剑鸣舒国强
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1