System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种潜在用户的挖掘方法和装置制造方法及图纸_技高网

一种潜在用户的挖掘方法和装置制造方法及图纸

技术编号:40390812 阅读:10 留言:0更新日期:2024-02-20 22:22
本发明专利技术公开了一种潜在用户的挖掘方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取待预测用户的用户特征向量,用户特征向量是基于多兴趣网络模型对用户数据进行特征提取得到的;对目标用户的用户特征向量进行聚类得到聚类中心向量;将聚类中心向量和待预测用户的用户特征向量输入至用户相似模型得到每个待预测用户的相似度得分,用户相似模型是采用注意力机制构建的;将相似度得分满足设定阈值的待预测用户确定为潜在用户。该实施方式降低了用户信息损失,产出的用户向量表征能更好地刻画用户;降低模型运算成本,提升了模型训练效率,实现了对历史行为较少的新品牌或长尾品牌的潜在用户挖掘,缓解推荐系统的马太效应。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种潜在用户的挖掘方法和装置


技术介绍

1、随着电商行业的发展,商品品牌多样性也越来越多,为用户推荐感兴趣的品牌,可以提升品牌的转化和用户体验。用户品牌偏好多基于用户历史行为来学习,因此对于一些上新品牌或一些小众品牌,常常由于缺少历史行为信息而导致曝光效率不高,导致马太效应,因此如何为新品牌挖掘潜在兴趣人群对于平台生态建设极为重要。目前,多基于用户标签来选择潜在用户或者基于分类模型来选择潜在用户。

2、在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:

3、基于标签选择潜在用户,用户区分方式过于硬性,结果不够个性,且需要人工选择标签,调优效率低;基于分类算法选择潜在用户,算法效果依赖特征选取,针对不同新业务需要调整和提取不同业务相关的特征,需要选取不同特征训练模型,模型更新迭代成本高,业务接入效率低。


技术实现思路

1、有鉴于此,本专利技术实施例提供一种潜在用户的挖掘方法和装置,能够采用多兴趣网络模型对用户行为做内部聚类,将用户行为聚类到不同行为簇训练获取用户不同行为簇下的向量表征,降低了用户信息损失,产出的用户向量表征能更好地刻画用户;通过聚类提取目标用户的聚类中心向量,便于注意力机制学习待预测用户和目标用户的相似度,降低模型运算成本,将目标用户轻量化为聚类中心,提升了模型训练效率,同时也保留目标用户信息;基于注意力机制学习目标用户的聚类中心向量和待预测用户的相似度,避免了推荐结果集中在头部品牌,实现了对历史行为较少的新品牌或长尾品牌的潜在用户挖掘,缓解推荐系统的马太效应。

2、为实现上述目的,根据本专利技术实施例的一个方面,提供了一种潜在用户的挖掘方法,包括:

3、获取待预测用户的用户特征向量,所述用户特征向量是基于多兴趣网络模型对用户数据进行特征提取得到的;

4、对目标用户的用户特征向量进行聚类得到聚类中心向量;

5、将所述聚类中心向量和所述待预测用户的用户特征向量输入至用户相似模型得到每个所述待预测用户的相似度得分,所述用户相似模型是采用注意力机制构建的;

6、将相似度得分满足设定阈值的待预测用户确定为潜在用户。

7、可选地,在获取待预测用户的用户特征向量之前,还包括:基于多兴趣网络模型对用户数据进行特征提取得到用户特征向量,所述用户包括待预测用户和目标用户。

8、可选地,所述用户数据包括用户基础属性数据和用户历史行为数据;基于多兴趣网络模型对用户数据进行特征提取得到用户特征向量,包括:将所述用户基础属性数据进行离散特征拼接得到属性特征向量;通过多兴趣提取层对所述用户历史行为数据对应的向量进行动态路由自适应聚合得到兴趣特征向量;将所述属性特征向量和所述兴趣特征向量进行拼接后输入标签感知注意力网络层,以得到用户特征向量。

9、可选地,将所述属性特征向量和所述兴趣特征向量进行拼接后输入标签感知注意力网络层,以得到用户特征向量,包括:将所述属性特征向量和所述兴趣特征向量进行拼接后经过全连接网络层输入标签感知注意力网络层,并基于用户下一次目标行为数据计算用户对当前向量的兴趣分布,以得到用户特征向量。

10、可选地,所述用户特征向量是基于活跃用户的用户历史行为数据的更新而定时增量更新的。

11、可选地,所述用户相似模型是通过以下方式生成的:确定目标用户和样本用户;对所述目标用户和所述样本用户的用户数据分别进行特征提取得到目标用户的用户特征向量和样本用户的用户特征向量;对所述子用户的用户特征向量进行聚类得到不少于一个聚类中心向量;将所述聚类中心向量和所述样本用户的用户特征向量输入到注意力网络层得到新的向量表征;计算所述新的向量表征和所述样本用户的用户特征向量的相似度,以交叉熵损失函数为目标进行模型训练生成所述用户相似模型。

12、可选地,所述设定阈值是通过使用指定时段的用户历史行为数据对所述用户相似模型进行评估来确定的。

13、根据本专利技术实施例的另一方面,提供了一种潜在用户的挖掘装置,包括:

14、特征向量获取模块,用于获取待预测用户的用户特征向量,所述用户特征向量是基于多兴趣网络模型对用户数据进行特征提取得到的;

15、特征向量聚类模块,用于对目标用户的用户特征向量进行聚类得到聚类中心向量;

16、相似度计算模块,用于将所述聚类中心向量和所述待预测用户的用户特征向量输入至用户相似模型得到每个所述待预测用户的相似度得分,所述用户相似模型是采用注意力机制构建的;

17、潜在用户确定模块,用于将相似度得分满足设定阈值的待预测用户确定为潜在用户。

18、根据本专利技术实施例的又一方面,提供了一种电子设备。

19、一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术实施例所提供的潜在用户的挖掘方法。

20、根据本专利技术实施例的再一方面,提供了一种计算机可读介质。

21、一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本专利技术实施例所提供的潜在用户的挖掘方法。

22、上述专利技术中的一个实施例具有如下优点或有益效果:通过获取待预测用户的用户特征向量,用户特征向量是基于多兴趣网络模型对用户数据进行特征提取得到的;对目标用户的用户特征向量进行聚类得到聚类中心向量;将聚类中心向量和待预测用户的用户特征向量输入至用户相似模型得到每个待预测用户的相似度得分,用户相似模型是采用注意力机制构建的;将相似度得分满足设定阈值的待预测用户确定为潜在用户的技术方案,采用多兴趣网络模型对用户行为做内部聚类,将用户行为聚类到不同行为簇训练获取用户不同行为簇下的向量表征,降低了用户信息损失,产出的用户向量表征能更好地刻画用户;通过聚类提取目标用户的聚类中心向量,便于注意力机制学习待预测用户和目标用户的相似度,降低模型运算成本,将目标用户轻量化为聚类中心,提升了模型训练效率,同时也保留目标用户信息;基于注意力机制学习目标用户的聚类中心向量和待预测用户的相似度,避免了推荐结果集中在头部品牌,实现了对历史行为较少的新品牌或长尾品牌的潜在用户挖掘,缓解推荐系统的马太效应。

23、上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

本文档来自技高网...

【技术保护点】

1.一种潜在用户的挖掘方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在获取待预测用户的用户特征向量之前,还包括:

3.根据权利要求2所述的方法,其特征在于,所述用户数据包括用户基础属性数据和用户历史行为数据;

4.根据权利要求3所述的方法,其特征在于,将所述属性特征向量和所述兴趣特征向量进行拼接后输入标签感知注意力网络层,以得到用户特征向量,包括:

5.根据权利要求2或3所述的方法,其特征在于,所述用户特征向量是基于活跃用户的用户历史行为数据的更新而定时增量更新的。

6.根据权利要求1所述的方法,其特征在于,所述用户相似模型是通过以下方式生成的:

7.根据权利要求1所述的方法,其特征在于,所述设定阈值是通过使用指定时段的用户历史行为数据对所述用户相似模型进行评估来确定的。

8.一种潜在用户的挖掘装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。

...

【技术特征摘要】

1.一种潜在用户的挖掘方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在获取待预测用户的用户特征向量之前,还包括:

3.根据权利要求2所述的方法,其特征在于,所述用户数据包括用户基础属性数据和用户历史行为数据;

4.根据权利要求3所述的方法,其特征在于,将所述属性特征向量和所述兴趣特征向量进行拼接后输入标签感知注意力网络层,以得到用户特征向量,包括:

5.根据权利要求2或3所述的方法,其特征在于,所述用户特征向量是基于活跃用户的用户历史行...

【专利技术属性】
技术研发人员:孙瑞雪
申请(专利权)人:北京沃东天骏信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1