【技术实现步骤摘要】
用于用户聚类的方法、电子设备和存储介质
[0001]本公开的实施例总体涉及信息处理领域,具体涉及用于用户聚类的方法、电子设备和计算机存储介质。
技术介绍
[0002]随着网络技术的发展,往往需要对类似的用户进行聚类,以便对聚类的用户进行近似内容推荐。但是传统方案往往构建用户之间的无向图,并在无向图的基础上进行聚类,使得聚类结果不够准确。
技术实现思路
[0003]提供了一种用于用户聚类的方法、电子设备以及计算机存储介质,能够基于用户间社交行为生成有向图来训练图自编码器模型,更准确地生成用户嵌入特征表示从而更好地聚类。
[0004]根据本公开的第一方面,提供了一种用于用户聚类的方法。该方法包括:获取与多个用户相关联的多个用户标识和多项用户属性信息以及指示多个用户之间的多种社交行为的行为信息;基于多个用户标识、多项用户属性信息和行为信息,生成有向图,有向图中的多个节点表示多个用户,有向图中任意第一节点到任意第二节点之间的至少一条有向边表示第一节点表示的用户对第二节点表示的用户存在多种社交行为中的至少一种社 ...
【技术保护点】
【技术特征摘要】
1.一种用于用户聚类的方法,包括:获取与多个用户相关联的多个用户标识和多项用户属性信息以及指示所述多个用户之间的多种社交行为的行为信息;基于所述多个用户标识、所述多项用户属性信息和所述行为信息,生成有向图,所述有向图中的多个节点表示所述多个用户,所述有向图中任意第一节点到任意第二节点之间的至少一条有向边表示所述第一节点表示的用户对所述第二节点表示的用户存在所述多种社交行为中的至少一种社交行为;基于所述有向图,训练图自编码器模型,以生成与所述多个用户相关联的多个嵌入特征表示;以及基于所述多个嵌入特征表示,经由聚类模型,生成所述多个用户的聚类结果。2.根据权利要求1所述的方法,其中训练所述图自编码器模型包括:基于所述有向图,生成与所述多个节点之间的节点对集相关联的领接状态集;基于所述多个用户标识和所述多个用户属性信息,生成与所述多个节点相关联的多个特征表示;S1:基于与所述多个节点所对应的多个出边邻居集相关联的多个特征表示集和与所述节点对集相关联的注意力权重集,生成与所述多个节点相关联的多个嵌入特征表示;S2:基于与所述节点对集相关联的嵌入特征表示对集之间的内积集,生成与所述节点对集相关联的预测领接概率集;S3:基于所述领接状态集、所述预测领接概率集和预定损失函数,对所述注意力权重集进行更新;以及如果确定与所述注意力权重集相关联的更新值集不满足预设收敛条件,则重复步骤S1
‑
S3。3.根据权利要求2所述的方法,其中所述注意力权重集包括与所述多种社交行为相关联的多个注意力权重子集,以及生成与所述多个节点相关联的多个嵌入特征表示包括对于所述多个节点中的每个节点执行以下步骤:从所述节点所对应的出边邻居集中确定与所述多种社交行为相关联的多个出边邻居子集;基于所述多个注意力权重子集和与所述多个出边邻居子集相关联的多个特征表示子集,生成与所述节点相关联的多个中间特征表示,所述多个中间特征表示与所述多种社交行为相对应;以及基于所述多个中间特征表示,生成与所述节点相关联的嵌入特征表示。4.根据权利要求3所述的方法,其中生成与所述节点相关联的多个中间特征表示包括对于所述多个出边邻居子集中的每个出边邻居子集执行以下步骤:...
【专利技术属性】
技术研发人员:顾茂杰,彭飞,唐文斌,
申请(专利权)人:上海任意门科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。