用于用户聚类的方法、电子设备和存储介质技术

技术编号:31377165 阅读:15 留言:0更新日期:2021-12-15 11:15
本公开的实施例涉及用于用户聚类的方法、电子设备和计算机存储介质,涉及信息处理领域。根据该方法,获取与多个用户相关联的多个用户标识和多项用户属性信息以及指示所述多个用户之间的多种社交行为的行为信息;基于多个用户标识、多项用户属性信息和行为信息,生成有向图;基于有向图,训练图自编码器模型,以生成与多个用户相关联的多个嵌入特征表示;以及基于多个嵌入特征表示,经由聚类模型,生成多个用户的聚类结果。由此,能够基于用户间社交行为生成有向图来训练图自编码器模型,更准确地生成用户嵌入特征表示从而更好地聚类。确地生成用户嵌入特征表示从而更好地聚类。确地生成用户嵌入特征表示从而更好地聚类。

【技术实现步骤摘要】
用于用户聚类的方法、电子设备和存储介质


[0001]本公开的实施例总体涉及信息处理领域,具体涉及用于用户聚类的方法、电子设备和计算机存储介质。

技术介绍

[0002]随着网络技术的发展,往往需要对类似的用户进行聚类,以便对聚类的用户进行近似内容推荐。但是传统方案往往构建用户之间的无向图,并在无向图的基础上进行聚类,使得聚类结果不够准确。

技术实现思路

[0003]提供了一种用于用户聚类的方法、电子设备以及计算机存储介质,能够基于用户间社交行为生成有向图来训练图自编码器模型,更准确地生成用户嵌入特征表示从而更好地聚类。
[0004]根据本公开的第一方面,提供了一种用于用户聚类的方法。该方法包括:获取与多个用户相关联的多个用户标识和多项用户属性信息以及指示多个用户之间的多种社交行为的行为信息;基于多个用户标识、多项用户属性信息和行为信息,生成有向图,有向图中的多个节点表示多个用户,有向图中任意第一节点到任意第二节点之间的至少一条有向边表示第一节点表示的用户对第二节点表示的用户存在多种社交行为中的至少一种社交行为;基于有向图,训练图自编码器模型,以生成与多个用户相关联的多个嵌入特征表示;以及基于多个嵌入特征表示,经由聚类模型,生成多个用户的聚类结果。
[0005]根据本公开的第二方面,提供了一种电子设备。该电子设备包括:至少一个处理器,以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据第一方面所述的方法。
[0006]在本公开的第三方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面的方法。
[0007]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0008]结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素。
[0009]图1是根据本公开的实施例的信息处理环境100的示意图。
[0010]图2是根据本公开的实施例的用于用户聚类的方法200的示意图。
[0011]图3是根据本公开的实施例的用于训练图自编码器模型的方法300的示意图。
[0012]图4是根据本公开的实施例的用于生成与多个节点相关联的多个嵌入特征表示的
方法400的示意图。
[0013]图5是根据本公开的实施例的图自编码器模型500的示意图。
[0014]图6是用来实现本公开实施例的用于用户聚类的方法的电子设备的框图。
具体实施方式
[0015]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0016]在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
[0017]如上所述,传统方案通过构建用户之间的无向图进行聚类,没有充分考虑社交场景下用户之间的行为的方向性和多样性,使得聚类结果不够准确。
[0018]为了至少部分地解决上述问题以及其他潜在问题中的一个或者多个,本公开的示例实施例提出了一种用于用户聚类的方案。在该方案中,计算设备获取与多个用户相关联的多个用户标识和多项用户属性信息以及指示多个用户之间的多种社交行为的行为信息。随后,计算设备基于多个用户标识、多项用户属性信息和行为信息,生成有向图,有向图中的多个节点表示多个用户,有向图中任意第一节点到任意第二节点之间的至少一条有向边表示第一节点表示的用户对第二节点表示的用户存在多种社交行为中的至少一种社交行为。接着,计算设备基于有向图,训练图自编码器模型,以生成与多个用户相关联的多个嵌入特征表示,并基于多个嵌入特征表示,经由聚类模型,生成多个用户的聚类结果。以此方式,能够基于用户间社交行为生成有向图来训练图自编码器模型,更准确地生成用户嵌入特征表示从而更好地聚类。
[0019]在下文中,将结合附图更详细地描述本方案的具体示例。
[0020]图1示出了根据本公开的实施例的信息处理环境100的示例的示意图。信息处理环境100可以包括计算设备110、与多个用户相关联的多个用户标识120和多项用户属性信息130以及指示多个用户之间的多种社交行为的行为信息140。
[0021]计算设备110例如包括但不限于服务器计算机、多处理器系统、大型计算机、包括上述系统或设备中的任意一个的分布式计算环境等。在一些实施例中,计算设备110可以具有一个或多个处理单元,包括诸如图像处理单元GPU、现场可编程门阵列FPGA和专用集成电路ASIC等的专用处理单元以及诸如中央处理单元CPU的通用处理单元。
[0022]计算设备110用于获取与多个用户相关联的多个用户标识120和多项用户属性信息130以及指示多个用户之间的多种社交行为的行为信息140;基于多个用户标识120、多项用户属性信息130和行为信息140,生成有向图,有向图中的多个节点表示多个用户,有向图中任意第一节点到任意第二节点之间的至少一条有向边表示第一节点表示的用户对第二节点表示的用户存在多种社交行为中的至少一种社交行为;基于有向图,训练图自编码器
模型,以生成与多个用户相关联的多个嵌入特征表示;以及基于多个嵌入特征表示,经由聚类模型,生成多个用户的聚类结果150。
[0023]由此,能够基于用户间社交行为生成有向图来训练图自编码器模型,更准确地生成用户嵌入特征表示从而更好地聚类。
[0024]图2示出了根据本公开的实施例的用于用户聚类的方法200的流程图。例如,方法200可以由如图1所示的计算设备110来执行。应当理解的是,方法200还可以包括未示出的附加框和/或可以省略所示出的框,本公开的范围在此方面不受限制。
[0025]在框202处,计算设备110获取与多个用户相关联的多个用户标识120和多项用户属性信息130以及指示多个用户之间的多种社交行为的行为140。
[0026]用户属性信息130例如包括但不限于用户性别、年龄、常住地、标签等。
[0027]多种社交行为例如包括但不限于关注、私聊、点击头像和回复评论。
[0028]在框204处,计算设备110基于多个用户标识120、多项用户属性本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于用户聚类的方法,包括:获取与多个用户相关联的多个用户标识和多项用户属性信息以及指示所述多个用户之间的多种社交行为的行为信息;基于所述多个用户标识、所述多项用户属性信息和所述行为信息,生成有向图,所述有向图中的多个节点表示所述多个用户,所述有向图中任意第一节点到任意第二节点之间的至少一条有向边表示所述第一节点表示的用户对所述第二节点表示的用户存在所述多种社交行为中的至少一种社交行为;基于所述有向图,训练图自编码器模型,以生成与所述多个用户相关联的多个嵌入特征表示;以及基于所述多个嵌入特征表示,经由聚类模型,生成所述多个用户的聚类结果。2.根据权利要求1所述的方法,其中训练所述图自编码器模型包括:基于所述有向图,生成与所述多个节点之间的节点对集相关联的领接状态集;基于所述多个用户标识和所述多个用户属性信息,生成与所述多个节点相关联的多个特征表示;S1:基于与所述多个节点所对应的多个出边邻居集相关联的多个特征表示集和与所述节点对集相关联的注意力权重集,生成与所述多个节点相关联的多个嵌入特征表示;S2:基于与所述节点对集相关联的嵌入特征表示对集之间的内积集,生成与所述节点对集相关联的预测领接概率集;S3:基于所述领接状态集、所述预测领接概率集和预定损失函数,对所述注意力权重集进行更新;以及如果确定与所述注意力权重集相关联的更新值集不满足预设收敛条件,则重复步骤S1

S3。3.根据权利要求2所述的方法,其中所述注意力权重集包括与所述多种社交行为相关联的多个注意力权重子集,以及生成与所述多个节点相关联的多个嵌入特征表示包括对于所述多个节点中的每个节点执行以下步骤:从所述节点所对应的出边邻居集中确定与所述多种社交行为相关联的多个出边邻居子集;基于所述多个注意力权重子集和与所述多个出边邻居子集相关联的多个特征表示子集,生成与所述节点相关联的多个中间特征表示,所述多个中间特征表示与所述多种社交行为相对应;以及基于所述多个中间特征表示,生成与所述节点相关联的嵌入特征表示。4.根据权利要求3所述的方法,其中生成与所述节点相关联的多个中间特征表示包括对于所述多个出边邻居子集中的每个出边邻居子集执行以下步骤:...

【专利技术属性】
技术研发人员:顾茂杰彭飞唐文斌
申请(专利权)人:上海任意门科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1