一种用户群体的划分方法和装置制造方法及图纸

技术编号:15437264 阅读:114 留言:0更新日期:2017-05-25 19:25
本申请实施例提供了一种用户群体的划分方法和装置,该方法包括:抓取用户标识;建立所述用户标识之间的共同行为关系,获得用户节点图;在所述用户节点图中,根据所述共同行为关系识别一个或多个核心用户群体;在所述一个或多个核心用户群体中,根据所述共同行为关系划分一个或多个目标用户群体。一方面,避免人工设定规则,不同的用户群具有不同的分布特征,尽管个体的行为差异较大,但是用户的潜在关系则比较稳定,基于图的用户群体划分方式提高了用户群体的划分精确度,另一方面,通过粗略划分出核心用户群体,大大减少了数据量,进而提高了划分效率,提高了用户群体的划分精确度。

Method and device for dividing user groups

The embodiment of the invention provides a method and apparatus for classification of user groups, the method comprising: grasping user identification; to establish the relationship between the common behavior of the user identification, user node graph; at the user nodes in the graph, according to the relationship between the common behavior of identifying one or more core user group; in one or more of the core user groups, according to the relationship between the common behavior into one or more target user groups. On the one hand, to avoid the rules of artificial settings, different user groups have different distribution characteristics, although the individual differences is large, but the potential relationship between users is relatively stable, the user group division method based on graph partition improves accuracy of user groups, on the other hand, through the rough division of core users, greatly reduced the amount of data, and improve the classification efficiency, improve the classification accuracy of user groups.

【技术实现步骤摘要】
一种用户群体的划分方法和装置
本申请涉及计算机处理的
,特别是涉及一种用户群体的划分方法和一种用户群体的划分装置。
技术介绍
随着互联网的高速发展,网上的信息量急剧增加,过量的信息使得人们无法高效地从中获取自己需要的部分,信息的使用效率反而降低。因此,各大网站通常将其面向的用户划分为不同的用户群体,提供更精细化的服务。另外,在某些安全检测情景中,也需要将用户划分不同的用户群体。例如,在电子商务网站中,不法分子通过虚拟交易等途径恶意增加店铺的积分,俗称“刷钻”,为维持秩序,网站需要将“刷钻”的群体识别出来。现在,用户群体划分的方式通常有两种,一种是人工设定规则,另一种是社区发现算法。在人工设定规则的方式中,往往难以覆盖不同群体的不同特性,而且,用户群体的规则繁多、容易发生变化,人工设定的规则难免会有所偏差,从而导致用户群体划分的精确度较低。以识别“刷钻”群体为例,识别“刷钻”群体常用的规则有“用户购买前浏览的同类商品个数”、“用户浏览到下单的时间长度”、“用户购买多个物品的间隔时间”等。不同的“刷钻”群体,往往具有不一样的表现。如一个“刷钻”群体接到需求后直接购买指定的商品;另一个“刷钻”群体,会浏览多个同类商品后,再购买指定的商品。则对于这两个“刷钻”群体,在“用户购买前浏览的同类商品个数”这个规则上的表现不一,难以通过同一个阈值进行识别判断。在社区发现算法中,容易在结果中引入与具体应用场景不符合的数据,导致数据量过大,划分效率较低,用户群体划分的精确度较低。以识别“刷钻”群体为例,在建模时首先对用户间的购买关系进行抽象,简单地认为两个用户共同购买过某一件商品即认为他们存在关系,会使得建立的图规模过大,造成划分效率的低下,以及存在将一些购买数量较多的用户误识别为“刷钻”用户的风险。
技术实现思路
鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种用户群体的划分方法和相应的一种用户群体的划分装置。为了解决上述问题,本申请实施例公开了一种用户群体的划分方法,包括:抓取用户标识;建立所述用户标识之间的共同行为关系,获得用户节点图;在所述用户节点图中,根据所述共同行为关系识别一个或多个核心用户群体;在所述一个或多个核心用户群体中,根据所述共同行为关系划分一个或多个目标用户群体。可选地,所述建立所述用户标识之间的共同行为关系,获得用户节点图的步骤包括:查找所述用户标识的行为数据;从所述行为数据中识别共同的行为数据;对所述共同的行为数据所属的用户标识建立共同行为关系。可选地,所述查找所述用户标识的行为数据的步骤包括:从预置的数据库中提取在预设时间段内、所述用户标识的行为数据。可选地,所述对所述共同的行为数据所属的用户标识建立共同行为关系的步骤包括:按照行为数据的类型对所述共同的行为数据配置权重;当所述权重之和大于预设的权重阈值时,对所述共同的行为数据所属的用户标识建立共同行为关系。可选地,所述在所述用户节点图中,根据所述共同行为关系识别一个或多个核心用户群体的步骤包括:计算所述用户标识在所述用户节点图中的核心程度值;当所述核心程度值大于预设的核心阈值时,确定所述核心程度值对应的用户标识归属核心用户群体。可选地,所述计算所述用户标识在所述用户节点图中的核心程度值的步骤包括:设置当前迭代的全局核心程度值;在所述用户节点图中,针对每个用户标识统计通过共同行为关系相连的用户标识的数量,获得节点度值;在所述用户节点图中,判断每个用户标识的节点度值是否小于或等于全局核心程度值;若是,则去除节点度值小于或等于所述全局核心程度值的用户标识;将所述全局核心程度值赋值给在先去除的用户标识,作为先去除的用户标识的核心程度值;在所述用户节点图中,删除与在先去除的用户标识相连的共同行为关系,返回执行所述在所述用户节点图中,判断每个用户标识的节点度值是否小于或等于全局核心程度值的步骤;若否,则返回执行所述设置当前迭代的全局核心程度值的步骤,直至遍历所述用户节点图完成。可选地,所述设置当前迭代的全局核心程度值的步骤包括:在首次迭代时,设置初始的全局核心程度值为1;或者,在非首次迭代时,在上一全局核心程度值的基础上加1,作为当前全局核心程度值。可选地,所述在所述一个或多个核心用户群体中,根据所述共同行为关系划分一个或多个目标用户群体的步骤包括:在所述一个或多个核心用户群体中,对每个用户标识配置标签,所述标签具有数值;将每个用户标识的标签传递至相连的用户标识;从每个用户标识接收到的标签中,按照标签的数值选取一个标签作为所拥有的标签;判断在所述一个或多个核心用户群体中,用户标识所拥有的标签是否发生变化;若是,则返回执行所述将每个用户标识的标签传递至相连的用户标识的步骤;若否,则将拥有相同标签的用户标识划分为目标用户群体。可选地,所述在所述一个或多个核心用户群体中,根据所述共同行为关系划分一个或多个目标用户群体的步骤包括:在所述一个或多个核心用户群体中,对每个用户标识配置标签;将每个用户标识的标签传递至相连的用户标识;从每个用户标识接收到的标签中,按照标签的数量选取一个标签作为所拥有的标签;判断在所述一个或多个核心用户群体中,用户标识所拥有的标签是否发生变化,或者,当前是否小于预设的最大迭代次数;若是,则返回执行所述将每个用户标识的标签传递至相连的用户标识的步骤;若否,则将拥有相同标签的用户标识划分为目标用户群体。本申请实施例还公开了一种用户群体的划分装置,包括:用户标识获取模块,用于抓取用户标识;用户节点图构建模块,用于建立所述用户标识之间的共同行为关系,获得用户节点图;核心用户群体识别模块,用于在所述用户节点图中,根据所述共同行为关系识别一个或多个核心用户群体;目标用户群体划分模块,用于在所述一个或多个核心用户群体中,根据所述共同行为关系划分一个或多个目标用户群体。可选地,所述用户节点图构建模块包括:行为数据查找子模块,用于查找所述用户标识的行为数据;共同行为数据识别子模块,用于从所述行为数据中识别共同的行为数据;共同行为关系建立子模块,用于对所述共同的行为数据所属的用户标识建立共同行为关系。可选地,所述行为数据查找子模块包括:时间段数据查找单元,用于从预置的数据库中提取在预设时间段内、所述用户标识的行为数据。可选地,所述共同行为关系建立子模块包括:权重配置单元,用于按照行为数据的类型对所述共同的行为数据配置权重;关系建立单元,用于在所述权重之和大于预设的权重阈值时,对所述共同的行为数据所属的用户标识建立共同行为关系。可选地,所述核心用户群体识别模块包括:核心程度值计算子模块,用于计算所述用户标识在所述用户节点图中的核心程度值;核心用户群体确定子模块,用于在所述核心程度值大于预设的核心阈值时,确定所述核心程度值对应的用户标识归属核心用户群体。可选地,所述核心程度值计算子模块包括:全局核心程度值设置单元,用于设置当前迭代的全局核心程度值;节点度值统计单元,用于在所述用户节点图中,针对每个用户标识统计通过共同行为关系相连的用户标识的数量,获得节点度值;数量比较单元,用于在所述用户节点图中,判断每个用户标识的节点度值是否小于或等于全局核心程度值;若是,则调用用户标识去除单元,若否,则本文档来自技高网
...
一种用户群体的划分方法和装置

【技术保护点】
一种用户群体的划分方法,其特征在于,包括:抓取用户标识;建立所述用户标识之间的共同行为关系,获得用户节点图;在所述用户节点图中,根据所述共同行为关系识别一个或多个核心用户群体;在所述一个或多个核心用户群体中,根据所述共同行为关系划分一个或多个目标用户群体。

【技术特征摘要】
1.一种用户群体的划分方法,其特征在于,包括:抓取用户标识;建立所述用户标识之间的共同行为关系,获得用户节点图;在所述用户节点图中,根据所述共同行为关系识别一个或多个核心用户群体;在所述一个或多个核心用户群体中,根据所述共同行为关系划分一个或多个目标用户群体。2.根据权利要求1所述的方法,其特征在于,所述建立所述用户标识之间的共同行为关系,获得用户节点图的步骤包括:查找所述用户标识的行为数据;从所述行为数据中识别共同的行为数据;对所述共同的行为数据所属的用户标识建立共同行为关系。3.根据权利要求2所述的方法,其特征在于,所述查找所述用户标识的行为数据的步骤包括:从预置的数据库中提取在预设时间段内、所述用户标识的行为数据。4.根据权利要求2所述的方法,其特征在于,所述对所述共同的行为数据所属的用户标识建立共同行为关系的步骤包括:按照行为数据的类型对所述共同的行为数据配置权重;当所述权重之和大于预设的权重阈值时,对所述共同的行为数据所属的用户标识建立共同行为关系。5.根据权利要求1或2或3或4所述的方法,其特征在于,所述在所述用户节点图中,根据所述共同行为关系识别一个或多个核心用户群体的步骤包括:计算所述用户标识在所述用户节点图中的核心程度值;当所述核心程度值大于预设的核心阈值时,确定所述核心程度值对应的用户标识归属核心用户群体。6.根据权利要求5所述的方法,其特征在于,所述计算所述用户标识在所述用户节点图中的核心程度值的步骤包括:设置当前迭代的全局核心程度值;在所述用户节点图中,针对每个用户标识统计通过共同行为关系相连的用户标识的数量,获得节点度值;在所述用户节点图中,判断每个用户标识的节点度值是否小于或等于全局核心程度值;若是,则去除节点度值小于或等于所述全局核心程度值的用户标识;将所述全局核心程度值赋值给在先去除的用户标识,作为先去除的用户标识的核心程度值;在所述用户节点图中,删除与在先去除的用户标识相连的共同行为关系,返回执行所述在所述用户节点图中,判断每个用户标识的节点度值是否小于或等于全局核心程度值的步骤;若否,则返回执行所述设置当前迭代的全局核心程度值的步骤,直至遍历所述用户节点图完成。7.根据权利要求6所述的方法,其特征在于,所述设置当前迭代的全局核心程度值的步骤包括:在首次迭代时,设置初始的全局核心程度值为1;或者,在非首次迭代时,在上一全局核心程度值的基础上加1,作为当前全局核心程度值。8.根据权利要求1或2或3或4或6或7所述的方法,其特征在于,所述在所述一个或多个核心用户群体中,根据所述共同行为关系划分一个或多个目标用户群体的步骤包括:在所述一个或多个核心用户群体中,对每个用户标识配置标签,所述标签具有数值;将每个用户标识的标签传递至相连的用户标识;从每个用户标识接收到的标签中,按照标签的数值选取一个标签作为所拥有的标签;判断在所述一个或多个核心用户群体中,用户标识所拥有的标签是否发生变化;若是,则返回执行所述将每个用户标识的标签传递至相连的用户标识的步骤;若否,则将拥有相同标签的用户标识划分为目标用户群体。9.根据权利要求1或2或3或4或6或7所述的方法,其特征在于,所述在所述一个或多个核心用户群体中,根据所述共同行为关系划分一个或多个目标用户群体的步骤包括:在所述一个或多个核心用户群体中,对每个用户标识配置标签;将每个用户标识的标签传递至相连的用户标识;从每个用户标识接收到的标签中,按照标签的数量选取一个标签作为所拥有的标签;判断在所述一个或多个核心用户群体中,用户标识所拥有的标签是否发生变化,或者,当前是否小于预设的最大迭代次数;若是,则返回执行所述将每个用户标识的标签传递至相连的用户标识的步骤;若否,则将拥有相同标签的用户标识划分为目标用户群体。10.一种用户群体的划分装置,其特征在于,包括:用户标识获取模块,用于抓取用户标识;用户节点图构建模块,用于建立所述用户标识之间的共同行为关系,获得用户节点图;核心用户群体识别模块,用于在所述用户节点图中,根据所述共同...

【专利技术属性】
技术研发人员:黄光远
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1