用户关系挖掘方法及装置、电子设备和存储介质制造方法及图纸

技术编号:22783837 阅读:15 留言:0更新日期:2019-12-11 04:15
本公开是关于一种用户关系挖掘方法、用户关系挖掘装置、电子设备以及计算机可读存储介质,涉及大数据分析与挖掘技术领域,可以应用于对用户行为进行分析,以完成对用户关系挖掘的应用场景。该用户关系挖掘方法包括:获取用户关系数据,确定用户关系数据中待处理用户的用户标签;其中,待处理用户包括目标用户以及目标用户的邻居用户;获取最大分组数量;根据最大分组数量以及邻居用户的用户标签对目标用户的用户标签进行标签更新操作,以确定目标用户的结果标签;根据结果标签确定目标用户的用户分组。本公开可以对用户关系通过不同维度进行分析,即包括以社区为对象的粗粒度分析和以用户为对象的细粒度分析。

User relationship mining methods and devices, electronic devices and storage media

The disclosure relates to a user relationship mining method, a user relationship mining device, an electronic device and a computer-readable storage medium, and relates to the technical field of big data analysis and mining, which can be applied to analyze user behavior to complete the application scenario of user relationship mining. The user relationship mining method includes: obtaining the user relationship data, determining the user tag of the user to be processed in the user relationship data; wherein, the user to be processed includes the target user and the target user's neighbor user; obtaining the maximum number of groups; updating the user tag of the target user according to the maximum number of groups and the user tag of the neighbor user, so as to ensure Determine the result label of the target user; determine the user group of the target user according to the result label. The disclosure can analyze the user relationship through different dimensions, including coarse-grained analysis with community as the object and fine-grained analysis with user as the object.

【技术实现步骤摘要】
用户关系挖掘方法及装置、电子设备和存储介质
本公开涉及大数据分析与挖掘
,具体而言,涉及一种用户关系挖掘方法、用户关系挖掘装置、电子设备以及计算机可读存储介质。
技术介绍
在电商业务实践中,随着业务范围的不断扩张,用户量日趋饱和,对于用户画像的构建,用户行为的分析已经成为一项重要研究课题。对于用户关系的挖掘,可以作为精准营销的一种重要手段。目前,可以采用标签传播算法(LabelPropagationAlgorithm,LPA)对用户关系进行分析,然而,在实际应用的复杂用户社交网络中,由于在每次的迭代计算中,一个节点的邻居标签不唯一,对于迭代至标签完全一致的收敛条件难以实现。另外,基于LPA的社区发现算法是以社区为对象一种较粗粒度的分析手段,在具体细化到用户维度的分析场景中无法适用;并且采用LPA算法分析用户关系时,每个节点的社区属性唯一。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种用户关系挖掘方法、用户关系挖掘装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服基于LPA算法分析用户关系的方法在实际应用的复杂用户社交网络不能适用的问题。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术的实践而习得。根据本公开的第一方面,提供一种用户关系挖掘方法,包括:获取用户关系数据,确定用户关系数据中待处理用户的用户标签;其中,待处理用户包括目标用户以及目标用户的邻居用户;获取最大分组数量;根据最大分组数量以及邻居用户的用户标签对目标用户的用户标签进行标签更新操作,以确定目标用户的结果标签;根据结果标签确定目标用户的用户分组。可选的,获取用户关系数据,包括:获取采集数据,对采集数据进行加密处理得到加密用户数据;从加密用户数据中确定待处理用户的关联信息元组;统计关联信息元组的关联数量作为关联信息元组的权重;将包含权重的关联信息元组作为用户关系数据。可选的,在确定用户关系数据中待处理用户的用户标签之前,上述方法还包括:确定用户关系数据中的初始用户;对初始用户进行异常用户剔除处理,以得到待处理用户。可选的,根据最大分组数量以及邻居用户的用户标签对目标用户的用户标签进行标签更新操作,以确定目标用户的结果标签,包括:确定待处理用户的初始标签;其中,初始标签包括目标用户的初始用户标签以及邻居用户的初始邻居标签;根据最大分组数量与初始邻居标签更新初始用户标签,直至标签更新操作满足更新停止条件,确定结果标签。可选的,确定待处理用户的初始标签,包括:确定待处理用户的初始用户分组与初始系数;将待处理用户的初始用户分组与初始系数进行组合处理以形成初始标签。可选的,根据最大分组数量与初始邻居标签更新初始用户标签,直至标签更新操作满足更新停止条件,确定结果标签,包括:将根据初始邻居标签计算得到目标用户的用户标签作为当前用户标签;如果当前用户标签满足更新停止条件,则将当前用户标签作为结果标签;其中,结果标签中的用户分组数量小于最大分组数量。可选的,目标用户的数量为多个,更新停止条件包括以下任意一个或多个的组合:各目标用户的用户分组的数量小于等于最大分组数量;各目标用户对应的分组数量与上次更新计算得到的分组数量相同;标签更新操作的次数大于预设最大更新次数。根据本公开的第二方面,提供一种用户关系挖掘方法,包括:获取用户关系数据,确定用户关系数据中的用户;其中,用户包括目标用户以及目标用户的关联用户;从用户关系数据中确定用户的初始用户标签;根据初始用户标签进行传播更新操作,以得到与初始用户标签对应的结果用户标签;根据结果用户标签确定结果关联用户;其中,结果关联用户与目标用户具有共同邻居用户且关联系数达到预设阈值。可选的,初始用户标签包括目标用户的初始目标用户标签以及关联用户的初始关联用户标签,根据初始用户标签进行传播更新操作,以得到与初始用户标签对应的结果用户标签,包括:将初始目标用户标签更新至初始关联用户标签得到中间关联用户标签;将初始关联用户标签更新至初始目标用户标签得到中间目标用户标签;根据中间关联用户标签再次进行标签更新操作后,删除中间关联用户标签,得到结果关联用户标签;根据中间目标用户标签再次进行标签更新操作后,删除中间目标用户标签,得到结果目标用户标签;将结果关联用户标签与结果目标用户标签作为结果用户标签。可选的,根据结果用户标签确定结果关联用户,包括:确定与目标用户具有共同邻居用户的用户作为初始关联用户;确定目标用户与初始关联用户的共同邻居数量;按照共同邻居数量对结果用户标签进行预排序处理得到预排序结果;对预排序结果进行异常性补偿排序处理以得到输出结果集;将根据输出结果集确定出的关联用户作为结果关联用户。根据本公开的第三方面,提供一种用户关系挖掘装置,包括:标签确定模块,用于获取用户关系数据,确定用户关系数据中待处理用户的用户标签;其中,待处理用户包括目标用户以及目标用户的邻居用户;分组数量确定模块,用于获取最大分组数量;标签更新模块,用于根据最大分组数量以及邻居用户的用户标签对目标用户的用户标签进行标签更新操作,以确定目标用户的结果标签;分组确定模块,用于根据结果标签确定目标用户的用户分组。在本公开的一些示例实施例中,基于前述方案,标签确定模块包括数据获取单元,数据获取单元被配置为:获取采集数据,对采集数据进行加密处理得到加密用户数据;从加密用户数据中确定待处理用户的关联信息元组;统计关联信息元组的关联数量作为关联信息元组的权重;将包含权重的关联信息元组作为用户关系数据。在本公开的一些示例实施例中,基于前述方案,标签确定模块还包括用户确定单元,用户确定单元被配置为:确定用户关系数据中的初始用户;对初始用户进行异常用户剔除处理,以得到待处理用户。在本公开的一些示例实施例中,基于前述方案,标签更新模块包括标签确定单元,标签确定单元被配置为:确定待处理用户的初始标签;其中,初始标签包括目标用户的初始用户标签以及邻居用户的初始邻居标签;根据最大分组数量与初始邻居标签更新初始用户标签,直至标签更新操作满足更新停止条件,确定结果标签。在本公开的一些示例实施例中,基于前述方案,标签确定单元包括初始标签确定子单元,初始标签确定子单元被配置为:确定待处理用户的初始用户分组与初始系数;将待处理用户的初始用户分组与初始系数进行组合处理以形成初始标签。在本公开的一些示例实施例中,基于前述方案,标签确定单元包括结果标签确定子单元,结果标签确定子单元被配置为:将根据初始邻居标签计算得到目标用户的用户标签作为当前用户标签;如果当前用户标签满足更新停止条件,则将当前用户标签作为结果标签;其中,结果标签中的用户分组数量小于最大分组数量。根据本公开的第四方面,提供一种用户关系挖掘装置,包括:用户确定模块,用于获取用户关系数据,确定用户关系数据中的用户;其中,用户包括目标用户以及目标用本文档来自技高网...

【技术保护点】
1.一种用户关系挖掘方法,其特征在于,包括:/n获取用户关系数据,确定所述用户关系数据中待处理用户的用户标签;其中,所述待处理用户包括目标用户以及所述目标用户的邻居用户;/n获取最大分组数量;/n根据所述最大分组数量以及所述邻居用户的用户标签对所述目标用户的用户标签进行标签更新操作,以确定所述目标用户的结果标签;/n根据所述结果标签确定所述目标用户的用户分组。/n

【技术特征摘要】
1.一种用户关系挖掘方法,其特征在于,包括:
获取用户关系数据,确定所述用户关系数据中待处理用户的用户标签;其中,所述待处理用户包括目标用户以及所述目标用户的邻居用户;
获取最大分组数量;
根据所述最大分组数量以及所述邻居用户的用户标签对所述目标用户的用户标签进行标签更新操作,以确定所述目标用户的结果标签;
根据所述结果标签确定所述目标用户的用户分组。


2.根据权利要求1所述的用户关系挖掘方法,其特征在于,所述获取用户关系数据,包括:
获取采集数据,对所述采集数据进行加密处理得到加密用户数据;
从所述加密用户数据中确定所述待处理用户的关联信息元组;
统计所述关联信息元组的关联数量作为所述关联信息元组的权重;
将包含所述权重的所述关联信息元组作为所述用户关系数据。


3.根据权利要求1所述的用户关系挖掘方法,其特征在于,在所述确定所述用户关系数据中待处理用户的用户标签之前,所述方法还包括:
确定所述用户关系数据中的初始用户;
对所述初始用户进行异常用户剔除处理,以得到所述待处理用户。


4.根据权利要求1所述的用户关系挖掘方法,其特征在于,所述根据所述最大分组数量以及所述邻居用户的用户标签对所述目标用户的用户标签进行标签更新操作,以确定所述目标用户的结果标签,包括:
确定所述待处理用户的初始标签;其中,所述初始标签包括目标用户的初始用户标签以及所述邻居用户的初始邻居标签;
根据所述最大分组数量与所述初始邻居标签更新所述初始用户标签,直至标签更新操作满足更新停止条件,确定所述结果标签。


5.根据权利要求4所述的用户关系挖掘方法,其特征在于,所述确定所述待处理用户的初始标签,包括:
确定所述待处理用户的初始用户分组与初始系数;
将所述待处理用户的所述初始用户分组与所述初始系数进行组合处理以形成所述初始标签。


6.根据权利要求4所述的用户关系挖掘方法,其特征在于,所述根据所述最大分组数量与所述初始邻居标签更新所述初始用户标签,直至标签更新操作满足更新停止条件,确定所述结果标签,包括:
将根据所述初始邻居标签计算得到所述目标用户的用户标签作为当前用户标签;
如果所述当前用户标签满足更新停止条件,则将所述当前用户标签作为所述结果标签;其中,所述结果标签中的用户分组数量小于最大分组数量。


7.根据权利要求6所述的用户关系挖掘方法,其特征在于,所述目标用户的数量为多个,所述更新停止条件包括以下任意一个或多个的组合:
各所述目标用户的用户分组的数量小于等于最大分组数量;
各所述目标用户对应的分组数量与上次更新计算得到的分组数量相同;
所述标签更新操作的次数大于预设最大更新次数。


8.一种用户关系挖掘方法,其特征在于,包括:
获取用户关系数据,确定所述用户关系数据中的用户;其中,所述用户包括目标用户以及所述目标用户的关联用户;
从所述用户关系数据中确定所述用户的初始用户标签;
根据所述初始用户标签进行传播更...

【专利技术属性】
技术研发人员:宋宇航
申请(专利权)人:京东数字科技控股有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1