用户关系挖掘方法及装置、电子设备和存储介质制造方法及图纸

技术编号：22783837 阅读：15 留言：0更新日期：2019-12-11 04:15

本公开是关于一种用户关系挖掘方法、用户关系挖掘装置、电子设备以及计算机可读存储介质，涉及大数据分析与挖掘技术领域，可以应用于对用户行为进行分析，以完成对用户关系挖掘的应用场景。该用户关系挖掘方法包括：获取用户关系数据，确定用户关系数据中待处理用户的用户标签；其中，待处理用户包括目标用户以及目标用户的邻居用户；获取最大分组数量；根据最大分组数量以及邻居用户的用户标签对目标用户的用户标签进行标签更新操作，以确定目标用户的结果标签；根据结果标签确定目标用户的用户分组。本公开可以对用户关系通过不同维度进行分析，即包括以社区为对象的粗粒度分析和以用户为对象的细粒度分析。

User relationship mining methods and devices, electronic devices and storage media

The disclosure relates to a user relationship mining method, a user relationship mining device, an electronic device and a computer-readable storage medium, and relates to the technical field of big data analysis and mining, which can be applied to analyze user behavior to complete the application scenario of user relationship mining. The user relationship mining method includes: obtaining the user relationship data, determining the user tag of the user to be processed in the user relationship data; wherein, the user to be processed includes the target user and the target user's neighbor user; obtaining the maximum number of groups; updating the user tag of the target user according to the maximum number of groups and the user tag of the neighbor user, so as to ensure Determine the result label of the target user; determine the user group of the target user according to the result label. The disclosure can analyze the user relationship through different dimensions, including coarse-grained analysis with community as the object and fine-grained analysis with user as the object.

全部详细技术资料下载

【技术实现步骤摘要】
用户关系挖掘方法及装置、电子设备和存储介质
本公开涉及大数据分析与挖掘
，具体而言，涉及一种用户关系挖掘方法、用户关系挖掘装置、电子设备以及计算机可读存储介质。
技术介绍
在电商业务实践中，随着业务范围的不断扩张，用户量日趋饱和，对于用户画像的构建，用户行为的分析已经成为一项重要研究课题。对于用户关系的挖掘，可以作为精准营销的一种重要手段。目前，可以采用标签传播算法(LabelPropagationAlgorithm，LPA)对用户关系进行分析，然而，在实际应用的复杂用户社交网络中，由于在每次的迭代计算中，一个节点的邻居标签不唯一，对于迭代至标签完全一致的收敛条件难以实现。另外，基于LPA的社区发现算法是以社区为对象一种较粗粒度的分析手段，在具体细化到用户维度的分析场景中无法适用；并且采用LPA算法分析用户关系时，每个节点的社区属性唯一。需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种用户关系挖掘方法、用户关系挖掘装置、电子设备以及计算机可读存储介质，进而至少在一定程度上克服基于LPA算法分析用户关系的方法在实际应用的复杂用户社交网络不能适用的问题。本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本专利技术的实践而习得。根据本公开的第一方面，提供一种用户关系挖掘方法，包括：获取用户关系数据，确定用户关系数据中待处理用户的用户标签...

【技术保护点】
1.一种用户关系挖掘方法，其特征在于，包括：/n获取用户关系数据，确定所述用户关系数据中待处理用户的用户标签；其中，所述待处理用户包括目标用户以及所述目标用户的邻居用户；/n获取最大分组数量；/n根据所述最大分组数量以及所述邻居用户的用户标签对所述目标用户的用户标签进行标签更新操作，以确定所述目标用户的结果标签；/n根据所述结果标签确定所述目标用户的用户分组。/n

【技术特征摘要】
1.一种用户关系挖掘方法，其特征在于，包括：
获取用户关系数据，确定所述用户关系数据中待处理用户的用户标签；其中，所述待处理用户包括目标用户以及所述目标用户的邻居用户；
获取最大分组数量；
根据所述最大分组数量以及所述邻居用户的用户标签对所述目标用户的用户标签进行标签更新操作，以确定所述目标用户的结果标签；
根据所述结果标签确定所述目标用户的用户分组。

2.根据权利要求1所述的用户关系挖掘方法，其特征在于，所述获取用户关系数据，包括：
获取采集数据，对所述采集数据进行加密处理得到加密用户数据；
从所述加密用户数据中确定所述待处理用户的关联信息元组；
统计所述关联信息元组的关联数量作为所述关联信息元组的权重；
将包含所述权重的所述关联信息元组作为所述用户关系数据。

3.根据权利要求1所述的用户关系挖掘方法，其特征在于，在所述确定所述用户关系数据中待处理用户的用户标签之前，所述方法还包括：
确定所述用户关系数据中的初始用户；
对所述初始用户进行异常用户剔除处理，以得到所述待处理用户。

4.根据权利要求1所述的用户关系挖掘方法，其特征在于，所述根据所述最大分组数量以及所述邻居用户的用户标签对所述目标用户的用户标签进行标签更新操作，以确定所述目标用户的结果标签，包括：
确定所述待处理用户的初始标签；其中，所述初始标签包括目标用户的初始用户标签以及所述邻居用户的初始邻居标签；
根据所述最大分组数量与所述初始邻居标签更新所述初始用户标签，直至标签更新操作满足更新停止条件，确定所述结果标签。

5.根据权利要求4所述的用户关系挖掘方法，其特征在于，所述确定所述待处理用户的初始标签，包括：
确定所述待处理用户的初始用户分组与初始系数；
将所述待处理用户的所述初始用户分组与所述初始系数进行组合处理以形成所述初始标签。

6.根据权利要求4所述的用户关系挖掘方法，其特征在于，所述根据所述最大分组数量与所述初始邻居标签更新所述初始用户标签，直至标签更新操作满足更新停止条件，确定所述结果标签，包括：
将根据所述初始邻居标签计算得到所述目标用户的用户标签作为当前用户标签；
如果所述当前用户标签满足更新停止条件，则将所述当前用户标签作为所述结果标签；其中，所述结果标签中的用户分组数量小于最大分组数量。

7.根据权利要求6所述的用户关系挖掘方法，其特征在于，所述目标用户的数量为多个，所述更新停止条件包括以下任意一个或多个的组合：
各所述目标用户的用户分组的数量小于等于最大分组数量；
各所述目标用户对应的分组数量与上次更新计算得到的分组数量相同；
所述标签更新操作的次数大于预设最大更新次数。

8.一种用户关系挖掘方法，其特征在于，包括：
获取用户关系数据，确定所述用户关系数据中的用户；其中，所述用户包括目标用户以及所述目标用户的关联用户；
从所述用户关系数据中确定所述用户的初始用户标签；
根据所述初始用户标签进行传播更...

【专利技术属性】
技术研发人员：宋宇航，
申请(专利权)人：京东数字科技控股有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人