目标用户挖掘方法、装置、设备及介质制造方法及图纸

技术编号：33460840 阅读：24 留言：0更新日期：2022-05-19 00:41

本申请适用于大数据分析技术领域，特别涉及一种目标用户挖掘方法、目标用户挖掘装置、计算机设备及可读存储介质，其中一种目标用户挖掘方法：通过数据缓存层对种子用户集合与非种子用户集合分别进行特征选取，得到种子用户集合对应的种子矩阵，与非种子用户集合对应的非种子矩阵，利用位图压缩算法对种子矩阵与非种子矩阵分别进行压缩，得到第一用户集合与第二用户集合，计算每个第二用户与X个第一用户之间的相似度，得到每个第二用户对应的相似度集合，基于相似度集合，从第二用户集合中确定出目标用户集合，目标用户集合中的每个目标用户为相似度大于预设阈值的第二用户。应用本申请实施例所提供的技术方案，提高了目标用户挖掘的效率。掘的效率。掘的效率。

全部详细技术资料下载

【技术实现步骤摘要】
目标用户挖掘方法、装置、设备及介质

[0001]本专利技术属于大数据分析
，特别涉及一种目标用户挖掘方法、目标用户挖掘装置、计算机设备及计算机可读存储介质。

技术介绍

[0002]目标用户挖掘是根据已有的高价值的种子用户集合，从非种子用户集合中挖掘出与种子用户集合中的种子用户相似的和潜在的高价值用户。现有的目标用户挖掘方案是主要基于标签的方式，通过匹配种子用户与非种子用户之间的标签计算非种子用户与种子用户之间的相似度，选取和种子用户相似度最高的非种子用户来作为目标用户。但是这样的目标用户挖掘方案因为种子用户与非种子用户本身为海量数据，针对海量数据进行运算会耗费大量时间，带来目标用户挖掘的效率不高的问题。

技术实现思路

[0003]本专利技术的目的在于提供一种目标用户挖掘方法、目标用户挖掘装置、计算机设备及计算机可读存储介质，以解决现有技术中存在的目标用户挖掘的效率不高的问题。
[0004]本申请实施例的第一方面提供了一种目标用户挖掘方法，包括：
[0005]通过数据缓存层对种子用户集合与非种子用户集合分别进行特征选取，得到所述种子用户集合对应的种子矩阵，与所述非种子用户集合对应的非种子矩阵；
[0006]利用位图压缩算法对所述种子矩阵与所述非种子矩阵分别进行压缩，得到第一用户集合与第二用户集合；所述第一用户集合包括X个第一用户，且X为大于1的整数；所述第二用户集合包括Y个第二用户，且Y为大于1的整数；
[0007]计算每个所述第二用户与X个所述第一用户之间的相似度...

【技术保护点】

【技术特征摘要】
1.一种目标用户挖掘方法，其特征在于，包括：通过数据缓存层对种子用户集合与非种子用户集合分别进行特征选取，得到所述种子用户集合对应的种子矩阵，与所述非种子用户集合对应的非种子矩阵；利用位图压缩算法对所述种子矩阵与所述非种子矩阵分别进行压缩，得到第一用户集合与第二用户集合；所述第一用户集合包括X个第一用户，且X为大于1的整数；所述第二用户集合包括Y个第二用户，且Y为大于1的整数；计算每个所述第二用户与X个所述第一用户之间的相似度，得到每个所述第二用户对应的相似度集合；所述相似度集合中包括所述第二用户的X个相似度；基于所述相似度集合，从所述第二用户集合中确定出目标用户集合，所述目标用户集合中的每个目标用户为相似度大于预设阈值的第二用户。2.根据权利要求1所述的方法，其特征在于，所述通过数据缓存层对种子用户集合与非种子用户集合分别进行特征选取，得到所述种子用户集合对应的种子矩阵，与所述非种子用户集合对应的非种子矩阵，包括：通过所述数据缓存层，对所述种子用户集合中每个种子用户与所述非种子用户集合中每个非种子用户分别进行标签化处理，得到每个所述种子用户的第一标签集合与每个所述非种子用户的第二标签集合；根据所述第一标签集合以及所述第一标签集合中每个标签对应的第一标签值，得到所述种子用户集合对应的种子初始矩阵；根据所述第二标签集合以及所述第二标签集合中每个标签对应的第二标签值，得到所述非种子用户集合对应的非种子初始矩阵；将所述种子初始矩阵与所述非种子初始矩阵分别进行二进制处理，得到种子矩阵与非种子矩阵。3.根据权利要求2所述的方法，其特征在于，所述通过所述数据缓存层，对所述种子用户集合中每个种子用户与所述非种子用户集合中每个非种子用户分别进行标签化处理，得到每个所述种子用户的第一标签集合与每个所述非种子用户的第二标签集合，包括：基于每个所述种子用户与每个所述非种子用户的个人信息分别生成第一用户信息标签与第二用户信息标签，且基于每个所述种子用户与每个所述非种子用户预设时间内的行为信息分别生成第一用户行为标签与第二用户行为标签；根据所述第一用户信息标签与所述第一用户行为标签，得到每个所述种子用户的第一标签集合；根据所述第二用户信息标签与所述第二用户行为标签，得到每个所述非种子用户的第二标签集合。4.根据权利要求2所述的方法，其特征在于，所述将所述种子初始矩阵与所述非种子初始矩阵分别进行二进制处理，得到种子矩阵与非种子矩阵，包括：将所述初始种子矩阵与所述初始非种子矩阵对应的每个元素分别进行二进制处理，得到种子矩阵与非种子矩阵。5...

【专利技术属性】
技术研发人员：刘文渊，蔡凡华，毛佩芳，薛东荣，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人