用户挖掘方法、系统、装置及存储介质制造方法及图纸

技术编号:32781367 阅读:17 留言:0更新日期:2022-03-23 19:39
本发明专利技术公开了一种用户挖掘方法、系统、装置及存储介质,其中方法包括:获取用户的呼叫数据;呼叫数据为主叫用户对被叫用户的呼叫数据;然后对呼叫数据进行数据清洗,生成呼叫行为列表;基于三度影响力原则,对呼叫行为列表进行剪枝操作,生成呼叫网络;基于随机游走算法,根据呼叫网络生成随机呼叫序列集合;将随机呼叫序列集合输入训练好的用户挖掘模型,得到主叫用户对应的用户向量集;用户挖掘模型为Skip

【技术实现步骤摘要】
用户挖掘方法、系统、装置及存储介质


[0001]本申请涉及互联网
,尤其涉及一种用户挖掘方法、系统、装置及存储介质。

技术介绍

[0002]在互联网中,以社区为单位对网络用户进行网格控制,对舆论管控或者是精准营销活动都具有重要意义,因此,挖掘社区用户是实现互联网管控的重要手段。
[0003]而相关技术中,一般是以网络用户的社交关系为中心进行社交网络的搜索,但由于用户的属性具有多样性,且网络的复杂度正在日益提高,因此在进行网络用户的挖掘过程中,相关技术正面临着很大的算法及工程挑战。

技术实现思路

[0004]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请提出一种用户挖掘方法、系统、装置及存储介质。
[0005]第一方面,本申请实施例提供了一种用户挖掘方法,包括:获取用户的呼叫数据;其中,所述呼叫数据为指定时间段内,多个主叫用户对被叫用户的呼叫数据;对所述呼叫数据进行数据清洗,生成呼叫行为列表;基于三度影响力原则,对所述呼叫行为列表进行剪枝操作,生成呼叫网络;其中,所述呼叫网络为有向图;基于随机游走算法,根据所述呼叫网络生成随机呼叫序列集合;将所述随机呼叫序列集合输入训练好的用户挖掘模型,得到所述用户对应的用户向量集;其中,所述用户挖掘模型Skip

gram模型,所述用户向量集中包括多个所述用户对应的用户向量;计算当前所述用户向量与所述用户向量集中其他所述用户向量的相似度,确定与当前所述用户向量对应的所述用户相似的相似用户群。
[0006]可选地,所述方法还包括:获取所述相似用户群中所有所述用户的高频订购列表;根据所述高频订购列表,对所述相似用户群中的所有所述用户进行订购推荐。
[0007]可选地,所述对所述呼叫数据进行数据清洗,生成呼叫行为列表,包括:定义多个拨打动作类型,并定义所述拨打动作类型对应的第一权重值;将所述呼叫数据中属于同一所述主叫用户的所述呼叫数据进行合并;根据所述拨打动作类型、所述第一权重值和合并后的所述呼叫数据,计算当前所述主叫用户对应的所有所述被叫用户的呼叫加权得分;根据所述呼叫加权得分,对当前所述主叫用户对应的所有所述被叫用户进行排序,生成所述呼叫行为列表。
[0008]可选地,所述对所述呼叫数据进行数据清洗,生成呼叫行为列表,包括:将所述呼叫数据中属于同一所述主叫用户的所述呼叫数据进行合并;完成合并后,根据呼叫时间,对当前所述主叫用户对应的所述呼叫数据进行排序;完成排序后,根据预设的连续呼叫间隔,对当前所述主叫用户对应的所述呼叫数据进行切分,生成包括多个连续呼叫单元的所述呼叫行为列表;其中,所述连续呼叫单元中包括若干个所述被叫用户。
[0009]可选地,所述基于三度影响力原则,对所述呼叫行为列表进行剪枝操作,生成呼叫
网络,包括:根据所述呼叫数据,确定所有所述被叫用户与所述主叫用户的关系级别;其中,所述关系级别分为一级关系、二级关系、三级关系和其他关系;将属于所述其他关系的所述被叫用户对应的所述呼叫数据从所述呼叫行为列表中删除;根据完成删除后的所述呼叫行为列表,生成所述呼叫网络。
[0010]可选地,所述基于随机游走算法,根据所述呼叫网络生成随机呼叫序列集合,包括:确定所述呼叫网络中的第二权重值;在所述呼叫网络内,根据所述第二权重值实现随机游走算法,生成所述随机呼叫序列集合。
[0011]第二方面,本申请实施例提供了一种用户挖掘系统,包括:第一模块,用于获取用户的呼叫数据;其中,所述呼叫数据为指定时间段内,多个主叫用户对被叫用户的呼叫数据;第二模块,用于对所述呼叫数据进行数据清洗,生成呼叫行为列表;第三模块,用于基于三度影响力原则,对所述呼叫行为列表进行剪枝操作,生成呼叫网络;其中,所述呼叫网络为有向图;第四模块,用于基于随机游走算法,根据所述呼叫网络生成随机呼叫序列集合;第五模块,用于将所述随机呼叫序列集合输入训练好的用户挖掘模型,得到所述用户对应的用户向量集;其中,所述用户挖掘模型Skip

gram模型,所述用户向量集中包括多个所述用户对应的用户向量;第六模块,用于计算当前所述用户向量与所述用户向量集中其他所述用户向量的相似度,确定与当前所述用户向量对应的所述用户相似的相似用户群。
[0012]第三方面,本申请实施例提供了一种装置,包括:至少一个处理器;至少一个存储器,用于存储至少一个程序;当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如第一方面所述的用户挖掘方法。
[0013]第四方面,本申请实施例提供了一种计算机存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由所述处理器执行时用于实现如第一方面所述的用户挖掘方法。
[0014]本申请实施例的有益效果如下:在本申请实施例提出的用户挖掘方法中,首先获取用户的呼叫数据;其中,呼叫数据为主叫用户对被叫用户的呼叫数据;然后对呼叫数据进行数据清洗,生成呼叫行为列表;基于三度影响力原则,对呼叫行为列表进行剪枝操作,生成呼叫网络;基于随机游走算法,根据呼叫网络生成随机呼叫序列集合;将随机呼叫序列集合输入训练好的用户挖掘模型,得到主叫用户对应的用户向量集;其中,用户挖掘模型为Skip

gram 模型;最后计算当前主叫用户对应的用户向量与其他主叫用户对应的用户向量的相似度,确定与当前主叫用户相似的相似用户群。本申请实施例提出了根据用户的呼叫数据来挖掘与当前用户相似的相似用户群的方法,与相关技术相比,本申请通过随机游走的方式生成呼叫网络,有利于改善呼叫低频的呼叫数据特征;并且本申请利用用户挖掘模型生成表征用户的用户向量,能够在进行数据挖掘时不受相关技术中的社交网络无向图的局限,能更好地挖掘到与当前用户相似的相似用户群,从而帮助进行舆情管控、精准营销等活动。
附图说明
[0015]附图用来提供对本申请技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
[0016]图1为本申请实施例提供的用户挖掘方法的步骤流程图;
[0017]图2为本申请实施例提供的生成呼叫行为列表的第一步骤流程图;
[0018]图3为本申请实施例提供的生成呼叫行为列表的第二步骤流程图;
[0019]图4为本申请实施例提供的呼叫网络的示意图;
[0020]图5为本申请实施例提供的用户挖掘系统的示意图;
[0021]图6为本申请实施例提供的装置的示意图。
具体实施方式
[0022]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
[0023]需要说明的是,虽然在系统示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于系统中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户挖掘方法,其特征在于,包括:获取用户的呼叫数据;其中,所述呼叫数据为指定时间段内,多个主叫用户对被叫用户的呼叫数据;对所述呼叫数据进行数据清洗,生成呼叫行为列表;基于三度影响力原则,对所述呼叫行为列表进行剪枝操作,生成呼叫网络;其中,所述呼叫网络为有向图;基于随机游走算法,根据所述呼叫网络生成随机呼叫序列集合;将所述随机呼叫序列集合输入训练好的用户挖掘模型,得到所述用户对应的用户向量集;其中,所述用户挖掘模型Skip

gram模型,所述用户向量集中包括多个所述用户对应的用户向量;计算当前所述用户向量与所述用户向量集中其他所述用户向量的相似度,确定与当前所述用户向量对应的所述用户相似的相似用户群。2.根据权利要求1所述的用户挖掘方法,其特征在于,所述方法还包括:获取所述相似用户群中所有所述用户的高频订购列表;根据所述高频订购列表,对所述相似用户群中的所有所述用户进行订购推荐。3.根据权利要求1

2任一项所述的用户挖掘方法,其特征在于,所述对所述呼叫数据进行数据清洗,生成呼叫行为列表,包括:定义多个拨打动作类型,并定义所述拨打动作类型对应的第一权重值;将所述呼叫数据中属于同一所述主叫用户的所述呼叫数据进行合并;根据所述拨打动作类型、所述第一权重值和合并后的所述呼叫数据,计算当前所述主叫用户对应的所有所述被叫用户的呼叫加权得分;根据所述呼叫加权得分,对当前所述主叫用户对应的所有所述被叫用户进行排序,生成所述呼叫行为列表。4.根据权利要求1

2任一项所述的用户挖掘方法,其特征在于,所述对所述呼叫数据进行数据清洗,生成呼叫行为列表,包括:将所述呼叫数据中属于同一所述主叫用户的所述呼叫数据进行合并;完成合并后,根据呼叫时间,对当前所述主叫用户对应的所述呼叫数据进行排序;完成排序后,根据预设的连续呼叫间隔,对当前所述主叫用户对应的所述呼叫数据进行切分,生成包括多个连续呼叫单元的所述呼叫行为列表;其中,所述连续呼叫单元中包括若干个所述被叫用户。5.根据权利要求1

2...

【专利技术属性】
技术研发人员:陈国言
申请(专利权)人:天翼爱音乐文化科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1