基于表示学习和行为特征的通信网用户呼叫对象预测方法技术

技术编号:27583088 阅读:17 留言:0更新日期:2021-03-09 22:41
本发明专利技术提供基于表示学习和行为特征的通信网用户呼叫对象预测方法,属于通信网络用户行为分析技术领域,包括:随机生成通信网络中各通信节点的初始向量,构造呼叫顺序网络;根据各用户呼叫历史记录提取三元组集合,构造并训练由LSTM循环神经网络和双线性层堆叠而成的图表示学习模型,获得所有通信节点的更新后通信节点向量;构造并训练由并行的通信时长

【技术实现步骤摘要】
基于表示学习和行为特征的通信网用户呼叫对象预测方法


[0001]本专利技术属于通信网络用户行为分析
,具体涉及基于表示学习和行为特征的通信网用户呼叫对象预测方法。

技术介绍

[0002]随着信息技术的更新换代,近年来移动通信工具特别是智能手机得到迅速普及,极大方便了人们的生活,并产生了海量的用户通信行为历史数据。然而,便捷的通信工具也成为了违法犯罪团伙的联系和组织手段,由于犯罪团伙组织的隐蔽性和执法人员侦察的滞后性,针对通信网络中用户的下一次通信对象预测已成为一个十分重要且有价值的问题,可有效辅助相关执法部门准确预测目标用户未来可能的通信对象从而提前开展通信监听与行动部署,可为例如公共安全领域中的维稳反恐等工作提供支持,具有广泛的应用前景。
[0003]然而,在大规模的用户呼叫历史行为数据中进行目标用户的下一次通信对象预测存在很多困难:首先,电信运营商多元化的服务与用户数据的迅速增长产生了海量的用户数据,往往一个市级范围内的通信数据中就含有千万级的用户,计算量大导致传统方法很难有效处理;另外,用户在通信网络中并不是独立存在的个体,而是存在关联并形成通信网络,并且用户的呼叫历史记录中蕴含了通信优先顺序等信息,仅考虑用户呼叫历史记录统计特征的通信对象预测方法或者仅针对用户在通信网中节点相似性的通信对象预测方法能力有限;此外,现有的对通信网中用户行为的研究主要聚焦在通信网整体流量变化分析,伪造号码识别,诈骗电话检测等问题上,对用户下一次通信对象的预测问题缺乏现成技术方案和深度研究。
[0004]因此,需要提出一种智能有效的通信对象预测方法,能够基于海量数据,将用户所在通信网络中拓扑信息与用户呼叫历史行为中的用户行为特征相结合,基于表示学习和深度学习的用户呼叫对象预测方法,准确高效的预测用户下一次的通信对象,从而满足公共安全等领域相关部门机构针对通信网用户的侦察和监控需求。

技术实现思路

[0005]本专利技术针对上述现有技术中存在的问题,提出了基于表示学习和行为特征的通信网用户呼叫对象预测方法,通过分析用户呼叫历史行为所产生的海量数据,预测用户的下一次呼叫对象。
[0006]本专利技术所采用的技术方案如下:基于表示学习和行为特征的通信网用户呼叫对象预测方法,其特征在于,包括以下步骤:步骤1:随机生成通信网络中各通信节点的初始向量,得到通信节点初始向量集合;其中,|V|为通信网络中通信节点的总个数;步骤2:根据通信网络中各用户呼叫历史记录中的通信节点被呼叫的先后顺序构造呼
叫顺序网络G={V,E};其中,V为通信节点集合,E为V中各通信节点之间联系的集合,即用户呼叫通信节点之后,呼叫另一个通信节点,那么会存在联系,,;步骤3:定义步骤2所得呼叫顺序网络G={V,E}中的一条由起始通信节点、其次通信节点和最终通信节点组成的通信顺序路径为一个三元组,,根据通信网络中各用户呼叫历史记录提取三元组集合,作为图表示学习模型的训练集;步骤4:构造并训练由LSTM(Long Short-Term Memory,长短期记忆网络)循环神经网络和双线性(Bi-Linear)层堆叠而成的图表示学习模型,得到各通信节点的更新后通信节点向量,具体步骤如下:步骤4.1:从步骤3所得三元组集合中随机抽取N个三元组作为所述图表示学习模型的一次批处理训练的训练数据,为起始通信节点的下标,为其次通信节点的下标,为最终通信节点的下标,为训练数据中第j个三元组的起始通信节点,为训练数据中第j个三元组的其次通信节点,为训练数据中第j个三元组的最终通信节点;将中各三元组的起始通信节点和其次通信节点的初始向量组成输入序列,作为图表示学习模型中LSTM循环神经网络的输入,最终通信节点作为图表示学习模型的训练目标;步骤4.2:将输入序列输入至时间步步长为2的LSTM循环神经网络,所述LSTM循环神经网络的公式为:
其中,为sigmoid激活函数;p表示当前时间步;,为LSTM循环神经网络当前时间步的输入向量,在第一时间步中为,在第二时间步中为;为输入门;为忘记门;为输出门;为LSTM循环神经网络当前时间步的内部记忆单元;为LSTM循环神经网络上一时间步的内部记忆单元;为作用于当前时间步输入的输入门权重矩阵;为作用于上一时间步输出的输入门权重矩阵;为作用于当前时间步输入的忘记门权重矩阵;为作用于上一时间步输出的忘记门权重矩阵;为作用于当前时间步输入的输出门权重矩阵;为作用于上一时间步输出的输出门权重矩阵;为作用于当前时间步输入的内部记忆单元权重矩阵;为作用于上一时间步输出的内部记忆单元权重矩阵;为当前时间步的输出状态;为上一时间步的输出状态,在第一时间步中为0;得到输入序列在LSTM循环神经网络第一时间步和第二时间步的输出,分别为和;步骤4.3:将作为双线性层的输入,得到通信网络中各通信节点的概率分布,即用户呼叫、后接下来呼叫各通信节点的概率;所述双线性层的公式为:其中,为图表示学习模型中双线性层的权值矩阵;为通信节点初始向量集合的转置;为输入为训练集中第j个三元组时,第一个通信节点被预测到的概率;为输入为训练集中第j个三元组时,第二个通信节点被预测到的概率;为输入为训练集中第j个三元组时,第|V|个通信节点被预测到的概率;步骤4.4:以最终通信节点为图表示学习模型的训练目标,使用反向传播算法对图表示学习模型进行训练,得到初次训练后图表示学习模型和更新后通信节点向量、,所述反向传播算法所采用的目标损失函数为与最终通信节点的平均交叉熵损失:
其中,为一次批处理训练的训练数据中第j个三元组的最终通信节点被预测到的概率;步骤4.5:基于训练集中的所有三元组,重复步骤4.1~4.4,依次对步骤4.4所得初次训练后图表示学习模型进行训练,得到训练完成的图表示学习模型和通信网络中所有通信节点的更新后通信节点向量;步骤5:构造并训练呼叫对象预测模型,所述呼叫对象预测模型由并行的通信时长-位置加权层和双向-长期短期记忆(Bi-LSTM)神经网络,堆叠前馈神经网络和双线性层而成;具体步骤如下:步骤5.1:基于步骤4所得所有通信节点的更新后通信节点向量,根据随机一条用户呼叫历史记录,获得对应的更新后通信节点向量序列,将更新后通信节点向量序列中的向量序列作为呼叫对象预测模型中通信时长-位置加权层和双向-长期短期记忆神经网络的输入,作为呼叫对象预测模型的训练目标;其中,T为用户呼叫历史记录的通信节点长度;步骤5.2:将向量序列作为通信时长-位置加权层的输入,计算得到用户呼叫历史记录中各通信节点在该用户呼叫历史记录中关于位置和通信时长的长期行为特征:其中,为用户呼叫历史记录中第t个更新后通信节点向量;为用户呼叫历史记录中第t个通信节点的通信时长;步骤5.3:将向量序列作为双向-长期短期记忆神经网络的输入,所述双向-长期短期记忆神经网络的时间步步长为T-1,单向公式为:
其中,为双向-长期短期记忆神经网络当前时间步的输入向量;为当前时间步的输出状态;为上一时间步的输出状态,在第一时间步中为0;为双向-长期短期记忆神经网络当前时间步的内部记忆单元;为双向-长期短期记忆神经本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于表示学习和行为特征的通信网用户呼叫对象预测方法,其特征在于,包括以下步骤:步骤1:随机生成通信网络中各通信节点的初始向量;其中,|V|为通信网络中通信节点的总个数;步骤2:根据通信网络中各用户呼叫历史记录中的通信节点被呼叫的先后顺序构造呼叫顺序网络G={V,E};其中,V为通信节点集合,E为V中各通信节点之间联系的集合;步骤3:定义步骤2所得呼叫顺序网络G={V,E}中的一条由起始通信节点、其次通信节点和最终通信节点组成的通信顺序路径为一个三元组,,根据各用户呼叫历史记录提取三元组集合,作为图表示学习模型的训练集;步骤4:构造由LSTM循环神经网络和双线性层堆叠而成的图表示学习模型,基于步骤3所得三元组集合对图表示学习模型进行训练,输入为由各三元组的起始通信节点和其次通信节点的初始向量组成的输入序列,训练目标为最终通信节点,训练完成得到所有通信节点的更新后通信节点向量;步骤5:构造由并行的通信时长-位置加权层和双向-长期短期记忆神经网络,堆叠前馈神经网络和双线性层而成的呼叫对象预测模型,基于所有通信节点的更新后通信节点向量,根据各用户呼叫历史记录获得对应的更新后通信节点向量序列,以训练呼叫对象预测模型,输入为更新后通信节点向量序列除去最后一个更新后通信节点向量的向量序列,训练目标为最后一个更新后通信节点向量,得到含用户呼叫历史中的长短期行为特征的训练完成的呼叫对象预测模型;步骤6:根据步骤4所得各通信节点的更新后通信节点向量,获得待预测用户历史呼叫记录对应的待预测更新后通信节点向量序列,输入至步骤5所得训练完成的呼叫对象预测模型中,得到通信网络中所有通信节点的被呼叫概率,被呼叫概率最大的前K个通信节点代表最有可能被呼叫的对象;其中,K为预设值。2.根据权利要求1所述基于表示学习和行为特征的通信网用户呼叫对象预测方法,其特征在于,步骤4采用批处理训练的方式训练图表示学习模型,一次批处理训练的训练数据为,其中,为训练集中第j个三元组的起始通信节点,为训练集中第j个三元组的其次通信节点,为训练集中第j个三元组的最终通信节点,N为一次批处理训练的训练数据中三元组的个数;将中各三元组的起始通信节点和其次通信节点的初始向量组成输入序列,作为图表示学习模型中LSTM循环神经网络的输入,最终通信节点作为图表示学习模型的训练目标。3.根据权利要求2所述基于表示学习和行为特征的通信网用户呼叫对象预测方法,其特征在于,步骤4中批处理训练的具体步骤如下:步骤4.1:将输入序列输入至时间步步长为2的LSTM循环神经
网络,得到输入序列在第一时间步和第二时间步的输出,分别为和;步骤4.2:将输入至双线性层,得到通信网络中各通信节点的概率分...

【专利技术属性】
技术研发人员:刘峤蓝天曾义夫代婷婷宋明慧周乐孙建强曾维智吴祖峰
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1