一种基于时空图卷积的电信用户流失行为预测方法及系统技术方案

技术编号:31014721 阅读:32 留言:0更新日期:2021-11-30 02:53
本发明专利技术提出了一种基于时空图卷积的电信用户流失行为预测方法及系统,该预测方法包括以下步骤:L1.获取用户数据,对数据进行标记,根据需求将用户标记为流失或非流失,对数据进行预处理;L2.将数据整理为训练数据集和测试数据集,从空间维度上使用图卷积网络提取用户关系特征,从时间维度上使用LSTM网络提取用户行为特征,生成对应子模型;L3.采用异维度特征相互约束的特性,将提取的特征融合合并,训练融合模型,得到最终的用户流失行为特征;L4.将测试数据转换为符合模型输入的格式并输入模型中,获取用户流失行为结果。本发明专利技术通过将人工智能技术应用于用户流失预测问题,通过时空图卷积方法,精准预测用户流失行为,为通讯服务供应商提供策略依据。务供应商提供策略依据。务供应商提供策略依据。

【技术实现步骤摘要】
一种基于时空图卷积的电信用户流失行为预测方法及系统


[0001]本专利技术涉及用户行为预测的
,特别是一种基于时空图卷积的电信用户流失行为预测方法及系统。

技术介绍

[0002]得益于互联网行业的发展,网络越来越成为人们生活中必不可少的部分。而人们在网络中的各种活动,也依赖于网络运营商与电商企业的支持。随着互联网行业的不断发展,人口红利的消失,消费市场的用户基础呈断崖式缩减,越来越多的网络运营商与电商企业无法只依赖新用户的增长所带来的收益盈利。供应商们需要不断求变求存,将原本注重用户增量的发展方式转变为注重存量用户的精细化运营方式。因此在这之后的发展中,对于存量用户的挽留,存量用户价值的发掘,更能提升企业的收益。
[0003]在网络环境下,用户的所有行为都会产生其所对应的行为数据,这些用户行为数据总量,也在不断地逐年增长。而对这些数据的有效利用,近年来也在开发用户价值领域发挥越来越大的作用。如何从海量的数据中提取有用的特征,分析用户行为特征,以对用户未来的行为进行预估,从而实现用户流失结果的准确预测,这就需要快速定位和预测本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于时空图卷积的电信用户流失行为预测方法,其特征在于:包括以下步骤:L1.获取用户数据,并对数据进行标记,根据需求将用户标记为流失或非流失,并对数据进行预处理;L2.将数据整理为训练数据集和测试数据集,从空间维度上使用图卷积网络提取用户关系特征,从时间维度上使用LSTM网络提取用户行为特征,生成对应子模型;L3.采用异维度特征相互约束的特性,将提取的特征融合合并,训练融合模型,得到最终的用户流失行为特征;L4.将测试数据转换为符合模型输入的格式并输入模型中,最终获取用户流失行为结果。2.如权利要求1所述的一种基于时空图卷积的电信用户流失行为预测方法,其特征在于:步骤L1具体包括以下步骤:L11.通过Hive将通讯服务供应商的用户数据,根据用户手机号码及敏感数据脱敏处理产生的ref_id标签进行存储,包括月数据,日数据,静态数据以及余额数据;L12.按照定义,某个月语音数据和流量数据同时为0且上个月语音数据或流量数据不为0的用户为已经流失用户,且定义该用户为上个月流失;依据此定义,对存到本地系统的所有用户进行标定,确定流失用户和非流失用户;L13.对数据进行预处理,依据3σ准则将异常值剔除,将含有缺失值的样本剔除,对于连续性属性,采用如下两种标准化方式进行处理:或者其中x
min
,x
max
,x
mean
,σ分别表示数据的最小值,最大值,平均值和标准差;对于离散性变量,采用one

hot进行编码。3.如权利要求1所述的一种基于时空图卷积的电信用户流失行为预测方法,其特征在于:步骤L2具体包括以下步骤:L21.对数据集进行划分,从月数据中根据流失标签定义方法抽取流失用户为数据集正样本,非流失用户为数据集负样本,在所有数据中划分为训练集和测试集,保证训练集和测试集的正负样本比例与实际样本分布相同;L22.预测子模型初始化,设置子模型包括图学习层子模型,图卷积网络子模型以及LSTM子模型,图学习层子模型通过用户自适应的方式,学习用户关系矩阵,图卷积网络子模型结合图学习层输出的自适应矩阵,从月数据中提取用户关系特征,LSTM子模型从日数据以及余额数据中提取用户行为特征;图学习层子模型:N1=tanh(βT1η1)N2=tanh(βT2η2)其中,T1和T2代表着各个用户的静态数据转化的特征矩阵,η1和η2代表模型参数,β代表控制激活函数的超参数;M=ReLU(tanh(β(N1N
2T

N2N
1T
)))其中,N1,N2表示特征映射在

1到1之间构建的1*n特征向量,使用激活函数ReLU,tanh对图邻接矩阵进行调整;for i=1,2,

,K
idx=argtopk(M[i,:])M[i,

idx]=0其中,K表示第k个节点,argtopk表示随机选取一定数量节点的函数;图卷积网络子模型:用以计算Delta算子,f代表一个单射映射,代表任意邻接矩阵,X代表特征,σ代表激活函数;函数;函数;其中,α是一个超参数,来控制根节点的保留比例;i代表深度,H
in
代表上一层输出的输入隐藏状态,H
out
代表当前层的输出隐藏状态,W
(i)
代表初始化特征;LSTM子模型:o
t
=σ(W
o
·
[h
t
‑1,x
t
]+b
o
),f
t
=σ(W
f
·
[h
t
‑1,x
t
]+b
f
)其中,h
t
‑1表示上一个单元的输出,x
t
表示当前单元的输入,σ代表激活函数;h
t
=o
t
*tanh(C
t
),i
t
=σ(W
i
·
[h
t
‑1,x
t
]+b
i
),W
f
,W
o
,W
i
,W
C
表示对应各个时刻的权重矩阵,b
f
,b
o
,b
i
,b
C
表示相对应的偏置项;通过最小化预测值与实际值的误差来更新模型参数...

【专利技术属性】
技术研发人员:蒋云良沈莅凯邬惠峰刘勇
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1