一种流量话单切分方法技术

技术编号:38364531 阅读:17 留言:0更新日期:2023-08-05 17:32
本发明专利技术公开了一种流量话单切分方法,属于运营商通信技术领域。针对目前通信运营体系中用户使用流量产生的话单处理需求改变和话单增量大等问题,本发明专利技术先引入用户的多种特征,通过注意力机制算法,输出用户的关键标签;其次计算用户的上网类别流量权重值,作为用户的流量特征;再次引入主机性能作为主机参数信息;最后将用户的多种特征作为循环神经网络模型的输出,动态计算用户某一时刻的流量步长即流量授权值。最终实现各类特征用户分类以及授予相应的流量步长,将月话单量的增长量从300%控制到了40%的增加,有效降低了系统运营风险。一方面可以实现话单的精确切分,减少话单量,降低主机存储扩容频率,另一方面提升用户使用感知。用户使用感知。用户使用感知。

【技术实现步骤摘要】
一种流量话单切分方法


[0001]本专利技术属于运营商通信
,具体涉及一种流量话单切分方法。

技术介绍

[0002]在运营商系统中用户使用5G网络上网,是通过网络核心设备向业务支撑系统申请流量授权,核心设备通过反馈的授权流量进行控制,支撑系统通过对授权量的切分,实现上网流量的使用计量。现有话单切分方法通过固定流量或固定时长切分,随着用户数量的增加和用户上网时间的增加,通过固定切分流量话单,月话单量增长达到了300%,服务器资源需要定期扩容以满足话单处理的需求,增加了运营费用和运营风险。

技术实现思路

[0003]针对目前通信运营体系中用户使用流量产生的话单处理需求改变和话单增量大等问题,本专利技术提供了一种流量话单切分方法。
[0004]为了达到上述目的,本专利技术采用了下列技术方案:
[0005]K均值聚类(k

means)是基于样本集合划分的聚类算法。K均值聚类将样本集合划分为k个子集,构成k个类,将n个样本分到k个类中,每个样本到其所属类的中心距离最小,每个样本仅属于一个类,这就是k均值聚类,同时根据一个样本仅属于一个类,也表示了k均值聚类是一种硬聚类算法。
[0006]一种流量话单切分方法,包括以下步骤:
[0007]步骤1,计算用户的业务类别(RG)权重值;RG表示用户上网的业务类别;
[0008]步骤1.1,首先将用户的每个业务类别下的流量作为样本进行聚类,对用户的每个业务类别进行打标;
[0009]步骤1.2,用户的流量权重值选取;
[0010]首先,计算打标后各项业务流量flow
i
的变异系数v
i
,表示为:其中v
i
表示变异系数,σ
i
表示标准差,表示均值,i表示用户数量;
[0011]然后,计算用户每个业务类别下的流量总和及权重w
i
,表示为:其中,w
i
表示用户流量权重,表示各项flow
i
的变异系数之和;
[0012]将用户业务类别下的流量总权重组成集合W={W1,W2,W3},作为用户流量动态步长判断的输入。
[0013]步骤2,基于注意力机制提取用户的关键信息;
[0014]步骤2.1,提取用户信息并进行简化和编号,得到用户信息标签T,将用户信息标签
T组成集合J,表示为J={T1,T2,...,T
n
};
[0015]步骤2.2,根据用户信息标签进行联合结构特征融合,得到:地域流量特征,分时段流量特征,融合习好标识流量特征;
[0016]步骤2.3,基于注意力机制的编解码器模型进行注意力机制的权值分布计算,得到输入序列中每个特征对于当前输出信号的注意力分布概率分布值a
ij
,表示为:a
ij
=F(h
i
,H
j
),其中,h
j
表示输入数据X
j
在编码器中的隐藏状态,H
j
表示输出数据Y
j
在解码器中的隐藏状态,F表示计算H
j
和h
j
符合用户流量使用习惯的概率值;
[0017]在解码器模块中计算出输入信息中各元素对应输出信号的注意力概率分布值,即是对于每个输出计算对应中间语义编码,使得不同的输入元素分配不同的权重值,突出权值大的数据,弱化权值小的数据,从而改善分类效果。
[0018]对于输出数据Y
j
每个不同的输出元素y
j
都对应着不同的中间语义编码E
j
,表示为其中,S表示地域流量特征,表示分时段流量特征,C
ij
表示融合习好标识流量特征,T表示输入数据的总个数;
[0019]解码器输出特征为:X
t
=D(C
j
,x1,x2,x3,...,x
j
‑1),其中D表示用户流量使用特征,x1,x2,x3,...,x
j
‑1为输出元素;
[0020]联合用户的业务类别聚类分类后的流量总权重组成集合,形成用户流量使用特征为:
[0021]P={W,x
t
}=(E
j
,x1,x2,x3,...,x
j
‑1);
[0022]步骤3,基于循环神经网络(GRU)的流量预测;
[0023]使用循环神经网络模型,对于长度n的输入序列{x1,x2,x3,...,x
n
},通过输入序列映射到隐藏层状态来学习序列中的特征信息,然后通过将多个隐藏层的特征信息堆叠在一起获取更高级别的信息;
[0024]将解码器输出特征X
t
作为循环神经网络模型的输入特征,循环神经网络模型的前向传播表示为:
[0025]Z
t
=σ(W
z
*X
t
+U
z
*h
t
‑1+b
z
)
[0026]R
t
=σ(W
r
*X
t
+U
r
*h
t
‑1+b
r
)
[0027][0028][0029]其中,R
t
表示t时刻的重置门;Z
t
表示t时刻的更新门;表示t时刻的候选隐藏状态;h
t
表示t时刻的当前单元状态;h
t
‑1表示上一时刻的单元状态;

表示哈达玛积;σ表示Sigmoid激活函数,将数据转换为[0,1]的数值;W
r
表示重置门的权值矩阵;W
z
表示更新门的权值矩阵;W
h
表示候选隐藏状态的权值矩阵;W*和U*是卷积运算卷积核;b*为偏置项,作用是训练阶段的模型的参数;
[0030]为了在输出层生成与当前输入特征对应的用户流量使用值,建立一个包含两个卷积层的网络,然后使用Softmax函数计算权重值,
[0031]S
t
=U
s
*tanh(W
xs
*X
t
+W
hs
*h
t
‑1+b
s
)+b
us
[0032]X
t
是用户当天第t时特征值,h
t
‑1是上一时刻单元状态,U
s
,W
xs
,W
hs
均表示卷积核,大
小都是1
×
1;
[0033]S
t
得到与当前输入X
t
对应的流量权值,表示为:其中,表示输入特征的注意力权重,大小在0~1之本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种流量话单切分方法,其特征在于:包括以下步骤:步骤1,计算用户的业务类别权重值;步骤1.1,首先将用户的每个业务类别下的流量作为样本进行聚类,对用户的每个业务类别进行打标;步骤1.2,用户的流量权重值选取;首先,计算打标后各项业务流量flow
i
的变异系数v
i
,表示为:其中v
i
表示变异系数,σ
i
表示标准差,表示均值,i表示用户数量;然后,计算用户每个业务类别下的流量总和及权重w
i
,表示为:其中,w
i
表示用户流量权重,表示各项flow
i
的变异系数之和;将用户业务类别下的流量总权重组成集合W={W1,W2,W3},作为用户流量动态步长判断的输入;步骤2,基于注意力机制提取用户的关键信息;步骤2.1,提取用户信息并进行简化和编号,得到用户信息标签T,将用户信息标签T组成集合J,表示为J={T1,T2,...,T
n
};步骤2.2,根据用户信息标签进行联合结构特征融合,得到:地域流量特征,分时段流量特征,融合习好标识流量特征;步骤2.3,基于注意力机制的编解码器模型进行注意力机制的权值分布计算,得到输入序列中每个特征对于当前输出信号的注意力分布概率分布值a
ij
,表示为:a
ij
=F(h
i
,H
j
),其中,h
j
表示输入数据X
j
在编码器中的隐藏状态,H
j
表示输出数据Y
j
在解码器中的隐藏状态,F表示计算H
j
和h
j
符合用户流量使用习惯的概率值;对于输出数据Y
j
每个不同的输出元素y
j
都对应着不同的中间语义编码E
j
,表示为其中,S表示地域流量特征,表示分时段流量特征,C
ij
表示融合习好标识流量特征,T表示输入数据的总个数;解码器输出特征为:X
t
=D(C
j
,x1,x2,x3,...,x
j
‑1),其中D表示用户流量使用特征,x1,x2,x3,...,x
j
‑1为输出元素;联合用户的业务类别聚类分类后的流量总权重组成集合,形成用户流量使用特征为:P={W,x
t
}=(E
j
,x1,x2,x3,...,x
j
‑1);步骤3,基于循环神经网络的流量预测;使用循环神经网络模型,对于长度n的输入序列{x1,x2,x3,...,x
n
},通过输入序列映射到隐藏层状态来学习序列中的特征信息,然后通过将多个隐藏层的特征信息堆叠在一起获取更高级别的信息;将解码器输出特征X
t
作为循环神经网络模型的输入特征,循环神经网络模型的前向传播表示为:
Z
t
=σ(W
z
*X
t
+U
z
*h
t
‑1+b
z
)R
t
=σ(W
r
*X
t
+U
r
*h
t
‑1+b
r
))其中,R
t
表示t时刻的重置门;Z
t
表示t时刻的更新门;表示t时刻的候选隐藏状态;h
t
表示t时刻的当前单元状态;h
t
‑1表示上一时刻的单元状态;

表示哈达玛积;σ表示Sigmoid激活函数,将数据转换为[0,1]的数值;W
r
表示重置门的权值矩阵;W
z
表示更新门的权值矩阵;W
h
表示候选隐藏状态的权值矩阵;W*和U*是卷积运算卷积核;b*为偏置项,作用是训练阶段的模型的参数;建立一个包含两个卷积层的网络,然后使用Softmax函数计算权重值,S
t
=U
s
*tanh(W
xs
*X
t
+W
hs
*h
t
‑1+b
s
)+b
us
X
t
是用户当天第t时特征值,h
t

【专利技术属性】
技术研发人员:李建林武小波赵鑫
申请(专利权)人:山西应用科技学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1