System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 流量业务类型识别方法、装置、电子设备及存储介质制造方法及图纸_技高网

流量业务类型识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40133959 阅读:7 留言:0更新日期:2024-01-23 22:34
本申请提供了一种流量业务类型识别方法、装置、电子设备及存储介质。包括:根据待识别业务在当前时间内的网络流量的流量特征信息,将网络流量转化为流量特征数组;基于流量业务类型识别模型对流量特征数组进行处理,得到待识别业务所属目标业务类型的多条业务记录的预测概率;基于预测概率,确定网络流量的第一评估值和第一动态阈值;计算得到网络流量的第二评估值;根据第一评估值和第二评估值,计算得到第二评估值对应的第二动态阈值;基于第一评估值与第一动态阈值的比较结果,及第二评估值与第二动态阈值的比较结果,确定网络流量所属的流量业务类型识别结果。本申请实施例可以大大提高业务识别的准确率。

【技术实现步骤摘要】

本申请涉及通信,特别是涉及一种流量业务类型识别方法、装置、电子设备及存储介质


技术介绍

1、随着互联网技术的发展,运营商流量成分越来越复杂,除了传统的网页浏览、电子邮件等业务外,还有一系列的高速率、高质量业务如voip(voice over internetprotocol,网络电话)业务、即时通信类业务、p2p(peer-to-peer,点对点技术)业务、流媒体业务、网络游戏业务、网上购物、电子商务等。从运营商的角度来看,要求网络能够精细化运营,提供差异化的服务能力,同时,流量变化的趋势也是用户上网习惯的变化,从此运营商能够把握行业的发展变化。

2、然而,传统的dpi(深度包检测,deep packet inspection)业务识别技术,主要依靠前期对业务的特征字段的手工提取,才能维持准确率,虽然该方法有效,但前期的准备工作和后期的更新维护太过于费时费力。随后兴起的dfi(深度流检测,deep fiowinspection)业务识别技术,依靠大量提取的流特征来进一步筛选,使用传统的机器学习分类算法,大量的论文和实验证明了方法的有效性,但这种依靠经验的流特征选取方法可能会没有提取到或者丢掉不少关键特征,使得它的适应性和可移植性大打折扣,而且其分类的精细度还太过于粗颗粒,难以适应精细化的识别场景,从而导致识别结果的准确度较低。


技术实现思路

1、本申请实施例所要解决的技术问题是提供一种流量业务类型识别方法、装置、电子设备及存储介质,以利用识别模型实现网络流量中业务识别功能,大大提高业务识别的准确率。

2、第一方面,本申请实施例提供了一种流量业务类型识别方法,所述方法包括:

3、根据待识别业务在当前时间内的网络流量的流量特征信息,构建流量特征数组;

4、基于预先训练的流量业务类型识别模型对所述流量特征数组进行处理,得到所述待识别业务所属目标业务类型的多条业务记录的预测概率;

5、基于所述预测概率,确定所述网络流量的第一评估值和第一动态阈值;

6、计算得到所述网络流量的第二评估值,其中,当前时间段的网络流量的第二评估值根据上一个时间段的网络流量的第一评估值和第二评估值得到,第一个时间段的网络流量的第二评估值至少根据第一时间段的网络流量的第一评估值得到;

7、根据所述第一评估值和所述第二评估值,计算得到所述第二评估值对应的第二动态阈值;

8、基于所述第一评估值与所述第一动态阈值的比较结果,及所述第二评估值与所述第二动态阈值的比较结果,确定所述网络流量所属的流量业务类型识别结果。

9、可选地,在所述基于预先训练的流量业务类型识别模型对所述流量特征数组进行处理,得到所述待识别业务所属目标业务类型的多条业务记录的预测概率之前,还包括:

10、获取选取的时间段内的出口路由器的训练网络流量;

11、提取所述训练网络流量的样本流量特征信息;

12、基于所述样本流量特征信息,构建原始流量特征数组;

13、根据所述训练网络流量的业务流量类型,为所述原始流量特征数组设置样本标签;

14、基于所述原始流量特征数组和所述样本标签构建样本训练集和样本测试集;

15、基于所述样本训练集对待训练流量业务类型识别模型进行训练,得到预训练流量业务类型识别模型;

16、基于所述样本测试集对所述预训练流量业务类型识别模型进行测试,得到测试结果;

17、在所述测试结果满足业务需求的情况下,将所述预训练流量业务类型识别模型作为最终的所述流量业务类型识别模型。

18、可选地,所述基于所述样本流量特征信息,构建原始流量特征数组,包括:

19、获取所述样本流量特征信息中前n个流量特征,n为大于1的正整数;

20、将所述前n个流量特征转换为数组,作为所述原始流量特征数组。

21、可选地,所述基于所述预测概率,确定所述网络流量的第一评估值和第一动态阈值,包括:

22、对所述预测概率进行加权融合,得到所述网络流量的第一评估值;

23、确定除所述网络流量所属当前时间段之外的其他时间段的网络流量的第一评估值中的最大第一评估值,并将所述最大第一评估值的m倍作为第一动态阈值;其中,m大于或等于1。

24、可选地,所述对所述预测概率进行加权融合,得到所述网络流量的第一评估值,包括:

25、

26、其中,yi为第i个时间段的业务类型的第一评估值,fj为第i个时间段的流量的第j个业务类型预测概率值,wj为第i个时间段的流量的第j个预测概率值的权重值,n为预测概率值的个数。

27、可选地,所述根据所述第一评估值和所述第二评估值,计算得到所述第二评估值对应的第二动态阈值,包括:

28、根据除当前时间段之外的其他时间段的网络流量的第一评估值和第二评估值,计算第二动态阈值,所述第二动态阈值为所述其他时间段的网络流量的第一评估值和第二评估值的差值的绝对值中的最大值。

29、可选地,所述当前时间段的网络流量的第二评估值根据上一个时间段的网络流量的第一评估值和第二评估值得到,包括:

30、si=yi-1+a(yi-1-si-1)

31、其中,yi-1为第i-1个时间段的网络流量的第一评估值,si为第i个时间段的网络流量的第二评估值,si-1为第i-1个时间段的网络流量的第二评估值,α为预设值,s1=s0=y0,s1至少根据第一时间段的网络流量的第一评估值得到。

32、可选地,所述基于所述第一评估值与所述第一动态阈值的比较结果,及所述第二评估值与所述第二动态阈值的比较结果,确定所述网络流量所属的流量业务类型识别结果,包括:

33、在所述第一评估值大于所述第一动态阈值,且所述第二评估值大于所述第二动态阈值的情况下,确定所述网络流量所属的流量业务类型为目标业务类型。

34、第二方面,本申请实施例提供了一种流量业务类型识别装置,所述装置包括:

35、特征数组转化模块,用于根据待识别业务在当前时间内的网络流量的流量特征信息,构建流量特征数组;

36、预测概率输出模块,用于基于预先训练的流量业务类型识别模型对所述流量特征数组进行处理,得到所述待识别业务所属目标业务类型的多条业务记录的预测概率;

37、第一评估值确定模块,用于基于所述预测概率,确定所述网络流量的第一评估值和第一动态阈值;

38、第二评估值计算模块,用于计算得到所述网络流量的第二评估值,其中,当前时间段的网络流量的第二评估值根据上一个时间段的网络流量的第一评估值和第二评估值得到,第一个时间段的网络流量的第二评估值至少根据第一时间段的网络流量的第一评估值得到;

39、第二动态阈值计算模块,用于根据所述第一评估值和所述第二评估值,计算得到所述第二评估值对应的第二动态阈值;

本文档来自技高网...

【技术保护点】

1.一种流量业务类型识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述基于预先训练的流量业务类型识别模型对所述流量特征数组进行处理,得到所述待识别业务所属目标业务类型的多条业务记录的预测概率之前,还包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述样本流量特征信息,构建原始流量特征数组,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于所述预测概率,确定所述网络流量的第一评估值和第一动态阈值,包括:

5.根据权利要求4所述的方法,其特征在于,所述对所述预测概率进行加权融合,得到所述网络流量的第一评估值,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据所述第一评估值和所述第二评估值,计算得到所述第二评估值对应的第二动态阈值,包括:

7.根据权利要求1所述的方法,其特征在于,所述当前时间段的网络流量的第二评估值根据上一个时间段的网络流量的第一评估值和第二评估值得到,包括:

8.根据权利要求1所述的方法,其特征在于,所述基于所述第一评估值与所述第一动态阈值的比较结果,及所述第二评估值与所述第二动态阈值的比较结果,确定所述网络流量所属的流量业务类型识别结果,包括:

9.一种流量业务类型识别装置,其特征在于,所述装置包括:

10.一种电子设备,其特征在于,包括:

11.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行权利要求1至8中任一项所述的网页信息提取方法。

...

【技术特征摘要】

1.一种流量业务类型识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述基于预先训练的流量业务类型识别模型对所述流量特征数组进行处理,得到所述待识别业务所属目标业务类型的多条业务记录的预测概率之前,还包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述样本流量特征信息,构建原始流量特征数组,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于所述预测概率,确定所述网络流量的第一评估值和第一动态阈值,包括:

5.根据权利要求4所述的方法,其特征在于,所述对所述预测概率进行加权融合,得到所述网络流量的第一评估值,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据所述第一评估值和所述第二...

【专利技术属性】
技术研发人员:朱旭胡凯
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1