流量报文的识别方法及装置、计算设备及计算机存储介质制造方法及图纸

技术编号:39137639 阅读:11 留言:0更新日期:2023-10-23 14:53
本发明专利技术公开了一种流量报文的识别方法及装置、计算设备及计算机存储介质,其中流量报文的识别方法包括:根据应用指纹网络对流量报文进行识别,得到应用指纹网络识别结果,其中,应用指纹网络用于发现流量报文字段的显式规则;将流量报文输入至深度学习网络,得到深度学习网络识别结果,其中,深度学习网络用于挖掘流量报文特征之间的隐式关系和高阶特征;将应用指纹网络识别结果和所述深度学习网络识别结果进行加权合并,得到流量报文的识别结果。本发明专利技术通过应用指纹网络发现报文字段显式的规则以增强模型的记忆能力,同时,通过深度学习网络挖掘特征之间隐式的关系和高阶特征以增强模型的泛化能力,提升了模型的表达能力和系统的泛化性能。和系统的泛化性能。和系统的泛化性能。

【技术实现步骤摘要】
流量报文的识别方法及装置、计算设备及计算机存储介质


[0001]本专利技术涉及人工智能领域,具体涉及一种流量报文的识别方法及装置、计算设备及计算机存储介质。

技术介绍

[0002]近年来,随着互联网时代的来临,从2G、3G到4G、5G,移动设备和应用程序的数量大幅增长,用户在互联网上的产生的行为数据量以指数级上升,同时随着传输端技术的发展,对各大应用产品在流量端产生的数据进行识别的难度也逐渐上升。
[0003]目前业界的流量识别技术方案通常利用DPI(Deep Packet Inspection)设备对网络关键点处的流量和报文内容进行检测分析,根据事先定义的策略和规则对流量进行识别,包括流量采集、流量过滤、HTTP流量学习分析、特征提取等。
[0004]然而,现有上述流量识别技术方案存在如下缺点:一是不能很好地识别加密流量,特别是对于音频、视频应用所产生的数据流量,并且,加密流量在整体流量中的占比非常高,使用传统的DPI方法将导致较低的覆盖率和准确率;二是没有考虑新的流量类型不断增多的情形,对于更新频繁的流量类型没有相应的流量规则对其进行匹配,不具备泛化性;三是流量匹配识别所依赖的特征规则库无法自动生成,或者,生成特征规则库的成本较高、智能化程度不足。

技术实现思路

[0005]鉴于上述问题,提出了本专利技术以便提供一种克服上述流量识别存在的泛化性较差问题的流量报文的识别方法及装置、计算设备及计算机存储介质。
[0006]根据本专利技术的一个方面,提供了一种流量报文的识别方法,包括:
[0007]根据应用指纹网络对流量报文进行识别,得到应用指纹网络识别结果,其中,所述应用指纹网络用于发现流量报文字段的显式规则;
[0008]将流量报文输入至深度学习网络,得到深度学习网络识别结果,其中,所述深度学习网络用于挖掘流量报文特征之间的隐式关系和高阶特征;
[0009]将所述应用指纹网络识别结果和所述深度学习网络识别结果进行加权合并,得到流量报文的识别结果。
[0010]在一种可选的方式中,所述流量报文字段包含如下字段中的至少一者:
[0011]加密报文中的SNI字段;
[0012]非加密报文中的UA字段、Host字段、Refer_URI字段。
[0013]在一种可选的方式中,所述根据应用指纹网络对流量报文进行识别,得到应用指纹网络识别结果进一步包括:
[0014]判断所述流量报文是否为加密报文;若是,则提取所述流量报文的SNI字段,根据所述SNI字段进行识别;若否,则提取所述流量报文的UA字段,根据所述UA字段进行识别;
[0015]若判断未成功,则提取所述流量报文的Host字段和/或Refer_URI字段,根据所述
Host字段和/或Refer_URI字段进行识别。
[0016]在一种可选的方式中,所述将流量报文输入至深度学习网络,得到深度学习网络识别结果进一步包括:
[0017]对流量报文进行特征抽取,得到流量报文特征;
[0018]所述流量报文特征包括如下特征中一项或多项:服务器IP和端口、UA字段、HOST字段、URI字段、Refer_URI字段、SNI字段、反编译文件中的域字段。
[0019]在一种可选的方式中,在所述得到流量报文特征之后,所述方法还包括:
[0020]根据预设阈值对流量报文特征对应的序列表征向量进行掩膜处理。
[0021]在一种可选的方式中,所述方法还包括:
[0022]采集历史流量报文;
[0023]根据历史流量报文对应用指纹网络和深度学习网络进行训练;其中,将历史流量报文输入至应用指纹网络和深度学习网络中,结合损失函数计算梯度,反向传播到应用指纹网络和深度学习网络中,分别训练各自的参数,当满足迭代条件时,结束训练。
[0024]在一种可选的方式中,所述应用指纹网络和深度学习网络的输出通过以下公式进行加权合并:
[0025][0026]其中,P为流量报文的识别结果;w
print
为应用指纹网络的权重;w
deep
为深度学习网络最后一层激活函数的权重;x为应用指纹网络的输入;b为常量。
[0027]根据本专利技术的另一方面,提供了一种流量报文的识别装置,包括:
[0028]应用指纹网络模块,用于根据应用指纹网络对流量报文进行识别,得到应用指纹网络识别结果,其中,所述应用指纹网络用于发现流量报文字段的显式规则;
[0029]深度学习网络模块,用于将流量报文输入至深度学习网络,得到深度学习网络识别结果,其中,所述深度学习网络用于挖掘流量报文特征之间的隐式关系和高阶特征;
[0030]流量报文识别模块,用于将所述应用指纹网络识别结果和所述深度学习网络识别结果进行加权合并,得到流量报文的识别结果。
[0031]根据本专利技术的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
[0032]所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述流量报文的识别方法对应的操作。
[0033]根据本专利技术的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述流量报文的识别方法对应的操作。
[0034]根据本专利技术提供的方案,根据应用指纹网络对流量报文进行识别,得到应用指纹网络识别结果,其中,应用指纹网络用于发现流量报文字段的显式规则;将流量报文输入至深度学习网络,得到深度学习网络识别结果,其中,深度学习网络用于挖掘流量报文特征之间的隐式关系和高阶特征;将应用指纹网络识别结果和所述深度学习网络识别结果进行加权合并,得到流量报文的识别结果。本专利技术通过应用指纹网络发现报文字段显式的规则以增强模型的记忆能力,同时,通过深度学习网络挖掘特征之间隐式的关系和高阶特征以增强模型的泛化能力,提升了模型的表达能力和系统的泛化性能。
[0035]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0036]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0037]图1示出了本专利技术实施例的流量报文的识别方法的流程示意图;
[0038]图2示出了本专利技术另一个实施例的流量报文的识别方法的流程示意图;
[0039]图3示出了本专利技术实施例的流量报文的识别方法的模型结构示意图;
[0040]图4示出了本专利技术实施例的流量报文的识别装置的结构示意图;
[0041]图5示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种流量报文的识别方法,其特征在于,所述方法包括:根据应用指纹网络对流量报文进行识别,得到应用指纹网络识别结果,其中,所述应用指纹网络用于发现流量报文字段的显式规则;将流量报文输入至深度学习网络,得到深度学习网络识别结果,其中,所述深度学习网络用于挖掘流量报文特征之间的隐式关系和高阶特征;将所述应用指纹网络识别结果和所述深度学习网络识别结果进行加权合并,得到流量报文的识别结果。2.根据权利要求1所述的方法,其特征在于,所述流量报文字段包含如下字段中的至少一者:加密报文中的SNI字段;非加密报文中的UA字段、Host字段、Refer_URI字段。3.根据权利要求2所述的方法,其特征在于,所述根据应用指纹网络对流量报文进行识别,得到应用指纹网络识别结果进一步包括:判断所述流量报文是否为加密报文;若是,则提取所述流量报文的SNI字段,根据所述SNI字段进行识别;若否,则提取所述流量报文的UA字段,根据所述UA字段进行识别;若判断未成功,则提取所述流量报文的Host字段和/或Refer_URI字段,根据所述Host字段和/或Refer_URI字段进行识别。4.根据权利要求1所述的方法,其特征在于,所述将流量报文输入至深度学习网络,得到深度学习网络识别结果进一步包括:对流量报文进行特征抽取,得到流量报文特征;所述流量报文特征包括如下特征中一项或多项:服务器IP和端口、UA字段、HOST字段、URI字段、Refer_URI字段、SNI字段、反编译文件中的域字段。5.根据权利要求4所述的方法,其特征在于,在所述得到流量报文特征之后,所述方法还包括:根据预设阈值对流量报文特征对应的序列表征向量进行掩膜处理。6.根据权利要求1所述的方法,其特征在于,所述方法还包括...

【专利技术属性】
技术研发人员:胡泽远蒋健李海传罗琼
申请(专利权)人:中国移动浙江创新研究院有限公司中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1