System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及信息安全,尤其涉及一种加密流量样本数据生成方法、装置、电子设备及存储介质。
技术介绍
1、随着互联网应用技术的发展,各类互联网应用数据流量加密情况已十分普遍,数据加密技术虽然可以保护数据安全,但是对于流量中异常流量的发现变得愈加困难,如加密的网络网络攻击流量,加密的非法vpn(virtual private network,虚拟专用网络)传输通道,暗网数据流量等等。
2、目前对于攻击流量、加密非法vpn通道、暗网数据等异常流量的检测大部分依赖流量特征。比如基于流量的特定位置的特征字、浮动位置的特征字、流量的ip(internetprotocol,网际互连协议)和端口表征等方法进行检测。然而,依赖流量特征对于采用加密后的异常流量的识别效果较差,对于强隐蔽流量如vpn代理其数据流量很难通过已有方式进行识别发现。
3、流量数据作为不规则类型数据,在机器学习过程中存在网络输入不固定导致无法进行学习的问题。因此,如何有效对输入流量数据进行处理使流量数据可以用于深度学习,以及使深度学习网络更有效地学习数据特征,从而提高对加密异常流量的识别效果是目前亟待解决的问题。
技术实现思路
1、本专利技术提供一种加密流量样本数据生成方法、装置、电子设备及存储介质,用以解决现有技术中不易识别网络流量中的异常流量以及流量数据在机器学习过程中由于网络输入不固定无法进行学习的缺陷,实现对大量数据流量样本的自动化处理,有利于提高样本数据生成的准确率和效率,可以有效提升深度学习网
2、本专利技术提供一种加密流量样本数据生成方法,包括:
3、获取加密数据流量,对所述加密数据流量进行目标处理操作;所述目标处理操作包括流分割、过滤和数据对齐中的至少一种;
4、根据特征标记值对处理后的数据中的目标数据进行拼接处理,得到加密流量样本数据,以对深度学习网络进行训练。
5、根据本专利技术提供的一种加密流量样本数据生成方法,所述根据特征标记值对处理后的数据中的目标数据进行拼接处理,得到加密流量样本数据,以对深度学习网络进行训练,包括:
6、在同一数据流方向的两条数据之间拼接第一特征标记值;
7、在不同数据流方向的两条数据之间拼接第二特征标记值;
8、其中,所述第一特征标记值与所述第二特征标记值不同,包含所述第一特征标记值和所述第二特征标记值的拼接数据用于区分不同方向数据流特征。
9、根据本专利技术提供的一种加密流量样本数据生成方法,所述获取加密数据流量,对所述加密数据流量进行目标处理操作,包括:
10、采集网络数据流量中的加密数据流量,将所述加密数据流量按照五元组数据流进行流分割处理;
11、从流分割得到的数据流量包中,确定用于机器学习分类的应用数据流量包;
12、对所述应用数据流量包进行数据对齐。
13、根据本专利技术提供的一种加密流量样本数据生成方法,所述采集网络数据流量中的加密数据流量,将所述加密数据流量按照五元组数据流进行流分割处理,包括:
14、采集网络数据流量中的加密数据流量,输出原始数据流量包;
15、根据数据传输五元组,对所述原始数据流量包进行拆分,得到多个以流特征、流id命名的数据流量包。
16、根据本专利技术提供的一种加密流量样本数据生成方法,所述从流分割得到的数据流量包中,确定用于机器学习分类的应用数据流量包,包括:
17、对流分割得到的数据流量包进行过滤,得到目标应用数据流量包和非目标应用数据流量包;
18、将所述目标应用数据流量包放置于同一目录,并将目录名定义为目标应用名称以作为正样本数据标签,得到初始正样本数据;
19、针对所述非目标应用数据流量包,任意指定负样本数据标签,得到初始负样本数据。
20、根据本专利技术提供的一种加密流量样本数据生成方法,所述对流分割得到的数据流量包进行过滤,得到目标应用数据流量包和非目标应用数据流量包,包括:
21、根据预设筛选规则,对流分割得到的数据流量包进行过滤筛选;
22、将满足所述预设筛选条件的数据流量包作为目标应用数据流量包,将不满足所述预设筛选条件的数据流量包作为非目标应用数据流量包。
23、根据本专利技术提供的一种加密流量样本数据生成方法,所述对过滤得到的数据流量包进行数据对齐,包括:
24、读取应用层载荷数据;
25、从每个数据流选取上行与下行目标位置和目标数量的数据包作为样本数据;
26、在单个数据帧的数据长度小于目标字节时,将所述数据帧的数据长度填充至所述目标字节。
27、本专利技术还提供一种加密流量样本数据生成装置,包括:
28、处理模块,用于获取加密数据流量,对所述加密数据流量进行目标处理操作;所述目标处理操作包括流分割、过滤和数据对齐中的至少一种;
29、拼接模块,用于根据特征标记值对处理后的数据中的目标数据进行拼接处理,得到加密流量样本数据,以对深度学习网络进行训练。
30、本专利技术还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一项所述的加密流量样本数据生成方法的步骤。
31、本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的加密流量样本数据生成方法的步骤。
32、本专利技术提供的加密流量样本数据生成方法、装置、电子设备及存储介质,通过获取加密数据流量进行流分割、过滤和数据对齐等处理操作,可以对大量数据流量样本实现自动化处理,将不规则类型的原始流量数据处理成可以用于进行深度学习的流量数据,从而快速地对需要处理的大量数据流量形成样本数据,有利于提高样本数据生成的准确率和效率;通过特征标记值对预处理后的目标数据进行拼接处理,得到加密流量样本数据以对深度学习网络进行训练,经过特征值拼接处理的样本数据可以有效提升深度学习网络对加密数据流量特征的学习,进而提高对加密异常流量的识别效果。
本文档来自技高网...【技术保护点】
1.一种加密流量样本数据生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据特征标记值对处理后的数据中的目标数据进行拼接处理,得到加密流量样本数据,以对深度学习网络进行训练,包括:
3.根据权利要求1所述的方法,其特征在于,所述获取加密数据流量,对所述加密数据流量进行目标处理操作,包括:
4.根据权利要求3所述的方法,其特征在于,所述采集网络数据流量中的加密数据流量,将所述加密数据流量按照五元组数据流进行流分割处理,包括:
5.根据权利要求3所述的方法,其特征在于,所述从流分割得到的数据流量包中,确定用于机器学习分类的应用数据流量包,包括:
6.根据权利要求5所述的方法,其特征在于,所述对流分割得到的数据流量包进行过滤,得到目标应用数据流量包和非目标应用数据流量包,包括:
7.根据权利要求3所述的方法,其特征在于,所述对过滤得到的数据流量包进行数据对齐,包括:
8.一种加密流量样本数据生成装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的加密流量样本数据生成方法。
...【技术特征摘要】
1.一种加密流量样本数据生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据特征标记值对处理后的数据中的目标数据进行拼接处理,得到加密流量样本数据,以对深度学习网络进行训练,包括:
3.根据权利要求1所述的方法,其特征在于,所述获取加密数据流量,对所述加密数据流量进行目标处理操作,包括:
4.根据权利要求3所述的方法,其特征在于,所述采集网络数据流量中的加密数据流量,将所述加密数据流量按照五元组数据流进行流分割处理,包括:
5.根据权利要求3所述的方法,其特征在于,所述从流分割得到的数据流量包中,确定用于机器学习分类的应用数据流量包,包括:
6.根据权利要求5...
【专利技术属性】
技术研发人员:保永武,蒋涛,
申请(专利权)人:武汉虹旭信息技术有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。