数据流分类方法及装置、模型训练方法及装置制造方法及图纸

技术编号:23628724 阅读:42 留言:0更新日期:2020-03-31 23:55
本申请公开了一种数据流分类方法及装置、模型训练方法及装置,属于通信技术领域。该数据流分类方法包括:获取目标数据流,目标数据流携带有应用层消息;确定目标数据流的目标属性信息,目标属性信息包括:应用层消息中目标头域的特征,目标头域的域名不属于应用层协议定义的头域域名;基于目标属性信息,确定目标数据流的类型。本申请能够通过引入数据包中的目标属性信息基于人工智能(artificial intelligence,AI)模型或者映射关系有效提高目标数据流分类的准确度,可用于对数据流,包括HTTP数据流进行分类。

【技术实现步骤摘要】
数据流分类方法及装置、模型训练方法及装置
本申请涉及通信
,特别涉及一种数据流分类方法及装置、模型训练方法及装置。
技术介绍
网络传输系统包括交换装置,以及与交换装置连接的发送端和接收端。发送端和接收端通过交换装置传输数据流。为了维护网络传输系统的安全与稳定,需要确定发送端和接收端之间传输的数据流的类型。目前交换装置通常通过数据流中携带的应用层消息确定该数据流的类型。但是通过应用层消息确定的数据流的类型的准确度通常较低。
技术实现思路
本申请提供了一种数据流分类方法及装置、模型训练方法及装置,能够提高确定目标数据流的类型的准确度,所述技术方案如下:第一方面,提供了一种数据流分类方法,该方法包括:获取目标数据流,该目标数据流携带有应用层消息。再确定该目标数据流的目标属性信息,该目标属性信息包括:应用层消息中目标头域的特征,该目标头域的域名不属于应用层协议定义的头域域名。该应用层协议包括:域名系统DNS协议、文件传输协议FTP、远程终端TELNET协议、超文本传输协议HTTP的版本1、HTTP的版本2、简单邮件传输本文档来自技高网...

【技术保护点】
1.一种数据流分类方法,其特征在于,所述方法包括:/n获取目标数据流,所述目标数据流携带有应用层消息;/n确定所述目标数据流的目标属性信息,所述目标属性信息包括:所述应用层消息中目标头域的特征,所述目标头域的域名不属于应用层协议定义的头域域名,所述应用层协议包括:域名系统DNS协议、文件传输协议FTP、远程终端TELNET协议、超文本传输协议HTTP的版本1、HTTP的版本2、简单邮件传输协议SMTP、邮局协议POP的版本1、POP的版本2、POP的版本3、安全外壳协议SSH的版本1.x以及SSH的版本2.x中的任一种,x为大于或等于0的整数;/n基于所述目标属性信息,确定所述目标数据流的类型...

【技术特征摘要】
1.一种数据流分类方法,其特征在于,所述方法包括:
获取目标数据流,所述目标数据流携带有应用层消息;
确定所述目标数据流的目标属性信息,所述目标属性信息包括:所述应用层消息中目标头域的特征,所述目标头域的域名不属于应用层协议定义的头域域名,所述应用层协议包括:域名系统DNS协议、文件传输协议FTP、远程终端TELNET协议、超文本传输协议HTTP的版本1、HTTP的版本2、简单邮件传输协议SMTP、邮局协议POP的版本1、POP的版本2、POP的版本3、安全外壳协议SSH的版本1.x以及SSH的版本2.x中的任一种,x为大于或等于0的整数;
基于所述目标属性信息,确定所述目标数据流的类型。


2.根据权利要求1所述的方法,其特征在于,所述基于所述目标属性信息,确定所述目标数据流的类型,包括:
基于数据流类型与属性信息的一一对应关系,将所述目标属性信息对应的数据流类型确定为所述目标数据流的类型。


3.根据权利要求1所述的方法,其特征在于,所述基于所述目标属性信息,确定所述目标数据流的类型,包括:
将所述目标属性信息输入数据流分类模型,得到所述数据流分类模型输出的所述目标数据流的类型,所述数据流分类模型用于基于所述目标属性信息输出所述目标数据流的类型。


4.根据权利要求1至3任一所述的方法,其特征在于,所述获取目标数据流,包括:
获取第一发送端和第一接收端之间传输的初始数据流,所述初始数据流包括K个数据分组;
将所述K个数据分组中的N个数据分组,确定为所述目标数据流,其中,1<N<K。


5.根据权利要求4所述的方法,其特征在于,所述初始数据流包括所述第一发送端和第一接收端之间传输的连续的所述K个数据分组,所述N个数据分组为所述K个数据分组中连续的N个数据分组。


6.根据权利要求1至5任一所述的方法,其特征在于,所述目标数据流在第一发送端和第一接收端之间传输,所述目标属性信息还包括以下一种或多种:
所述目标数据流中数据分组的字节数的特征;
所述目标数据流中所述第一发送端发送的数据分组的字节数之和的特征;
所述目标数据流中所述第一接收端发送的数据分组的字节数之和的特征;
所述目标数据流中所述第一发送端发送的数据分组的数量的特征;
所述目标数据流中所述第一接收端发送的数据分组的数量的特征。


7.根据权利要求1至6任一所述的方法,其特征在于,所述目标属性信息还包括:至少一个第一分组单元的间隔的特征,所述第一分组单元包括:所述目标数据流中的两个数据分组,所述第一分组单元的间隔为:所述第一分组单元中两个数据分组的时间的间隔。


8.根据权利要求7所述的方法,其特征在于,所述至少一个第一分组单元的间隔的特征与缩放处理后的所述至少一个第一分组单元的间隔相关,其中,缩放处理后的任一第一分组单元的间隔相关于:所述任一第一分组单元的间隔在所述至少一个第一分组单元的间隔之和中的占比。


9.根据权利要求1至8任一所述的方法,其特征在于,所述目标属性信息还包括:所述应用层消息中请求行、响应行、消息体和/或辅助头域的特征,所述应用层消息中辅助头域的域名属于所述应用层协议定义的头域域名。


10.一种模型训练方法,其特征在于,所述方法包括:
获取多个训练样本,其中,所述训练样本包括:数据流的目标属性信息和数据流类型;所述目标属性信息包括:所述数据流携带的应用层消息中目标头域的特征,所述目标头域的域名不属于应用层协议定义的头域域名,所述应用层协议包括:域名系统DNS协议、文件传输协议FTP、远程终端TELNET协议、超文本传输协议HTTP的版本1、HTTP的版本2、简单邮件传输协议SMTP、邮局协议POP的版本1、POP的版本2、POP的版本3、安全外壳协议SSH的版本1.x以及SSH的版本2.x中的任一种,x为大于或等于0的整数;
基于所述多个训练样本对所述分类模型进行训练,得到数据流分类模型。


11.根据权利要求10所述的方法,其特征在于,所述数据流包括:K个数据分组中的N个数据分组,其中,1<N<K,所述数据流在第二发送端和第二接收端之间传输,所述K个数据分组属于所述第二发送端和所述第二接收端之间传输的初始数据流。


12.根据权利要求10或11所述的方法,其特征在于,所述数据流在第二发送端和第二接收端之间传输,所述目标属性信息还包括以下一种或多种:
所述数据流中数据分组的字节数的特征;
所述数据流中所述第二发送端发送的数据分组的字节数之和的特征;
所述数据流中所述第二接收端发送的数据分组的字节数之和的特征;
所述数据流中所述第二发送端发送的数据分组的数量的特征;
所述数据流中所述第二接收端发送的数据分组的数量的特征。


13.根据权利要求10至12任一所述的方法,其特征在于,所述目标属性信息还包括:至少一个第一分组单元的间隔的特征,所述第一分组单元包括:所述数据流中的两个数据分组,所述第一分组单元的间隔为:所述第一分组单元中两个数据分组的时间的间隔。


14.根据权利要求10至13任一所述的方法,其特征在于,所述目标属性信息还包括:所述应用层消息中请求行、响应行、消息体和/或辅助头域的特征,所述应用层消息中辅助头域的域名属于所述应用层协议定义的头域域名。


15.一种数据流分类装置,其特征在于,所述数据流分类装置包括:
第一获取模块,用于获取目标数据流,所述目标数据流携带有应用层消息;
第一确定模块,用于确定所述目...

【专利技术属性】
技术研发人员:谭帅帅
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1