一种基于连续TCP链接的业务分类方法和装置制造方法及图纸

技术编号:24862701 阅读:41 留言:0更新日期:2020-07-10 19:13
本发明专利技术涉及图像处理技术,尤其涉及一种基于连续TCP链接的业务分类方法和装置,用于对业务类型进行识别,该方法为:业务处理装置确定TCP链接集合,并分别将每一个TCP链接上承载的目标数据流切割成若干流量块,然后对各个TCP链接进行排序,并根据N个连续的任意一个流量块,生成相应的目标流量图像,最后,通过业务类型识别模型确定所述目标业务的业务类型。这样,业务处理装置可以通过业务类型识别模型对目标业务进行分类,提高业务类型识别模型训练的自主性,降低网络设备的开销,并且,利用了同一目标业务下不同TCP链接的关联关系,保证业务分类结果的准确度,提高业务类型识别的精确度和有效性。

【技术实现步骤摘要】
一种基于连续TCP链接的业务分类方法和装置
本专利技术涉及图像处理技术,尤其涉及一种基于连续TCP链接的业务分类方法和装置。
技术介绍
目前,网络流量的识别方法主要分为深度包检测(DeepPacketInspection,DPI)和深度流检测(DeepFlowInspection,DFI)两种方式,其中,DPI方式按照不同的网络传输协议深度解析报文内容,获取应用层各个字段内容,将解析到的内容与预先人工分析的“业务应用层特征规则库”进行匹配,从而判定当前流量所对应的业务大类(即时通信、邮箱、门户等)、业务小类(新浪、百度、腾讯等)以及精细化动作(发图片、发消息等)。DFI方式仅解析网络(InternetProtocol,IP)层、传输层的相关特征(如报文数量、包长、时间窗口等),以一条流量为粒度,分析流量的传输规律,从而训练/总结出一个分类模型,可以在一定程度上做到流量的分类。然而,DPI方式有三个弊端:一是当流量采用应用层加密方式后,原有的应用层明文内容变为加密内容,DPI作为网络中间采集设备,根本无法破解,无法进行业务识别和分本文档来自技高网...

【技术保护点】
1.一种基于连续传输控制协议TCP链接的业务分类方法,其特征在于,包括:/n确定用户基于目标业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:/n按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块;/n按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的目标流量图像,其中,N表示连续的TCP链接的数目,N为自然数;/n将获得的各个目标流量图像,采用预设的业务类型识别模型进行业务类型识别,确定所述目标业务的业务类型,...

【技术特征摘要】
1.一种基于连续传输控制协议TCP链接的业务分类方法,其特征在于,包括:
确定用户基于目标业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:
按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块;
按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的目标流量图像,其中,N表示连续的TCP链接的数目,N为自然数;
将获得的各个目标流量图像,采用预设的业务类型识别模型进行业务类型识别,确定所述目标业务的业务类型,所述业务类型识别模型是基于样本业务对应的样本流量图像以及样本业务的业务类型,经训练后获得的。


2.如权利要求1所述的方法,其特征在于,确定用户基于目标业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块之前,进一步包括:
确定用户触发的样本业务和所述样本业务的业务类型,以及确定用户基于样本业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的样本数据流进行切割,获得若干流量块;
按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的样本流量图像;
基于获得的各个样本流量图像和相应的业务类型之间的对应关系,采用卷积神经网络算法进行模型训练,获得相应的业务类型识别模型。


3.如权利要求1或2所述的方法,其特征在于,确定用户基于目标业务与服务器建立的传输控制协议TCP链接集合,包括:
对目标业务触发的多个目标数据流进行监测,并将传输所述多个目标数据流所需的多个TCP链接确定为TCP链接集合。


4.如权利要求1或2所述的方法,其特征在于,按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块,包括:
以TCP链接为粒度,按照预设的数据量单位,或者,按照预设的时长单位,将所述TCP链接上承载的样本数据流切割成若干个流量块。


5.如权利要求1或2所述的方法,其特征在于,根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的目标流量图像,包括:
针对所述N个连续的TCP链接,分别获取每一个TCP链接对应的一个流量块;
针对获得的N个流量块分别执行以下操作:将流量块包含的每一个字节分别映射为一个像素点,获得相应的流量图像;
从所述N个流量块各自对应的所述流量图像中,选取出红、绿、蓝三种颜色通道对应的流量图像,合并生成相应的目标流量图像。


6.一种基于连续传输控制协议TCP链接的业务分类装置,其特征在于,包括:
切割单元,用于确定用户基于目标业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块;
生成单元,用于按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的目标流量图像,其中,N表示连续的TCP链接的数目,N为自然数;

【专利技术属性】
技术研发人员:郭韧倪伟
申请(专利权)人:中国移动通信有限公司研究院中国移动通信集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1