一种应用于宽带接入网的业务识别方法技术

技术编号:14027722 阅读:69 留言:0更新日期:2016-11-19 12:19
本发明专利技术公开了一种应用于宽带接入网的业务识别方法,从宽带接入网不同业务的若干数据帧中筛选得到TCP和UDP协议对应的数据帧,根据五元组数据对数据帧进行业务流划分,建立业务流流池群,每个业务流流池群包括上行业务流流池和下行业务流流池,对每个业务流流池添加业务类别标签,然后构建集成卷积神经网络,包括上行一维卷积神经网络、下行一维卷积神经网络、交互一维卷积神经网络和仲裁模块,采用业务流流池群对三个一维卷积神经网络进行分别训练;在宽带接入网实际运行时,对捕获的数据帧标准化为业务流数据包,输入卷积神经网络,得到业务识别结果。本发明专利技术通过引入深度学习中的卷积神经网络算法,实现细粒度、高精度的业务识别。

【技术实现步骤摘要】

本专利技术属于宽带接入网
,更为具体地讲,涉及一种应用于宽带接入网的业务识别方法
技术介绍
随着宽带接入网技术的不断发展,宽带光纤接入网技术以其可用带宽大、信号质量好、支持宽带业务等优势成为目前的热门技术之一。其中PON(Passive Optical Network,无源光网络)技术因拓扑结构简单,维护费用低等特点成为当今接入网技术的主流。PON接入网技术由于带宽升级的压力,其网络设备的处理能力在短短的几年内,从1Gbps、2.5Gbps发展到了现今的10Gbps,甚至在今后几年有向40Gbps和100Gbps发展的趋势。据中国互联网信息中心2015年的报告“第36次中国互联网发展状况调查报告[R].中国:CNNIC,2015.”显示,截至2015年6月,中国网民规模达6.68亿且互联网为用户提供的业务不断丰富,除了传统的电话、网页浏览、电子邮件等业务外还有一系列高速率、高质量业务如VoIP业务、即时通信类业务、P2P(Peer-to-Peer,点对点技术)业务、流媒体业务、网络游戏业务、网上购物、电子商务等。而以P2P下载为代表的新业务流量已经占据了整个互联网流量的70%以上,P2P业务以及各种各样的视频类业务占据了大量的带宽。在论文“田辉,徐鹏.业务识别与控制技术及标准化进展[J].电信网技术,2007,(3):12-15”中总结了已有业务识别与控制的技术原理和缺陷,并介绍了国内外的标准化及产业推动状况。从不同应用角色看,政府、运营商、企业以及家庭用户对网络的业务控制能力提出了各自的要求:(1)从监管者角度来说,要求网络具备不良信息的识别和控制的能力,尤其是对反动、色情、赌博、暴力等不良信息的过滤。(2)从运营商角度来说,要求网络能够精细化运营,提供差异化的服务能力,尤其是有效遏制不良流量对网络的影响,保障电信级业务的服务质量。(3)从企业用户角度来说,要求网络具备识别特定业务信息,并按照企业利益对信息进行处理的能力,整合复杂的IT防范设备,使得企业专注与核心业务。(4)从家庭用户来说,结合健康上网的需求,要求网络具备个性化业务控制功能,尤其是对不良网站的屏蔽和网络游戏沉洒的防止。所以,在宽带接入网中加入业务识别具有重要意义,在论文“陈卫,任斌,赖树明.10G EPON宽带接入网中业务识别的设计和实现[J].光通信技术,2012,6(12):16-18”和“庄稼.支持深度业务识别的10G EPON系统设计与核心模块的FPGA设计实现[D].北京:北京邮电大学,2014.”这两篇论文中讨论了业务识别在10G EPON宽带接入网中的硬件实现。然而,传统的DPI(深度包检测,Deep Packet Inspection)业务识别技术,主要依靠前期对业务的特征字段的手工提取,才能维持准确率,虽然该方法有效,但前期的准备工作和后期的更新维护太过于费时费力。随后兴起的DFI(深度流检测,Deep Flow Inspection)业务识别技术,依靠大量提取的流特征来进一步筛选,使用传统的机器学习分类算法,大量的论文和实验证明了方法的有效性,但这种依靠经验的流特征选取方法可能会没有提取到或者丢掉不少关键特征,使得它的适应性和可移植性大打折扣,而且其分类的精细度还太过于粗颗粒,难以适应精细化的识别场景。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种应用于宽带接入网的业务识别方法,引入深度学习中的卷积神经网络算法,实现细粒度、高精度业务识别。为实现上述专利技术目的,本专利技术应用于宽带接入网的业务识别方法包括以下步骤:S1:从宽带接入网不同业务的若干数据帧中筛选得到TCP和UDP协议对应的数据帧;S2:对步骤S1筛选得到的所有数据帧,从每个数据帧中提出得到源IP地址、目的IP地址、协议类型、源端口、目的端口,构建该数据帧对应的五元组数据;S3:根据五元组数据对数据帧进行业务流划分,建立业务流流池群,其具体方法为:依次提取出数据帧,如果该数据帧为上行数据帧,则将其五元组数据与每个业务流流池中上行业务流流池的五元组数据进行匹配,如果与某个上行业务流流池的五元组数据相同,则将该数据帧划入对应的上行业务流流池中,如果所有上行业务流流池的五元组数据都不同,则新建一个业务流流池,将该数据帧划入新建业务流流池的上行业务流流池中;如果该数据帧为下行数据帧,则将其五元组数据与每个业务流流池中下行业务流流池的五元组数据进行匹配,如果与某个下行业务流流池的五元组数据相同,则将该数据帧划入对应的下行业务流流池中,如果所有下行业务流流池的五元组数据都不同,则新建一个业务流流池,将该数据帧划入新建业务流流池的下行业务流流池中;S4:对于业务流流池群中每个业务流流池中的每个数据帧,提取得到其IP数据包,如果该数据包字节数小于A,在数据包末尾添零至字节数A,替换原有数据帧,否则直接以该数据包替换原有数据帧;其中A大于等于IP数据包的最大长度;S5:对业务流流池群中的每个业务流流池添加业务类别标签;S6:构建集成卷积神经网络,包括上行一维卷积神经网络、下行一维卷积神经网络、交互一维卷积神经网络和仲裁模块,其中上行一维卷积神经网络用于对上行业务流数据包进行业务识别,下行一维卷积神经网络用于对下行业务流数据包进行业务识别,交互一维卷积神经网络用于上行、下行业务流数据包进行业务识别,仲裁模块对三个一维卷积神经网络的识别结果进行联合仲裁;每个一维卷积神经网络中,其输入层包括A个神经元,输入层、每级隐层的特征图和核均为一维结构;S7:采用业务流流池群对集成卷积神经网络中的三个一维卷积神经网络进行分别训练,其中上行一维卷积神经网络的训练输入为业务流流池群中的每条上行业务流数据包,其期望输出为对应的业务类别标签;下行一维卷积神经网络的训练输入为业务流流池群中的每条下行业务流数据包,其期望输出为对应的业务类别标签;交互一维卷积神经网络的训练输入为业务流流池群中的每条上行业务流数据包和下行业务流数据包,其期望输出为对应的业务类别标签;S8:在宽带接入网实际运行时,捕获得到一段TCP或UDP业务流数据帧,从该业务流中每个数据帧中提取出数据包,末尾添零至长度为A字节的业务流数据包,将这些业务流数据包划分为上行业务流数据包和下行业务流数据包,输入集成卷积神经网络中的对应一维卷积神经网络,仲裁模块根据三个一维卷积神经网络的业务识别结果综合仲裁得到最终业务识别结果,仲裁方法为:仲裁模块收集三个一维卷积神经网络的识别结果进行联合仲裁,先分别对每个一维卷积神经网络的识别结果进行统计,选择每个一维卷积神经网络中数量占该一维卷积神经网络所有识别结果数量的百分比最大的识别结果作为该一维卷积神经网络的有效识别结果;在三个有效识别结果中,如果任意两个一维卷积神经网络的有效识别结果一致时,将此有效识别结果作为最终的识别结果,否则选择百分比最大的有效识别结果作为最终的识别结果。本专利技术应用于宽带接入网的业务识别方法,从宽带接入网不同业务的若干数据帧中筛选得到TCP和UDP协议对应的数据帧,根据五元组数据对数据帧进行业务流划分,建立业务流流池群,每个业务流流池群包括上行业务流流池和下行业务流流池,对每个业务流流池添加业务类别标签,然后构建集成卷积神经网络,包括上行一维卷积神经本文档来自技高网
...
一种应用于宽带接入网的业务识别方法

【技术保护点】
一种应用于宽带接入网的业务识别方法,其特征在于,包括以下步骤:S1:从宽带接入网不同业务的若干数据帧中筛选得到TCP和UDP协议对应的数据帧;S2:对步骤S1筛选得到的所有数据帧,从每个数据帧中提出得到源IP地址、目的IP地址、协议类型、源端口、目的端口,构建该数据帧对应的五元组数据;S3:根据五元组数据对数据帧进行业务流划分,建立业务流流池群,其具体方法为:依次提取出数据帧,如果该数据帧为上行数据帧,则将其五元组数据与每个业务流流池中上行业务流流池的五元组数据进行匹配,如果与某个上行业务流流池的五元组数据相同,则将该数据帧划入对应的上行业务流流池中,如果所有上行业务流流池的五元组数据都不同,则新建一个业务流流池,将该数据帧划入新建业务流流池的上行业务流流池中;如果该数据帧为下行数据帧,则将其五元组数据与每个业务流流池中下行业务流流池的五元组数据进行匹配,如果与某个下行业务流流池的五元组数据相同,则将该数据帧划入对应的下行业务流流池中,如果所有下行业务流流池的五元组数据都不同,则新建一个业务流流池,将该数据帧划入新建业务流流池的下行业务流流池中;S4:对于业务流流池群中每个业务流流池中的每个数据帧,提取得到其IP数据包,如果该数据包字节数小于A,在数据包末尾添零至字节数A,替换原有数据帧,否则直接以该数据包替换原有数据帧;其中A大于等于IP数据包的最大长度;S5:对业务流流池群中的每个业务流流池添加业务类别标签;S6:构建集成卷积神经网络,包括上行一维卷积神经网络、下行一维卷积神经网络、交互一维卷积神经网络和仲裁模块,其中上行一维卷积神经网络用于对上行业务流数据包进行业务识别,下行一维卷积神经网络用于对下行业务流数据包进行业务识别,交互一维卷积神经网络用于上行、下行业务流数据包进行业务识别,仲裁模块对三个一维卷积神经网络的识别结果进行联合仲裁;每个一维卷积神经网络中,其输入层包括A个神经元,输入层、每级隐层的特征图和核均为一维结构;S7:采用业务流流池群对集成卷积神经网络中的三个一维卷积神经网络进行分别训练,其中上行一维卷积神经网络的训练输入为业务流流池群中的每条上行业务流数据包,其期望输出为对应的业务类别标签;下行一维卷积神经网络的训练输入为业务流流池群中的每条下行业务流数据包,其期望输出为对应的业务类别标签;交互一维卷积神经网络的训练输入为业务流流池群中的每条上行业务流数据包和下行业务流数据包,其期望输出为对应的业务类别标签;S8:在宽带接入网实际运行时,捕获得到一段TCP或UDP业务流数据帧,从该业务流中每个数据帧中提取出数据包,末尾添零至长度为A字节的业务流数据包,将这些业务流数据包划分为上行业务流数据包和下行业务流数据包,输入集成卷积神经网络中的对应一维卷积神经网络,仲裁模块根据三个一维卷积神经网络的业务识别结果综合仲裁得到最终业务识别结果,仲裁方法为:仲裁模块收集三个一维卷积神经网络的识别结果进行联合仲裁,先分别对每个一维卷积神经网络的识别结果进行统计,选择每个一维卷积神经网络中数量占该一维卷积神经网络所有识别结果数量的百分比最大的识别结果作为该一维卷积神经网络的有效识别结果;在三个有效识别结果中,如果任意两个一维卷积神经网络的有效识别结果一致时,将此有效识别结果作为最终的识别结果,否则选择百分比最大的有效识别结果作为最终的识别结果。...

【技术特征摘要】
1.一种应用于宽带接入网的业务识别方法,其特征在于,包括以下步骤:S1:从宽带接入网不同业务的若干数据帧中筛选得到TCP和UDP协议对应的数据帧;S2:对步骤S1筛选得到的所有数据帧,从每个数据帧中提出得到源IP地址、目的IP地址、协议类型、源端口、目的端口,构建该数据帧对应的五元组数据;S3:根据五元组数据对数据帧进行业务流划分,建立业务流流池群,其具体方法为:依次提取出数据帧,如果该数据帧为上行数据帧,则将其五元组数据与每个业务流流池中上行业务流流池的五元组数据进行匹配,如果与某个上行业务流流池的五元组数据相同,则将该数据帧划入对应的上行业务流流池中,如果所有上行业务流流池的五元组数据都不同,则新建一个业务流流池,将该数据帧划入新建业务流流池的上行业务流流池中;如果该数据帧为下行数据帧,则将其五元组数据与每个业务流流池中下行业务流流池的五元组数据进行匹配,如果与某个下行业务流流池的五元组数据相同,则将该数据帧划入对应的下行业务流流池中,如果所有下行业务流流池的五元组数据都不同,则新建一个业务流流池,将该数据帧划入新建业务流流池的下行业务流流池中;S4:对于业务流流池群中每个业务流流池中的每个数据帧,提取得到其IP数据包,如果该数据包字节数小于A,在数据包末尾添零至字节数A,替换原有数据帧,否则直接以该数据包替换原有数据帧;其中A大于等于IP数据包的最大长度;S5:对业务流流池群中的每个业务流流池添加业务类别标签;S6:构建集成卷积神经网络,包括上行一维卷积神经网络、下行一维卷积神经网络、交互一维卷积神经网络和仲裁模块,其中上行一维卷积神经网络用于对上行业务流数据包进行业务识别,下行一维卷积神经网络用于对下行业务流数据包进行业务识别,交互一...

【专利技术属性】
技术研发人员:张崇富钟轶文尹海明邱昆
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1