本发明专利技术实施例提供,一种数据流类型检测方法,其包括:获取当前数据流的第一个数据包的报头,并从所述报头中获取所述当前数据流的模式向量;比较所述当前数据流的模式向量中的所述至少一个特征维度以及至少一个历史数据流的模式向量中对应的特征维度,以获取所述当前数据流的至少一个模式相似度;根据所述当前数据流的至少一个模式相似度以及对应的至少一个历史数据流的长度预测当前数据流长度;以及比较预测的所述当前数据流长度及预设的阈值,并根据比较结果判断所述当前数据流为大数据流或者小数据流。本发明专利技术通过检测数据流的第一个数据包的报头即可实现数据流的类型的检测,能够实时判断网络数据流的类型并且能够提高判断的精度。
【技术实现步骤摘要】
【专利摘要】本专利技术实施例提供,一种数据流类型检测方法,其包括:获取当前数据流的第一个数据包的报头,并从所述报头中获取所述当前数据流的模式向量;比较所述当前数据流的模式向量中的所述至少一个特征维度以及至少一个历史数据流的模式向量中对应的特征维度,以获取所述当前数据流的至少一个模式相似度;根据所述当前数据流的至少一个模式相似度以及对应的至少一个历史数据流的长度预测当前数据流长度;以及比较预测的所述当前数据流长度及预设的阈值,并根据比较结果判断所述当前数据流为大数据流或者小数据流。本专利技术通过检测数据流的第一个数据包的报头即可实现数据流的类型的检测,能够实时判断网络数据流的类型并且能够提高判断的精度。【专利说明】网络数据流类型检测方法及装置
本专利技术实施例涉及网络数据路由领域,并且更具体地,涉及网络数据流类型检测 方法及装置及其应用的网络数据路由方法及装置。
技术介绍
最近研究表明,数据中必网络中,大概90%的数据流属于突发的,持续时间短, 流长度很小的小数据流(small data flow),也称老鼠流(mice flow);而只有10%的数 据流属于持续时间长,流长度巨大的大数据流(large data flow),也称大象流(ele地ant flow)。大象流虽然其数量只占整个网络数据流数目的10 %,然而大象流的流量(比如数 据包数目,或者是数据流字节总数)却占了整个数据中必网络总流量的的90%。由于现 有路由算法(比如Equal Cost Muti-Path, ECM巧多数利用网络的局部信息,对数据流进 行路由转发。因而送些大象流的路径很有可能出现重叠现象,即是不同的大象流使用同 一网络链路。由于网络链路带宽有限,当多个大象流使用同一链路时,就会出现网络拥塞 (congestion)的情况。相反地,一些链路却处于低利用率甚至是闲置状态。网络拥塞的出 现,严重降低了送个网络的运行性能,特别是对于一些对延迟十分敏感的数据流,比如语音 通信等。 解决上述问题的有效方法结合网络的全局状态,为每一个数据流选取最佳路由, 将数据流平均分布到整个网络中,避免网络拥塞,实现网络负载平衡。然而,数据中必的数 据流数目巨大,对每一个待转发的数据流进行路由优化,计算复杂度巨大,其可实行性低。 而我们知道,整个网络有90%的流量来源于大象流并且大象流的数目只占整个网络数据流 总数的10%。如果我们能够为大象流选取最佳路由,就已经可W很好地优化整个数据中必 网络的性能。而针对大象流进行动态路由规划,为其选取最佳路径,要求我们能够将大象 流和老鼠流区分开来。目前存在一些技术手段,可用于区分大象流和老鼠流。比如,周期性 的轮询(periodic polling),送是一种简单直接的辨识大象流的方案。其原理是对有待辨 识的流进行统计,比如当该流的流量超过一定阔值,或者当该流的持续时间超过一定阔值 时,我们就认为该数据流为大象流。然而,由于网络中数据流的数量巨大,如果对每一个数 据流都进行流量统计,其时间和空间开销都是十分巨大的,即判定结果有一定的滞后性,并 且需要很大的缓存空间。此外,在一种改进方案中则根据一些先验知识,对数据流进行初步 筛选,对符合筛选条件的数据流进行流量统计。一般是通过设置流表进行初步筛选,流表一 般包括端口数,或者是IP地址,传输协议。如果一个流的信息与流表的其中某一项匹配,或 者是与流表的所有项目匹配,则该数据流被转发到流量统计模块进行流量统计,若该流的 流量超过一定阔值,送认为是大象流,路由模块则为其选取最佳路径。然而送种方法需要预 先设定阔值,判定结果无法适应动态的网络变化而导致判断结果不精确。
技术实现思路
本专利技术实施例提供一种网络数据流类型检测方法及装置,能够实时判断网络数据 流的类型并且能够提高判断的精度。 第一方面,本专利技术实施例提供,一种数据流类型检测方法,所述方法,包括: 获取当前数据流的第一个数据包的报头,并从所述报头中获取所述当前数据流的 模式向量,所述模式向量包括至少一个特征维度,所述至少一个特征维度选自于包括所述 当前数据流的,源IP地址(Source IP A(Mress),服务器端口(Server化;Tt),目的地IP地 址值estination IP A(Mress),客户端口(Client化的),所述当前数据流发送时间,W及 所述当前数据所使用的传输协议(Protocol)的信息组合; 比较所述当前数据流的模式向量中的所述至少一个特征维度W及至少一个历史 数据流的模式向量中对应的特征维度,W获取所述当前数据流的至少一个模式相似度,所 述当前数据流的至少一个模式相似度与所述至少一个历史数据的模式向量一一对应,所述 历史数据流的模式向量预存在数据库中; 根据所述当前数据流的至少一个模式相似度W及对应的至少一个历史数据流的 长度预测当前数据流长度,所述至少一个历史数据流的长度预存在所述数据库中,且所述 至少一个历史数据流的长度与所述至少一个历史数据流模式向量一一对应;W及 比较预测的所述当前数据流长度及预设的阔值,并根据比较结果判断所述当前数 据流为大数据流或者小数据流。 结合第一方面,在第一方面的第一种可能的实现方式中,所述比较所述当前数据 流的模式向量中的所述至少一个特征维度W及至少一个历史数据流模式向量中对应的特 征维度,W获取所述当前数据流的至少一个模式相似度,包括: 估算所述当前数据流的模式向量中的所述至少一个特征维度与所述至少一个历 史数据流的模式向量中对应的特征维度之间的距离度量; 根据所述距离度量,估算所述当前数据流的模式向量中的所述至少一个特征维度 所对应的特征维度相似度; 根据所述特征维度相似度来获取所述当前数据流的至少一个模式相似度,所述至 少一个模式相似度与所述至少一个历史数据流一一对应。 结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式 中,所述估算所述当前数据流的模式向量中的所述至少一个特征维度与所述至少一个历史 数据流的模式向量中对应的特征维度之间的距离度量,包括: 分别估算所述当前数据流的模式向量中的所述至少一个特征维度与所述至少一 个历史数据流的模式向量中对应的特征维度之间的,IP地址的距离度量,端口的距离度量, 发送时间的距离度量,W及传输协议的距离度量;其中,所述IP的地址的距离度量通过所 述当前数据流的模式向量中的所述源IP地址与所述历史数据流的模式向量中的源IP地址 估算,或者,通过所述当前数据流的模式向量中的所述目的地IP地址与所述历史数据流的 模式向量中的目的地IP地址估算,或者,通过所述当前数据流的模式向量中的所述源IP地 址和所述目的地IP地址与所述历史数据流的模式向量中的源IP地址和目的地IP地址估 算;所述端口的距离度量通过所述当前数据流的模式向量中的所述服务器端口与所述历史 数据流的模式向量中的服务器端口估算,或者通过所述当前数据流的模式向量中的所述客 户端口与所述历史数据流的模式向量中的客户端口估算,或者通过所述当前数据流的模式 向量中的所述服务器端口及所述客户端口与所述历史数据流的模式向量中服务器端口的 客户端口估算;所述发送时间的距离度量通过所述当前数据流的模式向量中的所述当前数本文档来自技高网...
【技术保护点】
一种数据流类型检测方法,其特征在于,所述方法,包括:获取当前数据流的第一个数据包的报头,并从所述报头中获取所述当前数据流的模式向量,所述模式向量包括至少一个特征维度,所述至少一个特征维度选自于包括所述当前数据流的,源IP地址(Source IP Address),服务器端口(Server Port),目的地IP地址(Destination IP Address),客户端口(Client Port),所述当前数据流发送时间,以及所述当前数据所使用的传输协议(Protocol)的信息组合;比较所述当前数据流的模式向量中的所述至少一个特征维度以及至少一个历史数据流的模式向量中对应的特征维度,以获取所述当前数据流的至少一个模式相似度,所述当前数据流的至少一个模式相似度与所述至少一个历史数据的模式向量一一对应,所述历史数据流的模式向量预存在数据库中;根据所述当前数据流的至少一个模式相似度以及对应的至少一个历史数据流的长度预测当前数据流长度,所述至少一个历史数据流的长度预存在所述数据库中,且所述至少一个历史数据流的长度与所述至少一个历史数据流模式向量一一对应;以及比较预测的所述当前数据流长度及预设的阈值,并根据比较结果判断所述当前数据流为大数据流或者小数据流。...
【技术特征摘要】
【专利技术属性】
技术研发人员:陈志堂,耿彦辉,帕斯卡·普帕,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。