非对称路由环境中HTTP上行流量的处理方法及系统技术方案

技术编号：17784185 阅读：46 留言：0更新日期：2018-04-22 15:37

本发明专利技术提出了一种分析因非对称路由环境而产生的单边上行未知流量的方法，具体步骤如下：分析单边HTTP上下流量，并提取服务器端IP，端口，URI等信息，并将这些信息反馈给爬虫模块；使用爬虫模块根据上述反馈的信息构造请求发送到服务器并对服务器返回的页面内容进行解析、提取信息同时对页面内容进行识别，同时将相关信息下发到设备以提高设备的识别结果。本发明专利技术通过将爬虫技术引用到协议识别分析中，解决了在非对称环境下只有HTTP上行流量而没有HTTP下行流量的问题，解决了非对称环境下流量不全导致对应HTTP流量不识别的问题。同时通过爬虫构造相应的请求得到对应的HTTP下行流量，对这些流量进行分析、总结，有利于现网设备流量的识别问题。

全部详细技术资料下载

【技术实现步骤摘要】
非对称路由环境中HTTP上行流量的处理方法及系统
本专利技术涉及网络业务识别
，具体涉及一种非对称路由环境下单边HTTP上行流量的分析。
技术介绍
DPI(DeepPacketInvestigate)深度包检测技术，是一种基于应用层的流量检测技术，当数据流通过基于DPI技术的网络系统时，该系统通过深入读取数据包载荷的内容来对OSI七层协议中的应用层信息进行分析，从而可以识别出用户的访问行为、访问的数据等。理想情况下(对称路由)，用户发送的请求报文和服务器返回给用户的响应报文会走相同的网络路径，也就是说，DPI设备可以同时捕获到用户的上下行流量，获取到完整的报文。这种情况下，非常有利于分析人员及DPI设备去识别出用户的访问行为。随着DPI设备部署的环境越来越复杂，发现非对称环境下(用户请求的报文和服务器响应的报文只有一边流经DPI设备)的流量越来越越多，而只有单边流量会急剧降低DPI设备的分析能力。HTTP(HyperTextTransportProtocol)是超文本传输协议的缩写，它用于传送WWW方式的数据，关于HTTP协议的详细内容请参考RFC2616。HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求，请求头包含请求的方法、URL、协议版本、以及包含请求修饰符、客户信息和内容的类似于MIME的消息结构。服务器以一个状态行作为响应，响应的内容包括消息协议的版本，成功或者错误编码加上包含服务器信息、实体元信息以及可能的实体内容。本方法就是针对这种因非对称路由环境而产生的单向上行的HTTP流量，通过引入爬虫技术，对数据包中服务器的IP、端口...
非对称路由环境中HTTP上行流量的处理方法及系统

【技术保护点】
一种分析因非对称路由环境而产生的单边上行未知流量的方法，其特征在于包括以下步骤：步骤101，提取单边上行HTTP流量中的服务器端IP地址、端口、URI相关信息，步骤102，将步骤101中提到的信息反馈给爬虫模块，步骤103，爬虫模块根据步骤101中提到的信息构造请求报文，并将请求报文发出，等待并接收服务器端的响应报文，步骤104，判断爬虫是否爬取到页面，如果是，则进入步骤205，否则，由于爬取不到页面，无法确定该服务器IP地址、端口信息属于哪个应用的服务器IP地址和端口，步骤结束，步骤205，对这些页面内容进行识别，同时对爬取的页面进行具体的分析，提取相关的信息，步骤206，判断这些页面内容能否识别为某个具体的应用，如果可以，则直接进入步骤208；否则，进入步骤207，步骤207，在http页面不能识别为某个应用时，协议分析人员对爬取的http页面进行分析，以确定该页面所属应用；步骤208，在确定http页面所属具体应用后，将该IP地址及端口信息作为该应用特征更新至设备中；同时爬取页面提取到的信息作为应用特征更新至设备中。

【技术特征摘要】
1.一种分析因非对称路由环境而产生的单边上行未知流量的方法，其特征在于包括以下步骤：步骤101，提取单边上行HTTP流量中的服务器端IP地址、端口、URI相关信息，步骤102，将步骤101中提到的信息反馈给爬虫模块，步骤103，爬虫模块根据步骤101中提到的信息构造请求报文，并将请求报文发出，等待并接收服务器端的响应报文，步骤104，判断爬虫是否爬取到页面，如果是，则进入步骤205，否则，由于爬取不到页面，无法确定该服务器IP地址、端口信息属于哪个应用的服务器IP地址和端口，步骤结束，步骤205，对这些页面内容进行识别，同时对爬取的页面进行具体的分析，提取相关的信息，步骤206，判断这些页面内容能否识别为某个具体的应用，如果可以，则直接进入步骤208；否则，进入步骤207，步骤207，在http页面不能识别为某个应用时，协议分析人员对爬取的http页面进行分析，以确定该页面所属应用；步骤208，在确定http页面所属具体应用后，将该IP地址及端口信息作为该应用特征更新至设备中；同时爬取页面提取到的信息作为应用特征更新至设备中。2.根据权利要求1所述的方法，其特征在于，所述步骤207中不能识别某个应用的情形包括这些页面含有指向某应用的特征，但规则库没有覆盖到该应用，或者虽然覆盖到了该应用，但规则有遗漏。3.根据权利要求2所述的方法，其特征在于，所述步骤207中的分析包括将遗漏的特征规则补充至规则库，或者对gzip响应内容进行解压来确定该页面所属应用。4.根据权利要求1或2或3所述的方法，所述方法适用于Http协议、DNS以及FTP协议。5.一种分析因非对称路由环境而产生的单边上行未知流...

【专利技术属性】
技术研发人员：夏祖转，
申请(专利权)人：武汉绿色网络信息服务有限责任公司，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人