流量过滤方法及装置制造方法及图纸

技术编号:15695197 阅读:260 留言:0更新日期:2017-06-24 10:36
本申请提供一种流量过滤方法及装置,该方法应用于用户上网行为分析设备,可包括:抓取目标网络流量;基于目标协议类型对所述目标网络流量进行报文格式解析,获取该目标网络流量中携带的与文件格式相关联的内容关键字;将所述内容关键字与预设关键字进行匹配,如果所述内容关键字匹配所述预设关键字,过滤并保存携带有所述内容关键字的目标网络流量。使用本申请提供的方法,可有效地提高用户上网行为的分析效率。

【技术实现步骤摘要】
流量过滤方法及装置
本申请涉及计算机通信领域,尤其涉及一种流量过滤技术。
技术介绍
随着互联网的快速发展,各种基于互联网的应用的不断涌现,为了更好地运营网络,为用户提供更好的体验,很有必要分析用户的上网行为。然而,在对用户的上网行为进行分析的过程中,由于用户上网行为分析设备抓取的目标网络流量中包含了大量地干扰流量,因此如何有效地去除干扰流量,提高用户上网行为的效率就成为亟待解决的问题。
技术实现思路
有鉴于此,本申请提供一种流量过滤方法及装置,用以提高用户上网行为的分析效率。具体地,本申请是通过如下技术方案实现的:根据本申请的第一方面,提供一种流量过滤方法,所述方法应用于用户上网行为分析设备,所述方法包括:抓取目标网络流量;基于目标协议类型对所述目标网络流量进行报文格式解析,获取该目标网络流量中携带的与文件格式相关联的内容关键字;将所述内容关键字与预设关键字进行匹配,如果所述内容关键字匹配所述预设关键字,过滤并保存携带有所述内容关键字的目标网络流量。可选的,所述基于目标协议类型对所述目标网络流量进行报文格式解析,获取该目标网络流量中携带的与文件格式相关联的内容关键字,包括:基于目标协议类型,解析所述目标网络流量的请求报文的报文头,获取该请求报文的报文头中携带的与文件格式相关联的内容关键字;如果未在所述请求报文的报文头中获取到所述内容关键字,则基于目标协议类型,解析所述目标网络流量的响应报文的报文头,获取该响应报文的报文头中携带的与文件格式相关联的内容关键字;如果未在所述响应报文的报文头中获取到所述内容关键字,则基于目标协议类型,解析所述目标网络流量的响应报文负载,获取所述响应报文负载中携带的与文件格式相关联的内容关键字。可选的,所述方法还包括:获取用户输入的扩展协议;在本地储存与该扩展协议对应的协议格式。可选的,所述方法还包括:如果无法基于所述目标协议类型对所述目标网络流量进行解析,则基于所述扩展协议,对所述目标网络流量进行报文格式解析,获取所述目标网络流量携带的内容关键字。可选的,所述请求报文的报文头、所述响应报文的报文头以及所述响应报文负载携带的内容关键字所对应的字段类型不同,所关联的文件格式相同。根据本申请的第二方面,提供一种流量过滤装置,所述装置应用于用户上网行为分析设备,所述装置包括:抓取单元,用于抓取目标网络流量;获取单元,用于基于目标协议类型对所述目标网络流量进行报文格式解析,获取该目标网络流量中携带的与文件格式相关联的内容关键字;过滤单元,用于将所述内容关键字与预设关键字进行匹配,如果所述内容关键字匹配所述预设关键字,过滤并保存携带有所述内容关键字的目标网络流量。可选的,所述获取单元,具体用于基于目标协议类型,解析所述目标网络流量的请求报文的报文头,获取该请求报文的报文头中携带的与文件格式相关联的内容关键字;如果未在所述请求报文的报文头中获取到所述内容关键字,则基于目标协议类型,解析所述目标网络流量的响应报文的报文头,获取该响应报文的报文头中携带的与文件格式相关联的内容关键字;如果未在所述响应报文的报文头中获取到所述内容关键字,则基于目标协议类型,解析所述目标网络流量的响应报文负载,获取所述响应报文负载中携带的与文件格式相关联的内容关键字。可选的,所述装置还包括:导入单元,用于获取用户输入的扩展协议,并在本地储存与该扩展协议对应的协议格式。可选的,所述装置还包括:扩展单元,用于如果无法基于所述目标协议类型对所述目标网络流量进行解析,则基于所述扩展协议,对所述目标网络流量进行报文格式解析,获取所述目标网络流量携带的内容关键字。可选的,所述请求报文的报文头、所述响应报文的报文头以及所述响应报文负载携带的内容关键字所对应的字段类型不同,所关联的文件格式相同。本申请提出一种流量过滤方法,用户上网行为分析设备可将抓取到的目标网络流量中携带的与文件格式相关联的内容关键字与预设关键字进行匹配,如果所述内容关键字匹配所述预设关键字,则过滤并保存携带有所述内容关键字的目标网络流量。由于用户分析设备可以通过目标网络流量中携带的与文件格式相关联的内容关键字来对抓取的目标网络流量进行过滤,去除干扰流量,获取所需的流量进行用户行为分析,因此,可有效地提高用户行为分析的效率。附图说明图1是本申请一示例性实施例示出的一种流量过滤方法的流程图;图2是本申请一示例性实施例示出的一种流量过滤装置所在设备的硬件结构图;图3是本申请一示例性实施例示出的一种流量过滤装置的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。随着互联网的快速发展,各种基于互联网的应用的不断涌现,为了更好地运营网络,为用户提供更好的体验,很有必要分析用户的上网行为。在相关技术中,用户上网行为分析设备通常可基于预设的抓包工具,如Wireshark抓包工具,抓取目标网络流量,然后再对抓取到的目标网络流量进行分析。然而,在实际应用中,抓取到的目标网络流量中包含了大量的干扰流量,如与服务器交互过程中产生的DNS(DomainNameSystem,域名系统)报文、UDP(UserDatagramProtocol,用户数据报协议)用户数据报文和TCP(TransmissionControlProtocol,传输控制协议)握手控制报文等,在本地产生的干扰报文以及用户获取页面时,产生的辅助报文,如JavaScript报文、Cookie操作报文或者广告嵌入报文等。当用户上网行为分析设备对包含有大量地干扰流量的目标网络流量进行分析时,会大大增加用户上网行为分析的难度,大大降低了数据分析地效率。本申请提出一种流量过滤方法,用户上网行为分析设备可将抓取到的目标网络流量中携带的与文件格式相关联的内容关键字与预设关键字进行匹配,如果所述内容关键字匹配所述预设关键字,则过滤并保存携带有所述内容关键字的目标网络流量。由于用户分析设备可以通过目标网络流量中携带的与文件格式相关联的内容关键字来对抓取的目标网络流量进行过滤,去除干扰流量,获取所需的流量进行用户行为分析,因此,可有效地提高用户行为分析的效率。参见图1,图1是本申请一示例性实施例示出的一种流量过滤方法的流程图。该流量过滤方法可应用于用户上网行为分析设本文档来自技高网...
流量过滤方法及装置

【技术保护点】
一种流量过滤方法,其特征在于,所述方法应用于用户上网行为分析设备,所述方法包括:抓取目标网络流量;基于目标协议类型对所述目标网络流量进行报文格式解析,获取该目标网络流量中携带的与文件格式相关联的内容关键字;将所述内容关键字与预设关键字进行匹配,如果所述内容关键字匹配所述预设关键字,过滤并保存携带有所述内容关键字的目标网络流量。

【技术特征摘要】
1.一种流量过滤方法,其特征在于,所述方法应用于用户上网行为分析设备,所述方法包括:抓取目标网络流量;基于目标协议类型对所述目标网络流量进行报文格式解析,获取该目标网络流量中携带的与文件格式相关联的内容关键字;将所述内容关键字与预设关键字进行匹配,如果所述内容关键字匹配所述预设关键字,过滤并保存携带有所述内容关键字的目标网络流量。2.根据权利要求1所述的方法,其特征在于,所述基于目标协议类型对所述目标网络流量进行报文格式解析,获取该目标网络流量中携带的与文件格式相关联的内容关键字,包括:基于目标协议类型,解析所述目标网络流量的请求报文的报文头,获取该请求报文的报文头中携带的与文件格式相关联的内容关键字;如果未在所述请求报文的报文头中获取到所述内容关键字,则基于目标协议类型,解析所述目标网络流量的响应报文的报文头,获取该响应报文的报文头中携带的与文件格式相关联的内容关键字;如果未在所述响应报文的报文头中获取到所述内容关键字,则基于目标协议类型,解析所述目标网络流量的响应报文负载,获取所述响应报文负载中携带的与文件格式相关联的内容关键字。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取用户输入的扩展协议;在本地储存与该扩展协议对应的协议格式。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:如果无法基于所述目标协议类型对所述目标网络流量进行解析,则基于所述扩展协议,对所述目标网络流量进行报文格式解析,获取所述目标网络流量携带的内容关键字。5.根据权利要求2所述的方法,其特征在于,所述请求报文的报文头、所述响应报文的报文头以及所述响应报文负载携带的内容关键字所对应的字段类型不同,所关联的文...

【专利技术属性】
技术研发人员:黄晓炼
申请(专利权)人:杭州迪普科技股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1