一种快速URL过滤方法及装置制造方法及图纸

技术编号:22504719 阅读:111 留言:0更新日期:2019-11-09 03:23
本申请提供一种快速URL过滤方法及装置,所述方法先通过获取DNS请求报文并提取域名信息;再通过URL过滤特征库匹配域名信息,并且在匹配到所述域名信息后,获取连接IP地址,以及将连接IP地址加入URL过滤资源库中。当要建议TCP连接时,可以通过获取TCP请求的SYN请求包,提取请求IP地址,并在所述URL过滤资源库中匹配所述请求IP地址;如果在所述URL过滤资源库中匹配到所述请求IP地址,阻断所述TCP请求对应的TCP连接。所述方法可以利用DNS内容短,格式简单的特点,减小URL过滤的性能消耗。另外,本申请采用IP地址与TCP协议,能实现首包阻断,减少网络中无用流量的传输,提高网络传输的效率。

A fast URL filtering method and device

The present application provides a fast URL filtering method and device. The method first obtains the DNS request message and extracts the domain name information; then matches the domain name information through the URL filtering feature library, and obtains the connection IP address after matching the domain name information, and adds the connection IP address to the URL filtering resource library. When a TCP connection is proposed, the request IP address can be extracted by obtaining the syn request packet of the TCP request, and the request IP address can be matched in the URL filtering resource library; if the request IP address is matched in the URL filtering resource library, the TCP connection corresponding to the TCP request can be blocked. The method can reduce the performance consumption of URL filtering by taking advantage of the characteristics of short DNS content and simple format. In addition, the application adopts the IP address and TCP protocol, which can realize the first packet blocking, reduce the transmission of useless traffic in the network, and improve the efficiency of network transmission.

【技术实现步骤摘要】
一种快速URL过滤方法及装置
本申请涉及URL过滤
,尤其涉及一种快速URL过滤方法及装置。
技术介绍
URL(UniformResourceLocator,统一资源定位符)是对可以从互联网上得到的资源的位置和访问方法的一种简洁表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,它包含的信息可以指出文件的位置以及浏览器的处理方式。URL过滤技术,应用于对互联网上的网站进行分类,并通过将所有Web流量与URL过滤库进行比较,以及通过引用已经分类的中央数据库或根据分类中包含的信息,来允许或阻止用户对Web进行访问。典型URL过滤方法包括:先识别HTTP流量,再通过解析http协议的报文,获取域名信息;再对域名做hash运算,查找到对应的hash位置;以及遍历hash链(根据URL过滤库生成),比较字符串是否一致,一致则匹配到对应的分类,否则未匹配,最后根据匹配结果选择性的进行阻断。但由于这种URL过滤方法需要对HTTP的协议数据进行识别,并且要从报文内容中解析获取域名,再进行URL过滤库的匹配,导致这种URL过滤方法的过滤性能较低。并且在实际应用中,要在获取匹配结果后才能进行阻断,导致有较多的数据被发送至用户处,造成网络资源浪费,以及可能存在的网络安全隐患。
技术实现思路
本申请提供了一种快速URL过滤方法及装置,以解决URL过滤性能低的问题。一方面,本申请提供一种快速URL过滤方法,包括:获取DNS请求报文,以及从所述DNS请求报文中提取域名信息;在URL过滤特征库中匹配所述域名信息;如果在所述URL过滤特征库中匹配到所述域名信息,获取所述域名信息对应的连接IP地址;将所述连接IP地址加入URL过滤资源库;所述URL过滤资源库包括多个域名信息,以及多个域名信息对应的IP地址;获取TCP请求的SYN请求包,以及从所述SYN请求包中提取请求IP地址;在所述URL过滤资源库中匹配所述请求IP地址;如果在所述URL过滤资源库中匹配到所述请求IP地址,阻断所述TCP请求对应的TCP连接。可选的,获取DNS请求报文,以及从所述DNS请求报文中提取域名信息的步骤,包括:获取DNS请求报文以及当前应用领域下的域名模板;根据所述域名模板,在所述DNS请求报文中匹配符合域名模板形式的文本片段;提取所述文本片段作为所述域名信息。可选的,所述URL过滤特征库包括多个预置域名信息,以及与每个所述预置域名信息对应的分类信息;在URL过滤特征库中匹配所述域名信息的步骤,包括:逐一对比所述域名信息与预置域名信息;如果所述域名信息与任一预置域名信息一致,提取匹配到的所述预置域名信息对应的分类信息;如果所述域名信息与任一预置域名信息均不一致,确定当前域名信息为未知域名;将所述未知域名发送至上位服务器。可选的,如果在URL过滤特征库中匹配到所述域名信息,获取所述域名信息对应的连接IP地址的步骤,包括:获取DNS服务器针对所述DNS请求报文反馈的DNS响应报文;从所述DNS响应报文中,提取所述域名信息对应的连接IP地址。可选的,获取DNS服务器针对所述DNS请求报文反馈的DNS响应报文的步骤前,还包括:提取本地网络中的DNS缓存数据;在所述DNS缓存数据中,匹配所述域名信息;如果在所述DNS缓存数据匹配到所述域名信息,提取所述域名信息对应的连接IP地址;如果在所述DNS缓存数据中未匹配到所述域名信息,获取DNS服务器针对所述DNS请求报文反馈的DNS响应报文。可选的,获取TCP请求的SYN请求包,以及从所述SYN请求包中提取请求IP地址的步骤,包括:在接收到所述SYN请求包后,在目标栏提取请求IP地址;暂停将所述SYN请求包转发至所述请求IP地址对应的服务器。可选的,所述方法还包括:如果在URL过滤资源库中未匹配到所述请求IP地址,将所述SYN请求包转发至所述请求IP地址对应的服务器,以建立TCP连接。可选的,所述方法还包括:获取客户端输入的访问信息;根据所述访问信息判断访问信息类型,所述访问信息类型包括IP地址访问和非IP地址访问;如果所述访问信息类型为非IP地址访问,从所述访问信息中提取请求IP地址;如果所述访问信息类型为IP地址访问,将所述访问信息作为所述请求IP地址。另一方面,本申请还提供一种快速URL过滤装置,包括:域名信息模块,用于获取DNS请求报文,以及从所述DNS请求报文中提取域名信息;特征匹配模块,用于在URL过滤特征库中匹配所述域名信息;连接IP地址模块,用于如果所述在URL过滤特征库中匹配到所述域名信息,获取所述域名信息对应的连接IP地址;学习模块,用于将所述连接IP地址加入URL过滤资源库;所述URL过滤资源库包括多个域名信息,以及多个域名信息对应的IP地址;请求IP地址模块,用于获取TCP请求的SYN请求包,以及从所述SYN请求包中提取请求IP地址;资源匹配模块,用于在所述URL过滤资源库中匹配所述请求IP地址;阻断模块,用于如果在所述URL过滤资源库中匹配到所述请求IP地址,阻断所述TCP请求对应的TCP连接。可选的,所述连接IP地址模块包括:DNS响应报文单元,用于获取DNS服务器针对所述DNS请求报文反馈的DNS响应报文;连接IP地址提取单元,用于从所述DNS响应报文中,提取所述域名信息对应的连接IP地址。由以上技术方案可知,本申请提供一种快速URL过滤方法及装置,所述方法先通过获取DNS请求报文并提取域名信息;再通过URL过滤特征库匹配域名信息,并且在匹配到所述域名信息后,获取连接IP地址,以及将连接IP地址加入URL过滤资源库中。当要建议TCP连接时,可以通过获取TCP请求的SYN请求包,提取请求IP地址,并在所述URL过滤资源库中匹配所述请求IP地址;如果在所述URL过滤资源库中匹配到所述请求IP地址,阻断所述TCP请求对应的TCP连接。所述方法可以利用DNS内容短,格式简单的特点,减小URL过滤的性能消耗。另外,本申请采用IP地址与TCP协议,能实现首包阻断,减少网络中无用流量的传输,提高网络传输的效率。附图说明为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请一种快速URL过滤方法的流程示意图;图2为本申请提取域名信息的流程示意图;图3为本申请在URL过滤特征库中匹配域名信息的流程示意图;图4为本申请获取连接IP地址的流程示意图;图5为本申请在DNS缓存数据中匹配域名信息的流程示意图;图6为本申请提取请求IP地址的流程示意图;图7为本申请从访问信息中提取请求IP地址的流程示意图;图8为本申请一种快速URL过滤装置的结构示意图。具体实施方式下面将详细地对实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下实施例中描述的实施方式并不代表与本申请相一致的所有实施方式。仅是与权利要求书中所详述的、本申请的一些方面相一致的系统和方法的示例。本申请所述快速URL过滤方法及装置,可应用于上网行为管理设备,上网行为管理产品是指帮助互联网用户控制和管理互联网的使用情况。包括对访本文档来自技高网...

【技术保护点】
1.一种快速URL过滤方法,其特征在于,包括:获取DNS请求报文,以及从所述DNS请求报文中提取域名信息;在URL过滤特征库中匹配所述域名信息;如果在所述URL过滤特征库中匹配到所述域名信息,获取所述域名信息对应的连接IP地址;将所述连接IP地址加入URL过滤资源库;所述URL过滤资源库包括多个域名信息,以及多个域名信息对应的IP地址;获取TCP请求的SYN请求包,以及从所述SYN请求包中提取请求IP地址;在所述URL过滤资源库中匹配所述请求IP地址;如果在所述URL过滤资源库中匹配到所述请求IP地址,阻断所述TCP请求对应的TCP连接。

【技术特征摘要】
1.一种快速URL过滤方法,其特征在于,包括:获取DNS请求报文,以及从所述DNS请求报文中提取域名信息;在URL过滤特征库中匹配所述域名信息;如果在所述URL过滤特征库中匹配到所述域名信息,获取所述域名信息对应的连接IP地址;将所述连接IP地址加入URL过滤资源库;所述URL过滤资源库包括多个域名信息,以及多个域名信息对应的IP地址;获取TCP请求的SYN请求包,以及从所述SYN请求包中提取请求IP地址;在所述URL过滤资源库中匹配所述请求IP地址;如果在所述URL过滤资源库中匹配到所述请求IP地址,阻断所述TCP请求对应的TCP连接。2.根据权利要求1所述的URL过滤方法,其特征在于,获取DNS请求报文,以及从所述DNS请求报文中提取域名信息的步骤,包括:获取DNS请求报文以及当前应用领域下的域名模板;根据所述域名模板,在所述DNS请求报文中匹配符合域名模板形式的文本片段;提取所述文本片段作为所述域名信息。3.根据权利要求1所述的URL过滤方法,其特征在于,所述URL过滤特征库包括多个预置域名信息,以及与每个所述预置域名信息对应的分类信息;在URL过滤特征库中匹配所述域名信息的步骤,包括:逐一对比所述域名信息与预置域名信息;如果所述域名信息与任一预置域名信息一致,提取匹配到的所述预置域名信息对应的分类信息;如果所述域名信息与任一预置域名信息均不一致,确定当前域名信息为未知域名;将所述未知域名发送至上位服务器。4.根据权利要求1所述的URL过滤方法,其特征在于,如果在URL过滤特征库中匹配到所述域名信息,获取所述域名信息对应的连接IP地址的步骤,包括:获取DNS服务器针对所述DNS请求报文反馈的DNS响应报文;从所述DNS响应报文中,提取所述域名信息对应的连接IP地址。5.根据权利要求4所述的URL过滤方法,其特征在于,获取DNS服务器针对所述DNS请求报文反馈的DNS响应报文的步骤前,还包括:提取本地网络中的DNS缓存数据;在所述DNS缓存数据中,匹配所述域名信息;如果在所述DNS缓存数据匹配到所述域名信息,提取所述域名信息对应的连接IP地址;如果...

【专利技术属性】
技术研发人员:张晓东
申请(专利权)人:武汉思普崚技术有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1