一种用户Web访问行为控制方法及装置制造方法及图纸

技术编号:8565266 阅读:200 留言:0更新日期:2013-04-11 07:36
本发明专利技术涉及一种用户Web访问行为控制方法及装置,该方法包括:根据用户的Web数据识别出其对应的URL;根据URL在预先建立的特征库中找到对应的特征,特征库包含多个URL,每个URL对应一个或多个特征;根据特征调取与特征对应的HTTP实体,所述HTTP实体是预先按照HTTP协议特征从Web数据中解析出来的;在HTTP实体中搜索特征中的关键字;在搜索命中后根据特征的条件属性在HTTP实体中提取与关键字对应的内容;将提取出的内容与预定的策略条件进行匹配;执行匹配成功的策略条件所对应的策略。本发明专利技术通过URL定位,用Bypass机制跳过非对应功能的流量处理,并且对策略条件进行了预编码,从而针对用户的上网行为进行识别、提取和策略匹配,最终通过执行相应的策略动作达到了有效的行为管理。

【技术实现步骤摘要】

本专利技术涉及计算机网络安全领域,尤其涉及一种用户Web访问行为控制方法及装置
技术介绍
互联网、移动互联网蓬勃发展的今天,各类安全问题层出不穷,这使得不少安全类产品也应运而生,其中典型的包括防火墙(Firewall)、入侵检测/防御系统(IDS/IPS),还有代理类的虚拟专用网(VPN)等等。这些设备大多是基于固定的网络协议进行处理的,由于网络自身的开发性和日益丰富的应用发展,以及用户行为本身的不确定性,使得传统的基于传输协议的安全技术和方案已无法达到理想的管理效果。从硬件到软件,从设备到人员管理,网络安全技术和方案涉及很广。这里,我们将重点集中在应用层信息安全方面。随着Web2. 0时代的到来,网络应用变得更加丰富,这使得人们上网的行为方式也发生了巨大变化从早期只能进行简单的网页浏览的行为,发展成了涵盖搜索、邮件收发、发帖(类似的还有博客、评论、回复等)、聊天、文件上传/下载等更为复杂的行为类型。这些Web应用,都是在应用层协议上进行描述的,因此原先那些安全类设备无法覆盖到这些行为。同时,考虑到应用的多祥性和排它性,用户行为的描述方式也是基于一定的语法特征的,具体的描述方式由服务提供者定义。针对用户上网行为管理问题,网络管理者提出了如下需求1、对用户上网行为 的精确识别(如登录、退出、发帖、发邮件、下载文件等);2、对用户上网信息进行全面的精细化审计(如账号、标题、正文、附件名等);3、能够对上网信息进行策略控制和记录;(如对敏感言论的封堵控制);4、能对行为发起者进行及时定位和跟踪,了解并预测其可能的行为。现有的实现方案通常比较简单,它们往往只通过Web行为中的URL进行分类查询和关键字提取,从而做出基本的行为判定和执行动作。显然,仅仅就URL进行初步过滤无法满足用户的所有需求,具体表现如下1、功能分类过于简单,如只有网页类、捜索类、邮件类等,且使得扩展不便,需要较多的二次开发工作量;2、功能精细化处理能力不足,如误识别、提取条件少、策略简单等;3、功能间串行处理,性能较低,从而导致当多种功能并行处理时性能不佳;4、应对协议中的编码支持不好,如不同字符集下匹配失败、显示乱码等,从而导致无法进行精确的识别匹配,或因实时解码操作导致性能不佳;5、更新机制简单滞后,有效性低,从而在面对高速发展的互联网应用时没有ー个快速有效的更新机制;总的来说,现有的针对网络安全的解决方案在实现上比较简单低效,且不具备理想的功能扩展性。
技术实现思路
本专利技术的目的是提供一种能够克服至少上述缺陷之一的用户Web访问行为控制方法及装置。在本专利技术的第一方面,提供了一种用户Web访问行为控制方法,包括根据用户的Web数据识别出其对应的URL ;根据所述URL在预先建立的特征库中找到对应的特征,所述特征库包含多个URL,每个URL对应ー个或多个特征;根据所述特征调取与所述特征对应的HTTP实体,所述HTTP实体是预先按照HTTP协议特征从所述Web数据中解析出来的;在所述HTTP实体中捜索所述特征中的关键字;在所述搜索命中之后,根据所述特征的条件属性在所述HTTP实体中提取与所述关键字对应的内容;将提取出的内容与预定的策略条件进行匹配;以及执行匹配成功的策略条件所对应的策略。在本专利技术的第二方面,提供了一种用户Web访问行为控制装置,包括URL识别模块,用于根据用户的Web数据识别出其对应的URL ;特征查找模块,用于根据所述URL在预先建立的特征库中找到对应的特征,所述特征库包含多个URL,每个URL对应ー个或多个特征;HTTP实体调取模块,用于根据所述特征调取与所述特征对应的HTTP实体,所述HTTP实体是预先按照HTTP协议特征从所述Web数据中解析出来的;关键字搜索模块,用于在所述HTTP实体中捜索所述特征中的关键字;内容提取模块,用于在所述搜索命中之后,根据所述特征的条件属性在所述HTTP实体中提取与所述关键字对应的内容;策略条件匹配模块,用于将提取出的内容与预定的策略条件进行匹配;以及策略执行模块,用于执行匹配成功的策略条件所对应的策略。在本专利技术的第三方面,提供了一种网关,包括URL识别模块,用于根据用户的Web数据识别出其对应的URL;特征查找模块,用于根据所述URL在预先建立的特征库中找到对应的特征,所述特征库包含多个URL,每个URL对应ー个或多个特征;HTTP实体调取模块,用于根据所述特征调取与所述特征对应的HTTP实体,所述HTTP实体是预先按照HTTP协议特征从所述Web数据中解析出 来的;关键字搜索模块,用于在所述HTTP实体中捜索所述特征中的关键字;内容提取模块,用于在所述搜索命中之后,根据所述特征的条件属性在所述HTTP实体中提取与所述关键字对应的内容;策略条件匹配模块,用于将提取出的内容与预定的策略条件进行匹配;以及策略执行模块,用于执行匹配成功的策略条件所对应的策略。本专利技术通过URL定位,并且在发现其中带有“非”条件的特征时用旁路Bypass机制跳过非对应功能的流量处理,并且对策略条件进行了预编码,从而针对用户的上网行为进行识别、提取和策略匹配,最終通过执行相应的策略动作达到了有效的行为管理。附图说明图1是根据本专利技术实施例的用户Web访问行为控制的系统示意图;图2是根据本专利技术实施例的用户Web访问行为控制方法的流程图;图3是根据本专利技术实施例的用户Web访问行为控制的全程关联的示意图;以及图4是根据本专利技术实施例的用户Web访问行为控制装置示意图。具体实施方式下面通过附图和实施例,对本专利技术的技术方案做进ー步的详细描述。为了解决以上问题,本专利技术提供了ー套快速、完整的Web特征框架,实现了对用户需求的完美覆盖,其具有下列特征框架中预设了ー些基本的功能类型和条件,并因其灵活性,可方便有效地进行新功能扩展;可对Web功能进行精确识别和信息的准确提取,并能完成策略模块的快速匹配;同时,支持跨会话(Session)的行为关联,从而可以提供全面的行为统计信息;通过URL预识别可以唯一地确定大部分功能类型,从而避免各功能并行处理中的重复操作,有效提升处理性能;通过对策略条件的编码预处理,以及前面提及的准确提取,无须实时解码即可完成策略条件的匹配过程;通过人工手动识别和智能云端统计反馈两种方案,从不同角度完善特征更新机制。图1是根据本专利技术实施例的用户Web访问行为控制的系统示意图。图2是根据本专利技术实施例的用户Web访问行为控制的方法流程图。下面,结合图1和图2对用户Web访问行为控制的过程进行一个详细的描述。在步骤201,根据用户的Web数据识别出其对应的URL。在此,URL预识别是利用URL的全局唯一性来确定相应的功能类型,从而避免了多功能重复操作的问题。特征库中的URL特征收录了大量国内主流网页,从而保证了审计准确性。另外,URL特征还支持网页黑白名单的控制需求,可在第一时间快速反应。在步骤202,根据所述URL在预先建立的特征库中找到对应的特征,所述特征库包含多个URL,每个URL对应ー个或多个特征。例如,可以用HTTP实体(HTTP Entity)为基础来进行处理,特征库中的每个URL对应的一个或多个特征可以是HTTP实体的方式,其中,每个HTTP实体可以包含一个自定义处理函数,以及ー组特征,用于在W本文档来自技高网
...

【技术保护点】
一种用户Web访问行为控制方法,包括:根据用户的Web数据识别出其对应的URL;根据所述统一资源定位符URL在预先建立的特征库中找到对应的特征,所述特征库包含多个URL,每个URL对应一个或多个特征;根据所述特征调取与所述特征对应的HTTP实体,所述HTTP实体是预先按照HTTP协议特征从所述Web数据中解析出来的;在所述HTTP实体中搜索所述特征中的关键字;在所述搜索命中之后,根据所述特征的条件属性在所述HTTP实体中提取与所述关键字对应的内容;将提取出的内容与预定的策略条件进行匹配;以及执行匹配成功的策略条件所对应的策略。

【技术特征摘要】
1.一种用户Web访问行为控制方法,包括 根据用户的Web数据识别出其对应的URL ; 根据所述统一资源定位符URL在预先建立的特征库中找到对应的特征,所述特征库包含多个URL,每个URL对应一个或多个特征; 根据所述特征调取与所述特征对应的HTTP实体,所述HTTP实体是预先按照HTTP协议特征从所述Web数据中解析出来的; 在所述HTTP实体中搜索所述特征中的关键字; 在所述搜索命中之后,根据所述特征的条件属性在所述HTTP实体中提取与所述关键字对应的内容; 将提取出的内容与预定的策略条件进行匹配;以及 执行匹配成功的策略条件所对应的策略。2.根据权利要求1所述的方法,还包括 所述关键字的搜索是通过正则表达式和/或多模搜索来进行的。3.根据权利要求1所述的方法,其中,所述特征还包括行为属性,所述方法还包括 在所述搜索命中后并且在提取内容之前,先查看所述特征的行为属性是否带有预定标志,如果带有预定标志,则直接将所述Web数据丢弃,不进行后续处理。4.根据权利要求1所述的方法,还包括 根据所述Web数据获取相应的会话ID ; 将所述会话ID与用户的登录账户进行关联; 利用所述关联获取用户在所述登录账户下的各种上网行为的信息。5.根据权利要求1所述的方法,其中...

【专利技术属性】
技术研发人员:周阳刘岩曹政张瑞娟范立磊
申请(专利权)人:北京网康科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1