网站支撑数据库安全搜索引擎系统技术方案

技术编号:2822097 阅读:210 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种网站支撑数据库安全搜索引擎系统。系统对网站支撑数据库存放的网页文本信息的访问角色信息和显示网址进行描述;直接对网页文本信息建立索引,索引中包含显示网址信息和访问角色信息;按照用户提交的查询关键字从牵引库中获取匹配的记录,根据用户所对应的访问控制规则对匹配记录进行过滤,并返回给用户;用户通过原始页面查看网页文本信息。本发明专利技术实现对网站文本信息的深度、全面搜索,索引中包含网页文本信息的访问角色信息,用户只能查看到其权限许可范围内的网页文本信息,实现安全搜索,索引中包含网页文本信息的显示网址信息,用户通过显示网址信息在原始页面中查看网页文本信息,继承传统搜索引擎突出的优点,符合用户操作习惯。

【技术实现步骤摘要】

本专利技术属于计算机检索技术,具体涉及一种网站支撑数据库安全搜索 引擎系统,该系统结合了互联网搜索引擎、数据库全文检索及基于访问控 制的搜索引擎等技术,对网站支撑数据库中所存放的网页文本信息及其描 述信息建立索引,用户可检索出其权限许可范围内的所有文本资源,并以 原始网页的形式展示文本资源。
技术介绍
随着互联网技术的迅猛发展,越来越多的企业和组织用网站的形式发 布消息和资源、实现业务流程,这种方式极大地方便了管理者对资源的管 理和用户对资源的访问和使用。随着信息资源不断完善丰富、业务流程灵 活性要求不断提高,通过静态页面的超级链接的形式访问所有的信息资源 己经不够现实, 一些资源往往需要用户在特定页面中选择或输入相关条件 后才能在网页上显示出来。同时,不同的企业或组织为了自身的利益或其 他目的对其网站中的资源实施访问控制,将不同资源的访问权限授予不同 的用户群体,访问控制技术在提高资源安全性的同时,也为搜索引擎对资 源的检索设置了障碍。传统搜索引擎系统通过爬行器对所有的网站资源进行爬行,对所获得 的资源通过分词等技术建立全文索引文件,并将所建立的全文索引文件置 于服务器端,当用户查询资源时,搜索程序通过分词技术将用户査询条件 分解为索引项在已建立的索引文件中进行搜索,并将搜索到的结果反馈给 用户。由此可以看出,传统搜索引擎系统无法采集到受控的资源,比如不 同权限的用户可访问不同的资源。其次,传统搜索引擎系统注重通用性, 不会获取用户身份,因此无法根据用户的不同而返回不同的搜索结果。基于访问控制的安全搜索引擎系统对传统搜索引擎系统进行改进,不 仅能够对网络中受安全访问控制下的文件进行信息检索,还能够对安全访问控制下的资源进行分析,并通过用户信息建立索引,自动实现对复杂访 问控制环境下受控资源的检索与访问。该系统解决了传统搜索引擎系统不 能检索受控资源的问题,可以根据用户身份信息检索到用户权限许可范围 内的网页资源,但是该系统只能检索到爬行器所能收集到的网页资源,对 于爬行器不能收集到的资源则无能为力,如上文所述,网站中大量的资源 往往需要用户在特定页面中选择或输入相关条件后才能在网页上显示出 来,对于这部分资源基于访问控制的安全搜索引擎则无法检索。数据库全文检索系统对数据库的文本字段建立索引,在索引的支持下 能够实现很高的查全率。将数据库全文检索系统直接用于网站支撑数据库 存在以下两个问题第一个问题是安全问题,系统虽然能够保证查全率, 但是不能根据用户的身份确定用户所能査看的信息资源,使得该系统无法 应用于有受控资源的网站,现有一些数据库全文检索产品通过为用户和资 源指定安全标签实现分级访问控制,能够部分解决这个问题,但是由于分 级访问控制较为僵化,无法适应于现代电子政务和电子商务的灵活性需求;第二个问题是查询结果显示问题,数据库全文检索系统往往通过定制界面 展示检索到的信息资源,而搜索引擎系统往往在检索出信息资源后以原始 页面的形式显示该信息,以原始页面的形式显示信息除了更符合用户习惯 外,显示页面前还要通过网站的访问控制检查,更加安全。数据库全文检索系统的一个典型代表是北京拓尔思信息技术有限公司的TRS产品,该产 品就存在上述的两个问题, 一是采用分级访问控制方法,过于僵化不能满 足各种组织的灵活的访问控制需求,二是不能以原始网页的形式显示检索 出的信息,除了不符合用户习惯外还避开网站的访问控制检查,还存在安 全隐患。
技术实现思路
本专利技术的目的在于提供一种网站支撑数据库安全搜索引擎系统,该系 统能够对存放网页文本信息的数据库进行深度检索,并且査全率高,安全 性强。本专利技术提供的网站支撑数据库安全搜索引擎系统,其特征在于该系统包括登录模块、访问控制模块、数据库、数据库更新探测模块、信息描述模块、索引模块、索引库和检索模块;登录模块用于接受用户提供的身份信息并进行认证;访问控制模块用于控制用户对资源网页的访问,用户通过登录模块的 认证后,从访问控制模块获取用户的角色信息,当用户请求访问资源网页' 时对比用户的角色信息和允许访问该资源网页的角色信息进行访问控制, 通过访问控制的用户请求被授权访问资源网页;当访问控制模块改变网页 文本信息的访问角色信息,访问控制模块向信息描述模块提交网页文本信 息的显示网址和改变后的访问角色信息;数据库用于支撑网站的运行,存储网页中显示的文本信息以及该文本 信息的访问角色信息和显示网址信息;数据库更新探测模块用于探测数据库中数据表的更新,当探测到数据 库中数据表有新增网页文本信息条目时通知信息描述模块,信息描述模块 将该新增网页文本信息的访问角色信息和显示网址信息写回数据库的数据 表中;当数据库更新探测模块探测到数据库中数据表中网页文本信息、网 页文本信息的访问控制角色信息及显示网址信息有更新时通知索引模块;信息描述模块为管理员提供一个对数据库中数据表中存放的网页文本 信息的访问角色信息和显示网址进行描述的接口,根据网站的业务逻辑确 定网页文本信息的显示网址,根据访问控制模块的访问控制逻辑确定网页 文本信息的访问角色信息;索引模块从数据库中获取网页文本信息、网页文本信息的访问角色信 息及网页文本信息的显示网址信息,并实时地更新索引库中的索引;索引库中存放索引模块根据从数据库中获取的信息所建立的索引;检索模块为用户提供搜索引擎的使用界面,并提供搜索服务,搜索引 擎的使用界面接受通过登录模块认证的用户的查询关键字,对关键字进行 分词,检索模块向访问控制模块提交用户角色信息,获取该角色对应的访 问控制规则;根据关键字分词结果和用户请求中携带的访问控制规则对索 引库进行检索,对比用户请求中携带的访问控制规则和索引库中所存放的 网页文本信息的访问角色信息,确定用户所能查看的网页文本信息,并返回网页文本信息的显示网址信息。本专利技术提出的网站支撑数据库安全搜索引擎系统部署后能够对存放网 页文本信息的数据库进行深度检索,不仅能够对网页中现存的文本信息进 行信息检索,还能够对需要用户在网页中输入相关查询条件后才能在网页中显示出的文本信息进行信息检索;被检索的文本信息既包括公开网页中 的文本信息,也包括受安全访问控制网页中的文本信息。本专利技术系统在信 息描述模块和数据库的支持下,索引模块对数据库中的网页文本信息、网 页文本信息的访问角色信息及网页文本信息的显示网址信息建立索引,检 索模块利用索引库为用户提供检索服务,为用户提供其权限许可范围内所 有满足检索条件的网页文本信息,并以原始网页的形式展现给用户。由于 大量存在需要用户在网页中输入相关查询条件后才能在网页中显示出的文 本信息,普通的搜索引擎系统无法对网站进行深度搜索,无法检索出需要 用户在网页中输入相关查询条件后才能在网页中显示出的文本信息。普通 的数据库检索工具能够对网站支撑数据库进行深度搜索,但是不能适应复 杂访问控制策略,而且检索结果不能以原始网页的形式展现给用户。具体 而言,本专利技术具有如下优点(1) 查全率高本系统针直接对网站支撑数据库中的网页文本信息、 网页文本信息的访问角色信息及网页文本信息的显示网址信息建立索引, 不仅能够对网页中现存的文本信息进行信息检索,还能够对需要用户在网 页中输入相关査询条件后才能在网页中显示本文档来自技高网
...

【技术保护点】
一种网站支撑数据库安全搜索引擎系统,其特征在于:该系统包括登录模块(100)、访问控制模块(200)、数据库(600)、数据库更新探测模块(800)、信息描述模块(700)、索引模块(400)、索引库(500)和检索模块(300);登录模 块(100)用于接受用户提供的身份信息并进行认证;访问控制模块(200)用于控制用户对资源网页的访问,用户通过登录模块(100)的认证后,从访问控制模块(200)获取用户的角色信息,当用户请求访问资源网页时对比用户的角色信息和允许访问该资 源网页的角色信息进行访问控制,通过访问控制的用户请求被授权访问资源网页;当访问控制模块(200)改变网页文本信息的访问角色信息,访问控制模块(200)向信息描述模块(700)提交网页文本信息的显示网址和改变后的访问角色信息;数据库(600 )用于支撑网站的运行,存储网页中显示的文本信息以及该文本信息的访问角色信息和显示网址信息;数据库更新探测模块(800)用于探测数据库(600)中数据表的更新,当探测到数据库(600)中数据表有新增网页文本信息条目时通知信息描述模块(700 ),信息描述模块(700)将该新增网页文本信息的访问角色信息和显示网址信息写回数据库(600)的数据表中;当数据库更新探测模块(800)探测到数据库(600)中数据表中网页文本信息、网页文本信息的访问控制角色信息及显示网址信息有更新时通知索引模块(400);信息描述模块(700)为管理员提供一个对数据库(600)中数据表中存放的网页文本信息的访问角色信息和显示网址进行描述的接口,根据网站的业务逻辑确定网页文本信息的显示网址,根据访问控制模块(200)的访问控制逻辑确定网页文 本信息的访问角色信息;索引模块(400)从数据库(600)中获取网页文本信息、网页文本信息的访问角色信息及网页文本信息的显示网址信息,并实时地更新索引库(500)中的索引;索引库(500)中存放索引模块(400)根据从数据库(600)中 获取的信息所建立的索引;检索模块(300)为用户提供搜索引擎的使用界面,并提供搜索服务,搜索引擎的使用界面接受通过登录模块(100)认证的用户的查询关键字,对关键字进行分词,检索模块(300)向访问控制模块(200)提交用户角色信息,获取 该角色对应的访问控制规则;根据关键字分词结果和用户请求中携带的访问控制规则对索引库(500)进行检索,对比用户请求中携带的访问...

【技术特征摘要】

【专利技术属性】
技术研发人员:李瑞轩辜希武卢正鼎於光灿文坤梅张茂元丁益斌
申请(专利权)人:华中科技大学
类型:发明
国别省市:83[中国|武汉]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1