管理数据库的数据库管理系统技术方案

技术编号:2920632 阅读:177 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种管理数据库的数据库管理系统,其包括:第一数据保存部件,其用于快速执行数据的搜索操作及低速执行数据的变更操作的搜索;第二数据保存部件,每个都用于慢速执行的数据的搜索操作及快速执行数据的变更操作的插入和删除;数据传送部件,其将数据从每个第二数据保存部件传送到第一数据保存部件,以便反映插入操作或删除操作的结果;数据库操作请求处理部件,其执行对数据库的操作请求;事务处理部件,其保证了数据传送部件和数据库操作请求处理部件之间的数据的一致性;以及文档转换部件,其在对数据库的操作请求和异步合并处理之间将第一数据保存部件转换为第二数据保存部件。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术一般涉及数据库管理系统、全文(full-text)搜索装置和全文搜索方法,尤其涉及一种通过延迟更新而完成合并处理的数据库管理系统,以及用于从多个文档数据中搜索包含一特定字符串的文档的全文搜索装置和方法。本专利技术适用于管理大量文档数据的系统,诸如文档管理系统、电子图书馆系统以及专利公开文献检索系统。
技术介绍
在关系数据库中,用表格来表示和管理数据。所述表格由元组(tuple)的集合组成,其中每个元组是一列属性值。并且,表格本身存于文档中。数据库的操作分为以下四种操作。(1)搜索(检索)操作这是提供与属性值有关的条件作为搜索条件,以检索与所述条件相匹配的元组的操作。(2)插入操作这是把具有给定属性值的新元组插入表格的操作。(3)更新操作这是把从表格中选出的元组的属性值变更为新值的操作。(4)删除操作这是删除从表格中选定的元组的操作。在下文中,上述插入操作、更新操作和删除操作一起被称为变更操作。在使用关系数据库的系统中,执行搜索操作的响应时间是一项重要的性能指标。因此,为了缩短搜索响应时间,而出现了一种利用索引文件建立关系数据库的方法。该索引文件包括从一个或更多属性值转化而来的特定结构,以快速估算属性值的状态。另一方面,在变更操作中,更新索引文件所需的时间是影响执行性能的一个原因。在使用索引文件的常用形式中,由于与搜索操作相比很少需要变更操作就只运行搜索操作;大量变更操作是在晚上系统停止运行时执行的。因此,通过变更操作的响应时间来衡量性能。然而,在在线的系统中请求实时特性的时候,变更操作的响应时间就很重要了。为了解决上述问题,日本已公开专利申请No.10-143412所披露的“数据库管理系统”中,要数据库的写入在被反映到磁盘之前临时保存在非易失性存储器中,利用非易失性存储器作为磁盘高速缓冲存储器来代替磁盘查阅相应的数据。然而,因为只有简单结构的数据能被保存在磁盘高速缓冲存储器中,所以存在不能使用高性能索引文件的问题。此外,日本已公开专利申请No.2000-163294所披露的“数据库管理方法和设备以及记录其程序的机器可读记录介质”中,对次级存储器中的数据库的访问和更新是在主存储器中的数据缓冲器中完成的,更新的页面反映到数据库与应用程序的处理过程不同步,从而只用一组数据缓冲器来完成延迟更新处理;这样降低了对主存储器容量的需求。然而,因为只有具有简单结构的数据能保存在此数据缓冲器中,所以就存在不能使用高性能索引文件的问题,如同日本已公开专利申请No.10-143412一样。当多个用户同时使用一个数据库系统时,搜索操作和变更操作是在不同的时候请求的。在这期间,使用事务处理以保持数据的一致性。在(1)“‘事务处理原则(Principles of Transaction Processing)’Philip A Bernstein,EricNewmarker著;Nikkei商务出版公司(Nikkei Business Publication,Inc)”中详细解释了事务处理。完全独立的处理保证了任何时刻数据的一致性。然而,并行执行性的降低,将导致整体处理能力的降低。为了解决上述问题,使用了独立标准(isolation level)的概念。在(2)“‘ANSI SQL独立标准评述(A Critique of ANSISQL Isolation Levels)’Hal Bereson,Philip A Bernstein,Jim Gray,Jim Melton,Elizabeth J.O′Neil著;Patrick E.O′Neil Proc.ACM SIGMOD Conf.(Jun.1995)第1-10页”中详细解释了独立标准。为了解释上述传统技术中的问题,提出了把用于分成多个部分的全文搜索的数据保存部件(反向文件(inverted file))安排在一起的合并操作的想法。当要被合并的反向文件中的数据的数量达到一界限值时,启动合并操作。这种合并操作有两种类型一是同步合并,其完成与反向文件的插入操作相同的一系列操作(前台操作)那样的合并操作;另一个是异步合并,其完成与插入操作不同的操作(后台操作)那样的合并操作。在异步合并中,为了在合并期间正确地执行插入,必须专门地处理要被合并的反向文件。因此,在专门处理期间,合并操作和插入操作均被延迟处理,结果,使得插入操作的响应变慢。此外,最近几年,随着信息通讯技术的发展,电子文档和与该文档有关的信息通过internet等大量发布。因此,提出了用于快速、准确地搜索想要的文档的文档搜索设备。在这种文档搜索设备中,采用了关键词搜索方法和全文搜索方法。使用全文搜索方法的全文搜索设备将任一给定的搜索字符串与要搜索的全部文档进行比较,以提取出含有搜索字符串的全部文档。这样,与关键词搜索方法不同,使用全文搜索方法的全文搜索设备不需花费大量人力来预先提供所有要被搜索文档的关键词。提出了全文搜索设备的各种类型,其中一种类型是采用了反向(索引)文件的方法的设备。在反向文件的方法中,事先建立记录了含有字符/字/N个字符列(n个字符的结合)的文档或记录了其在文档中出现的位置的索引文件,作为用于搜索的辅助文档;根据全文搜索,搜索通过只利用反向文件完成。这样,反向文件的方法能够实现相当高速的搜索,这对需要高速搜索大量文档的系统来说是有很好的效果的。此外,一般的全文搜索方法和反向文件方法在“信息检索算法(Information Retrieval Algorithm)”(Kenji Kitasato、Kazuhiko Tsuda、MasamiShishibori著;Kyoritsu Shuppan Co.,Ltd.;160-179页)、日本已公开专利申请No.1l-073429“相关技术的描述”(Description of the Related Art)以及1998年度全文搜索系统会议活动报告(http//www.ftsanet.com/dbtokyo99/Db99.htm)中做了详细描述,并且其也是公知的,这里就不再解释。当采用反向文件方法的常规技术时,日本专利No.3024544(日本已公开专利申请No.9-265420),描述了一种信息搜索装置,其除搜索索引文件之外,还存储了实时处理数据,以便在搜索索引文件正在被更新的时候也能完成搜索处理。此外,日本已公开专利申请No.7-146880描述了一种文档搜索装置及方法,其在比主索引小的子索引中注册一新文档,由此缩短注册时间。然而,在包括上述日本已公开专利申请中所描述的反向文件方法中,通常需要建立比原始数据大几倍的反向文件。因此,随着注册文档数据的数量的增长,反向文件方法的全文索引需要更长的用于进行注册/删除处理的时间。因此,从用户的角度看,这样的全文搜索装置中,进行注册/删除处理的响应时间变长了。
技术实现思路
本专利技术的首要目的是,提供一种克服了上述问题的改进的且有用的数据库管理系统、全文搜索装置和全文搜索方法。本专利技术的又一特定目的是,提供一种数据库管理系统,其能避免在执行异步合并时插入操作的响应的恶化,并提高对大量搜索请求的总响应,以及提供全文搜索装置和全文搜索方法,其从用户的角度看能缩短注册和删除处理的响应时间,还能消除在一处理不能执本文档来自技高网
...

【技术保护点】
一种管理数据库的数据库管理系统,所述系统包括:用于搜索的第一数据保存部件,其高速执行数据的搜索操作及低速执行数据的变更操作;用于插入和删除的第二数据保存部件,其中每一个都低速执行数据的搜索操作,以及高速执行数据的变更操作;   数据传送部件,其将数据从每个所述第二数据保存部件传送到所述第一数据保存部件,以便反映插入操作或删除操作的结果;数据库操作请求处理部件,其执行对数据库的操作请求;事务处理部件,其保证所述数据传送部件和所述数据库操作请求处 理部件之间的数据的一致性;以及文件转换部件,其在对数据库的操作请求和异步合并处理之间将所述第二数据保持部件转换为所述第一数据保存部件,以便当所述第二数据保存部件的其中之一用于异步合并处理时,另一个第二数据保存部件用于对数据库的操作请 求。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:大瀬户太
申请(专利权)人:株式会社理光
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1