结构化文档管理装置及方法制造方法及图纸

技术编号:10091182 阅读:198 留言:0更新日期:2014-05-28 14:23
结构化文档管理装置(1)包括:检索接口部(26),用于受理检索具有层次化后的逻辑结构的结构化文档的查询数据的输入;结构条件分割部(27),将查询数据分割为包含多个结构条件的要素单位;结构条件改写部(28),在分割出的上述结构条件的种类是根据结构化文档的上位层次指定下位层次的子孙结构条件以外时,上将述结构条件改写为按各自的上述结构条件的每个种类预先确定的包含子孙结构条件和结合运算处理的改写查询,以避免对结构条件的前后的上述要素带来影响;以及查询执行部(29),以上述结构条件及包含改写查询的查询数据作为输入,输出检索结果。

【技术实现步骤摘要】
【国外来华专利技术】结构化文档管理装置及方法
本专利技术的实施方式涉及结构化文档管理装置、方法及程序。
技术介绍
以往,已知用于对以XML(ExtensibleMarkupLanguage:可扩展标记语言)等记述的结构化文档数据进行存储、检索的结构化文档管理装置。为了进行结构化文档管理装置中的结构化文档数据的检索,制定了如RDBMS(RelationalDatabaseManagementSystem:关系型数据库管理系统)中的查询语言SQL那样的、与XML数据相对的查询语言XQuery(XMLQueryLanguage),并且在多数结构化文档管理装置受到支持。XQuery是用于如数据库那样处理XML数据集合的语言,提供用于进行符合条件的数据集合的取出、汇总、分析的方法。XML数据具有亲子、兄弟等的要素组合后的层次化的逻辑结构(层次结构),因此能够在条件中指定与该层次结构有关的条件(结构条件)。结构条件的处理中,需要进行结构对照处理,该结构对照处理是对结构化文档管理装置存储着的结构化文档数据是否具有符合条件的结构进行对照的处理。若结构条件仅是根据上位层次指定下位层次的处理(子孙结构条件),则该结构对照处理能够比较高速地进行处理,但在包含根据下位层次来指定上位层次的处理(先祖结构条件)、指定同一层次的前后的处理(兄弟结构条件)、在结构条件中对XML数据中所包含的要素的顺序关系进行指定的处理(顺序结构条件)时,难以进行高速地处理。与此相对,通过将先祖结构条件、兄弟结构条件及顺序结构条件变换为子孙结构条件和结合运算(結合運算)的组合,由此实现高速处理的尝试得以实施。例如,有利用对构成称为结构向导的在登记文档的标志赋予的ID的方法。另外,通过将XQuery内的先祖结构条件、兄弟结构条件及顺序结构条件改写为相同的XQuery,也能够实现。然而,由于需要称为结构向导的在登记文档时所分配的ID,因此对于未登记于结构化文档装置的外部的资源进行处理时、或对于在XQuery内部暂时生成的结构化文档,无法预先决定结构向导。在这种情况下,无法生成对先祖结构条件、兄弟结构条件及顺序结构条件进行了变换的执行计划(方案),因此存在结构对照处理的效率变差的问题。另外,需要将XQuery变换为利用了结构向导的独自的形式的处理,因此存在构成变得复杂的问题。另外,在改写结构条件时,需要将记述于成为对象的结构条件之前的结构条件全部改写,因此存在改写的开销(オーバーヘッド)较大的问题。另外,设想以一个结构化文档为对象的情况,因此在对于结构化文档集合应用改写后的XQuery时,存在对结构化文档集合的筛选(絞り込み)条件未得以活用,性能变差的情况。或者需要对每一个文档应用XQuery,因此性能变差。
技术实现思路
本专利技术要解决的课题在于,能够以简单的构成实现高速的结构综合处理的结构化文档管理装置、方法及程序。实施方式的结构化文档管理装置包括:结构化文档数据受理部、结构化文档数据存储部、查询数据受理部、结构条件分割部、结构条件改写部及查询执行部。结构化文档数据受理部受理具有层次化后的逻辑结构的结构化文档数据的输入。结构化文档数据存储部存储上述结构化文档数据。查询数据受理部受理查询数据的输入。结构条件分割部仅将所输入的查询数据内的结构条件部分切出而分割。结构条件改写部根据轴(軸)的种类对切出的结构条件进行改写,与分割出的查询数据的其他部分联接。查询执行部执行上述结构条件改写部输出的查询。根据上述构成的结构化文档管理装置,即使在输入查询数据包含复杂的结构条件时,也能够实现结构对照处理的高速化,能够高速地执行利用包含复杂的结构条件查询数据进行的检索。附图说明图1是表示第一实施方式的结构化文档管理系统的系统构筑例的模式图。图2是第一实施方式的服务器及客户终端的模块构成图。图3是表示第一实施方式的服务器及客户终端的概略构成的框图。图4是表示在第一实施方式的结构化文档DB中登记的结构化文档数据的一例的说明图。图5是表示第一实施方式的查询数据的一例的说明图。图6是表示由第一实施方式的检索处理部进行的检索处理的流程的流程图。图7是表示对于第一实施方式的查询数据进行了结构条件分割处理的结果的说明图。图8是表示通过第一实施方式的结构条件分割处理分割的结构条件的一览的说明图。图9是表示第一实施方式的结构条件改写处理的流程的流程图。图10是表示通过结构条件改写部对第一实施方式的结构条件改写处理进行改写时所需的规则一览的一例的说明图。图11是表示对第一实施方式的查询数据进行了改写的结果的一例的说明图。图12是表示第一实施方式的查询数据的结果数据的说明图。图13是表示第二实施方式的查询数据的一例的说明图。图14是表示对于第二实施方式的查询数据进行了结构条件分割处理的结果的说明图。图15是表示第二实施方式的结构条件改写处理的流程的流程图。图16是表示通过结构条件改写部对第二实施方式的结构条件改写处理进行改写时所需的规则一览的一例的说明图。图17是表示对第二实施方式的查询数据进行了改写的结果的一例的说明图。图18是表示第二实施方式的查询数据的结果数据的说明图。具体实施方式以下,参照附图,说明实施方式的结构化文档管理装置。(第一实施方式)首先,参照图1~图12对第一实施方式进行说明。图1是表示第一实施方式涉及的结构化文档管理系统的系统构筑例的模式图。在此,作为实施方式的结构化文档管理系统,设想如图1所示那样、通过LAN(LocalAreaNetwork:局域网)等网络2在结构化文档管理装置即服务器计算机(以下,称为服务器。)1上连接有多台客户计算机(以下,称为客户终端。)3的服务器客户系统。图2是服务器1及客户终端3的模块构成图。服务器1及客户终端3例如具有利用了通常的计算机的硬件构成。即,服务器1及客户终端3包括CPU(CentralProcessingUnit:中央处理单元)101、ROM(ReadOnlyMemory:只读存储器)102、RAM(RandomAccessMemory:随机存取存储器)103、HDD(HardDiskDrive:硬盘驱动器)104、介质驱动装置105、通信控制装置106、显示部107、输入部108及总线控制器109。CPU101执行各种信息处理。ROM102是存储了BIOS等的读出专用存储器。RAM103能够改写地存储各种数据。HDD104作为各种数据库发挥功能,并且保存各种程序。介质驱动装置105是用于用存储介质110保管信息或向外部发布信息或从外部获取信息的CD-ROM驱动器等。通信控制装置106通过经由网络2与外部的其他的计算机通信来传递信息。显示部107是对操作者显示处理经过、结果等的CRT(CathodeRayTube:阴极射线管)、LCD(LiquidCrystalDisplay:液晶显示器)等。输入部108是用于操作者对CPU101输入命令、信息等的键盘、鼠标等。总线控制器109对在各部间收发的数据进行协调。在这种服务器1及客户终端3中,用户接通电源时,CPU101使ROM102内的装载这一程序起动,从HDD104中将OS(OperatingSystem:操作系统)这一管理计算机的硬件和软件的程序读入到RAM103中,使该OS起动。这种OS根据用本文档来自技高网
...
结构化文档管理装置及方法

【技术保护点】
一种结构化文档管理装置,包括:查询数据受理部,受理查询数据的输入,所述查询数据用于检索具有层次化后的逻辑结构的结构化文档;结构条件分割部,将上述查询数据分割为包含结构条件的多个要素中的每个要素;结构条件改写部,在分割出的上述结构条件的种类是根据结构化文档的上位层次指定下位层次的子孙结构条件以外时,将上述结构条件改写为按结构条件的每个种类预先确定的包含子孙结构条件和结合运算处理的改写查询,以避免对上述结构条件的前后的结构条件带来影响;以及查询执行部,将上述结构条件及包含改写查询的查询数据作为输入,输出检索结果。

【技术特征摘要】
【国外来华专利技术】1.一种结构化文档管理装置,包括:查询数据受理部,受理查询数据的输入,所述查询数据用于检索具有层次化后的逻辑结构的结构化文档;结构条件分割部,将上述查询数据按包含结构条件的多个要素中的每个要素分割;结构条件改写部,将从分割后的上述多个要素取出的上述结构条件改写为按结构条件的每个种类预先确定的包含子孙结构条件和结合运算处理的改写查询,以避免对上述结构条件的前后的结构条件带来影响;以及查询执行部,将上述结构条件及包含改写查询的查询数据作为输入,输出检索结果,在上述结构条件是根据上位层次指定下位层次的子孙结构条件以外的结构条件的情况下,使用子孙结构条件和结合运算处理改写上述结构条件,在将上述结构条件改写为包含上述子孙结构条件和结合运算处理的上述改写查询时,以改写了的子孙结构条件仅以在此前的上述查询数据的处理中获得的结构化文档为对象的方式进行改写。2.如权利要求1所述的结构化文档管理装置,上述结构条件改写部进一步地,对于上述分割出的各上述结构条件中的第一结构条件,在上述结构条件的种类为将下一层次的节点作为取得对象的结构条件时,取得通过第一结构条件指定的字符串和位于上述第一结构条件之后的第二结构条件,判断上述第二结构条件是否为以上一层次的节点的任意的字符串作为取得对象的结构条件,在判断为上述第二结构条件是以上一层次的节点的任意的字符串作为取得对象的结构条件时,将上述第一结构条件及第二结构条件变换为具有对通...

【专利技术属性】
技术研发人员:黑田洋介稻田稔服部雅一
申请(专利权)人:株式会社东芝东芝解决方案株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1