XML报文检索方法及装置制造方法及图纸

技术编号:20329259 阅读:26 留言:0更新日期:2019-02-13 05:49
本申请提供一种XML报文检索方法及装置,涉及计算机领域,能够提高XML报文的检索效率。该方法包括:获取检索信息;确定所述检索信息对应的标签标识,所述标签标识包括标签名称、标签所在的层级和标签下标,所述标签名称用于反映所述检索信息中的内容,所述标签下标用于区分同一个标签对应的下层标签中属于同一个层级的相同标签;如果所述检索信息对应的标签标识中存在至少一个标签标识与存储的参考检索路径对应的标签标识中的至少一个标签标识相同,则复用所述至少一个标签标识对应的检索路径查找所述检索信息,其中,检索路径包括标签标识的节点信息。本申请适用于XML报文的检索过程。

【技术实现步骤摘要】
XML报文检索方法及装置
本申请涉及计算机领域,尤其涉及一种可扩展标记语言(ExtensibleMarkupLanguage,XML)报文检索方法及装置。
技术介绍
XML报文采用分层存储结构,每层都包括标签,该标签对应下一层中的部分或全部内容。示例性的,图1示出了一个XML报文四层结构中的三层,该四层结构中包括根节点的第零层未示出。该XML报文的第一层包括标签1和标签2,标签1和标签2对应的标签名称相同,均为“银行”,当同一个层级中存在多个具有相同标签名称的标签时,通常为标签设置不同的标签下标,如图1中标签1“银行”设置标签下标“1”,标签2“银行”设置标签下标2。需要说明的是,图1中以括号中的数字表示标签下标。如果用户需要从XML报文中检索信息时,如检索信息为银行(1)中存款人(2)的电话(1),终端在接收到上述查询内容后,先在XML报文的第一层中检索银行(1)对应的标签1;在查找到标签1后进入第二层中标签1对应的存储区域,再检索存款人(2)对应的标签4,之后进入标签4对应第三层中的存储区域检索电话(1)。这样逐层进行检索的方式需要终端完成大量的工作,并且,实际中XML报文远不止四层结构,这就使得终端需要完成巨大的工作量,从而耗费大量的时间,导致XML报文的检索效率降低。
技术实现思路
本申请提供一种XML报文检索方法及装置,能够提高XML报文的检索效率。为达到上述目的,本申请采用如下技术方案:第一方面,本申请提供一种XML报文检索方法,该方法可以包括:获取检索信息;确定所述检索信息对应的标签标识,所述标签标识包括标签名称、标签所在的层级和标签下标,所述标签名称用于反映所述检索信息中的内容,所述标签下标用于区分同一个标签对应的下层标签中属于同一个层级的相同标签;如果所述检索信息对应的标签标识中存在至少一个标签标识与存储的参考检索路径对应的标签标识中的至少一个标签标识相同,则复用所述至少一个标签标识对应的检索路径查找所述检索信息,其中,检索路径包括标签标识的节点信息。第二方面,本申请实施例提供一种XML报文检索装置,该装置包括:获取模块,用于获取检索信息;确定模块,用于确定所述获取模块获取的所述检索信息对应的标签标识,所述标签标识包括标签名称、标签所在的层级和标签下标,所述标签名称用于反映所述检索信息中的内容,所述标签下标用于区分同一个标签对应的下层标签中属于同一个层级的相同标签;检索模块,用于当所述确定模块确定的所述检索信息对应的标签标识中存在至少一个标签标识与存储的参考检索路径对应的标签标识中的至少一个标签标识相同时,复用所述至少一个标签标识对应的检索路径查找所述检索信息,其中,检索路径包括标签标识的节点信息。第三方面,本申请提供一种电子设备,包括存储器、通信接口和处理器,所述存储器和所述通信接口耦合至所述处理器,所述存储器用于存储计算机执行代码,所述处理器用于执行所述计算机执行代码控制电子设备执行如第一方面及其各种可能的实现方式所述的XML报文检索方法,所述通信接口用于所述电子设备与外部设备的数据传输。第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在电子设备上运行时,使得所述电子设备执行如第一方面及其各种可能的实现方式所述的XML报文检索方法。第五方面,本申请提供一种包含指令的计算机程序产品,当所述计算机程序产品在电子设备上运行时,使得所述电子设备执行如第一方面及其各种可能的实现方式所述的XML报文检索方法。本申请提供的XML报文检索方法及装置,与现有技术提供的每次检索时,都逐层对检索信息对应的标签进行检索,由于XML报文的层级复杂,导致检索效率低相比,本申请中存储每次检索得到的标签标识及对应的节点信息作为参考检索路径,在下一次检索时,如果检索信息对应的标签标识中存在与参考检索路径中相同的标签标识,则直接复用相同标签标识的节点信息,也就能够直接查找到该相同的标签标识,省去了再次检索该相同的标签标识的过程,提高了检索效率。附图说明图1为现有技术提供的XML报文的结构示意图;图2为本申请实施例提供的XML报文检索方法的流程图一;图3为本申请实施例提供的XML报文检索方法的流程图二;图4本申请实施例提供的XML报文检索装置的结构示意图一;图5本申请实施例提供的XML报文检索装置的结构示意图二;图6本申请实施例提供的电子设备的结构示意图一。具体实施方式下面结合附图对本申请实施例提供的XML报文检索方法及装置进行详细地描述。本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。在本申请的描述中,除非另有说明,“多个”的含义是指两个或两个以上。本申请实施例提供一种XML报文检索方法,该方法可以应用于具有XML报文解析功能的电子设备,该电子设备在本申请实施例中具体可以为电脑、服务器等。如图2所示,该方法流程包括:步骤201、获取检索信息。检索信息中包括用户所要查找的具体内容,参阅图1,检索信息具体可以为第一银行(银行的名称),或者第一银行中存款人张三的身份证号码,或者第二银行(银行的名称)中存款人李四的电话等。需要说明的是,检索信息由用户输入或从预存的文件中获取,对于检索信息的来源,在此不做限定。用户输入或预存的检索信息,可能存在顺序比较混乱的问题,例如,用户输入的检索信息可能为存款人张三、电话、第一银行,或者身份证号码、第二银行、存款人李四。由于检索XML报文时需要逐层进行检索,即先从第一层中检索第一银行对应的标签“银行(1)”,再进入第二层中“银行(1)”对应的存储区域检索张三对应的标签“存款人(1)”,再进入“存款人(1)”对应的存储区域检索该存款人(1)的电话(1),可以先确定检索信息中的内容所属的层级,之后按照层级被检索时的由先至后的顺序,对检索信息中包括的内容进行排序,例如,对于检索信息“存款人张三、电话、第一银行”而言,“存款人(1)”属于第二层,“电话(1)”属于第三层,“银行(1)”属于第一层,第一层先被检索,之后第二层再被检索,最后为第三层,那么对上述检索信息进行排序后得到更新后的检索信息“银行(1)、存款人(1)、电话(1)”。上述过程也可以称为对检索信息进行标准化的过程,在标准化之后,电子设备可以按照检索信息中内容的顺序检索XML报文中相应的内容。在检索XML报文时,需要利用应用程序编程接口(ApplicationProgrammingInterface,API)查找标签。在进行检索时,电子设备绑定标签信息与用于查找标签的API,API逐个从绑定的标签信息中选取标签进行检索,如果API当前检索的层级不存在选取的标签时,则无法查找到该标本文档来自技高网...

【技术保护点】
1.一种可扩展标记语言XML报文检索方法,其特征在于,所述方法包括:获取检索信息;确定所述检索信息对应的标签标识,所述标签标识包括标签名称、标签所在的层级和标签下标,所述标签名称用于反映所述检索信息中的内容,所述标签下标用于区分同一个标签对应的下层标签中属于同一个层级的相同标签;如果所述检索信息对应的标签标识中存在至少一个标签标识与存储的参考检索路径对应的标签标识中的至少一个标签标识相同,则复用所述至少一个标签标识对应的检索路径查找所述检索信息,其中,检索路径包括标签标识的节点信息。

【技术特征摘要】
1.一种可扩展标记语言XML报文检索方法,其特征在于,所述方法包括:获取检索信息;确定所述检索信息对应的标签标识,所述标签标识包括标签名称、标签所在的层级和标签下标,所述标签名称用于反映所述检索信息中的内容,所述标签下标用于区分同一个标签对应的下层标签中属于同一个层级的相同标签;如果所述检索信息对应的标签标识中存在至少一个标签标识与存储的参考检索路径对应的标签标识中的至少一个标签标识相同,则复用所述至少一个标签标识对应的检索路径查找所述检索信息,其中,检索路径包括标签标识的节点信息。2.根据权利要求1所述的方法,其特征在于,在获取检索信息之前,所述方法还包括:删除存储的历史标签标识以及所述历史标签标识对应的参考检索路径,所述历史标签标识用于表示在开始当前解析XML报文的过程之前存储的标签标识;在确定所述检索信息对应的标签标识之后,所述方法还包括:逐层检索所述标签标识中每个标签标识;存储所述每个标签标识及每个标签标识的节点信息,并将所述节点信息确定为参考检索路径。3.根据权利要求1或2所述的方法,其特征在于,所述检索信息的数量为至少两条,在确定所述检索信息对应的标签标识之后,所述方法还包括:对比每条检索信息的标签标识,将存在至少一个相同标签标识的检索信息划分为一类;将每一类检索信息中,包括标签标识的数量最多的检索信息对应的标签标识确定为参考标签标识;按照相似度由高到低的顺序分别对每一类检索信息进行排序,所述相似度用于表示每条检索信息对应的标签标识中,与所述参考标签标识相同的标签标识数量占所述参考标签标识总数量的比例;按照顺序检索每一类检索信息中的每条检索信息。4.根据权利要求1所述的方法,其特征在于,在复用所述至少一个标签标识对应的检索路径查找所述检索信息之后,所述方法还包括:使用所述检索信息对应的检索路径替换所述参考检索路径,以更新参考检索路径。5.根据权利要求1所述的方法,其特征在于,在确定所述检索信息对应的标签标识之后,所述方法还包括:如果所述检索信息对应的标签标识中不存在标签标识与存储的参考检索路径对应的标签标识相同,则逐层查找所述检索信息对应的标签标识中的每个标签标识,得到目标检索路径;使用所述目标检索路径替换所述参考检索路径,以更新参考检索路径。6.一种可扩展标记语言XML报文检索装置,其特征在于,所述装置包括:获取模...

【专利技术属性】
技术研发人员:刘继波黄新福张兴华陈水清武岳王硕
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利