文档格式转换系统技术方案

技术编号:9642539 阅读:97 留言:0更新日期:2014-02-07 01:15
本发明专利技术提供了一种文档格式转换系统,包括:模板配置模块,用于将XML模板文件对应的DOM树中的每个节点的元素信息记录至配置表中,并将映射关系存储至所述配置表中;标识生成模块,用于为至少一个节点生成对应的位置标识,并关联地存储所述位置标识;格式转换模块,用于根据所述配置表,生成所述目标XML文件,其中,根据所述位置标识对所述XML模板文件中对应的节点进行寻址。本发明专利技术还提出了另一种文档格式转换系统。通过本发明专利技术的技术方案,可以在二维关系表与XML文件之间进行格式转换时,通过位置标识来加快对节点的寻址操作,从而尤其当XML文档的内容比较多、层次比较深及条件比较复杂时,有助于提高转换效率。

【技术实现步骤摘要】
文档格式转换系统
本专利技术涉及格式转换
,具体而言,涉及文档格式转换系统。
技术介绍
HL7(HealthLevelSeven)是基于国际标准化组织ISO公布的网络开放系统互连模型OSI第七层(应用层)的医学信息交换协议。目前,HL7协议已经进展到了第三版,即HL7V3。在基于HL7V3的医疗系统之间实现医学信息的交互时,常常涉及到需要将本地生成的二维关系表转换为XML文件后发送至其他医疗系统,或将接收到的来自其他医疗系统的XML文件转换为二维关系表后存储至本地。在相关技术中,主要是采用XML映射法。其中,实现映射的过程一般分为两部分:配置映射和使用映射关系转换XML。XML(ExtensibleMarkupLanguage,可扩展标记语言)是一种结构化的描述数据语言,由于其开放性与可扩展性,目前被广泛应用于数据交互和数据存储方面;XML文档主要由标签、标签值、属性、属性值、特殊处理指令、注释等元素构成。目前,XML的解析技术主要有两种:SAX(SimpleAPIforXML)和DOM(DocumentObjectModel),两种技术实现原理不同。SAX基于事件触发方式进行解析;DOM则将XML文档一次性的经过DOM解析器解析成一个保存在内存中的对象树,对XML的随机操作转化为对对象树的操作。因此,总体上目前DOM由于其操作的方便性,基本成为主流XML解析器方法。在通过操作DOM树进行XML中的节点定位时,主要使用XPath技术。XPath使用路径表达式来选取XML文档中的节点或者节点集;这些路径表达式与常规操作系统中文件系统路径表达式非常相似。所述路径可以是绝对路径,也可以是相对路径。路径表达式可以具有谓词(predicate),通配符和运算符。XPath还含有超过100个内建标准函数,这些函数用于字符串值、数值、日期和时间比较,节点处理、序列处理、逻辑值等等。然而,现有的DOM解析技术仍然存在性能缺陷,主要表现在:XPath主要根据节点路径及节点属性值等条件字符串表达式,来解析定位XML,解析XPath过程中,主要也是通过遍历节点比较元素名称及元素值的字符串来判断定位;因此,尤其当XML文档处理比较多,文档比较大,层次比较深及条件比较复杂时,其频繁的解析XPath表达式及遍历节点比较字符串会直接体现出解析定位性能慢的缺陷。因此,如何加快对XML文件中节点的寻址(即定位),从而提高对XML文档的解析效率,成为目前亟待解决的技术问题。
技术实现思路
本专利技术正是基于上述问题,提出了一种新的技术方案,可以在二维关系表与XML文件之间进行格式转换时,通过位置标识来加快对节点的寻址操作,从而尤其当XML文档的内容比较多、层次比较深及条件比较复杂时,有助于提高转换效率。有鉴于此,本专利技术提出了一种文档格式转换系统,包括:模板配置模块,用于获取与目标XML文件的格式相同的XML模板文件,以及与待处理的二维关系表的格式相同的标准二维关系表,将所述XML模板文件对应的DOM树中的每个节点的元素信息记录至配置表中,并将所述DOM树中的每个节点与所述标准二维关系表中的参数之间的映射关系存储至所述配置表中;标识生成模块,用于为所述DOM树中的至少一个节点生成对应的位置标识,并与对应的节点相关联地存储所述位置标识;格式转换模块,用于根据所述配置表,将所述待处理的二维关系表中的参数填充至所述XML模板文件中,以生成所述目标XML文件,其中,根据所述位置标识对所述XML模板文件中对应的节点进行寻址。在该技术方案中,不同于直接使用XPath技术对XML文件进行解析时采用的路径信息,本专利技术通过单独为节点生成位置标识,使得该节点可以被依照位置标识来寻得,避免采用路径进行寻址时,对节点的反复遍历,尤其是对于很多节点具有相同的元素名称和甚至部分相同的属性值的情况,能够有效提升对节点的寻址速度,提高对XML的解析效率和对二维关系表的格式转换效率。在上述技术方案中,优选地,所述标识生成模块用于:根据所述DOM树中的任一节点与所述DOM树中的其他节点之间的层级关系,以及所述任一节点与所属层级内的其他节点之间的位置关系,生成所述位置标识,并将所述位置标识存储至所述配置表中。在该技术方案中,通过将XML文件解析为DOM树结构,使得每个节点都能够由层级关系和位置关系进行定位,从而相对于XPath中根据节点路径和节点属性值等条件字符串表达式的定位方式,无需对节点反复遍历,能够有效提高对节点的定位速度和对XML文件的解析效率。在上述任一技术方案中,优选地,所述位置标识包括由至少一个数字段组成的字符串,以表示从根节点至所述任一节点的路径;其中,每个所述数字段在所述字符串中的位置表示所述路径中的当前节点在所述DOM树中所处的层级数,所述每个数字段的数值表示所述当前节点在所属层级中所处的位置。在该技术方案中,每个节点对应的层级关系和位置关系,可以使用具体的字符串来表示,比如字符串中的第一个数字段对应于DOM树的第一层级(根节点不计入,依次向下为第一层级等),该第一个数字段内的数值表示将当前节点和第一层级中的其他节点进行排列时,当前节点所处的位置,比如“06”表示当前节点在第一层级的所有节点中,从预设的起始节点开始,为第6个节点。基于字符串的记录方式,能够清楚明确地体现出每个节点在DOM树中的位置情况,有助于快速实现节点定位。在上述任一技术方案中,优选地,所述标识生成模块还用于:在所述DOM树中的多个层级的节点之间存在嵌套关系时,为所述多个层级的节点中的父节点生成所述位置标识,并根据所述多个层级的节点中的其他节点与所述父节点之间的相对层级关系和相对位置关系,生成对应的相对位置标识,以作为所述多个层级的节点中的其他节点的位置标识。在该技术方案中,对于存在嵌套关系的多个节点,通过生成相对位置标识,使得在解析该嵌套关系时,能够基于该相对位置关系,仅在这多个节点之间进行反复寻址,无需每次都从根节点开始定位,从而有助于提高对该嵌套关系的处理速度。在上述任一技术方案中,优选地,所述标识生成模块用于:为所述至少一个节点生成唯一的注释标识符,以作为所述位置标识;以及将所述注释标识符插入到所述XML模板文件中对应于所述至少一个节点的位置,以建立与所述至少一个节点的关联关系。在该技术方案中,由于注释标识符是唯一的,使得在执行对节点的寻址时,若需要查找某个注释标识符,可以直接且仅查找到对应的一个节点,即查找结果不会由于存在多个名称相同或属性值相同的节点而受到影响,避免对XML文件的反复解析,从而有助于加速对节点的寻址速度,提高对XML文件的解析效率。在上述任一技术方案中,优选地,所述模板配置模块还用于:生成对应于至少一种业务类型的所述XML模板文件及对应的配置表;以及所述格式转换模块还用于:读取所述待处理的二维关系表中的业务类型标记,获取对应于所述业务类型标记的XML模板文件和配置表,以用于对所述待处理的二维关系表进行格式转换。在该技术方案中,当存在多种不同业务类型对应的二维关系表时,不同业务类型对应的二维关系表中包含的参数、参数格式等均可能存在不同,但同一种业务类型对应的二维关系表的格式是固定的,因而通过根据业务类型来生成对应的多种XML模板文件和配置表,即可实现对不本文档来自技高网
...
文档格式转换系统

【技术保护点】
一种文档格式转换系统,其特征在于,包括:模板配置模块,用于获取与目标XML文件的格式相同的XML模板文件,以及与待处理的二维关系表的格式相同的标准二维关系表,将所述XML模板文件对应的DOM树中的每个节点的元素信息记录至配置表中,并将所述DOM树中的每个节点与所述标准二维关系表中的参数之间的映射关系存储至所述配置表中;标识生成模块,用于为所述DOM树中的至少一个节点生成对应的位置标识,并与对应的节点相关联地存储所述位置标识;格式转换模块,用于根据所述配置表,将所述待处理的二维关系表中的参数填充至所述XML模板文件中,以生成所述目标XML文件,其中,根据所述位置标识对所述XML模板文件中对应的节点进行寻址。

【技术特征摘要】
1.一种文档格式转换系统,其特征在于,包括:模板配置模块,用于获取与目标XML文件的格式相同的XML模板文件,以及与待处理的二维关系表的格式相同的标准二维关系表,将所述XML模板文件对应的DOM树中的每个节点的元素信息记录至配置表中,并将所述DOM树中的每个节点与所述标准二维关系表中的参数之间的映射关系存储至所述配置表中;标识生成模块,用于为所述DOM树中的至少一个节点生成对应的位置标识,并与对应的节点相关联地存储所述位置标识;格式转换模块,用于根据所述配置表,将所述待处理的二维关系表中的参数填充至所述XML模板文件中,以生成所述目标XML文件,其中,根据所述位置标识对所述XML模板文件中对应的节点进行寻址;其中,所述标识生成模块用于:根据所述DOM树中的任一节点与所述DOM树中的其他节点之间的层级关系,以及所述任一节点与所属层级内的其他节点之间的位置关系,生成所述位置标识,并将所述位置标识存储至所述配置表中。2.根据权利要求1所述的文档格式转换系统,其特征在于,所述位置标识包括由至少一个数字段组成的字符串,以表示从根节点至所述任一节点的路径;其中,每个所述数字段在所述字符串中的位置表示所述路径中的当前节点在所述DOM树中所处的层级数,所述每个数字段的数值表示所述当前节点在所属层级中所处的位置。3.根据权利要求1所述的文档格式转换系统,其特征在于,所述标识生成模块还用于:在所述DOM树中的多个层级的节点之间存在嵌套关系时,为所述多个层级的节点中的父节点生成所述位置标识,并根据所述多个层级的节点中的其他节点与所述父节点之间的相对层级关系和相对位置关系,生成对应的相对位置标识,以作为所述多个层级的节点中的其他节点的位置标识。4.根据权利要求1所述的文档格式转换系统,其特征在于,所述标识生成模块用于:为所述至少一个节点生成唯一的注释标识符,以作为所述位置标识;以及将所述注释标识符插入到所述XML模板文件中对应于所述至少一个节点的位置,以建立与所述至少一个节点的关联关系。5.根据权利要求1至4中任一项所述的文档格式转换系统,其特征在于,所述模板配置模块还用于:生成对应于至少一种业务类型的所述XML模板文件及对应的配置表;以及所述格式转换模块还用于:读取所述待处理的二维关系表中的业务类型标记,获取对应于所述业务类型标记的XML模板文件和配置...

【专利技术属性】
技术研发人员:李祺罗建军刘晓明孙婷婷
申请(专利权)人:方正国际软件有限公司方正国际软件北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1