一种文档结构描述转换方法、装置及存储介质制造方法及图纸

技术编号:34323999 阅读:41 留言:0更新日期:2022-07-31 00:46
本发明专利技术属于数据处理技术领域,尤其涉及一种文档结构描述转换方法、装置及存储介质,首先由构件输入层通过xstream读取输入的文档结构描述XSD文件内,并将文档结构描述文件以字节流的方式读取到内存中;接着由构件解析层通过dom4j进行解析,读取内存中存储的文档结构描述文件,并将文档结构描述文件中的元素按照字节流顺序进行加载形成dom树结构;接着由构件转换层根据dom树结构的元素解析出的构件,按照层次进行组装,形成实体类结构;最后由构件输出层将实体结构按字节流形式输出存储至数据库。本发明专利技术能够解决现有技术中要通过数据库来回交互读取,解析效率低的问题。解析效率低的问题。解析效率低的问题。

A document structure description conversion method, device and storage medium

【技术实现步骤摘要】
一种文档结构描述转换方法、装置及存储介质


[0001]本专利技术属于数据处理
,尤其涉及一种文档结构描述转换方法、装置及存储介质。

技术介绍

[0002]随着计算机网络技术的不断发展,信息以爆炸式的速度飞速增长,数据形式变得更加的多样化,现行通用的数据交换基本都是基于XML结构文档,而XSD作为描述XML结构的描述文档,可以作为交换的规范,实现各个软件开发商的数据都能够满足行业的规范。
[0003]在XSD数据转换过程中需要针对XSD文件进行解析,由于XSD文件格式信息多种多样,在实际操作时每次都需要针对不同格式的XSD文件进行手工编写代码,以对所述的XSD文件进行解析,此过程费时费力,工作效率低。
[0004]针对此,现有技术的为了提高XSD文件解码效率的方法,首先获取XSD文件格式信息,调取数据库中与该文件格式信息匹配的预设解码程序,通过该预设解码程序进行解码,虽然能够避免手工解码,但是因其首先需要和数据库进行交互,在数据库中查找匹配的解码规则后再将解码规则解析最后再进行解码,和数据库的来回交互读取解析效率较低,并且需本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文档结构描述转换方法,其特征在于:包括:由构件输入层通过xstream读取输入的文档结构描述XSD文件内,并将文档结构描述文件以字节流的方式读取到内存中;由构件解析层通过dom4j进行解析,读取内存中存储的文档结构描述文件,并将文档结构描述文件中的元素按照字节流顺序进行加载形成dom树结构;由构件转换层根据dom树结构的元素解析出的构件,按照层次进行组装,形成实体类结构;由构件输出层将实体结构按字节流形式输出存储至数据库。2.根据权利要求1所述的一种文档结构描述转换方法,其特征在于:所述文档结构描述文件中的元素包括Annotation、ComplexContent、ComplexType、Element、Extension、Restriction、Sequence、SimpleType。3.根据权利要求2所述的一种文档结构描述转换方法,其特征在于:由构件解析层通过dom4j进行解析,读取内存中存储的文档结构描述文件,并将文档结构描述文件中的元素按照字节流顺序进行加载形成dom树结构包括:通过解析包获取内存中XSD文件字节流的每个标签,并实例化对应的对象;按照字节流顺序加载形成dom树。4.根据权利要求1所述的一种文档结构描述转换方法,其特征在于:所述由构件输入层通过xstream读取输入的文档结构描述XSD文件内,并将文档结构描述文件以字节流的方式读取到内存中还包括:将内存中保存的文档结构描述文件的字节流同时存储进数据库中,匹配数据库中存储的实体类结构,并判断是否需要生成实体类结构。5.根据权利要求4所述的一种文档结构描述转换方法,其特征在于:所述将内存中保存的文档结构描述文件的字节流同时存储进数据库中,并匹配数据库中存储的实体类结构具体为:根据预设的相似度阈值比对数据库中存...

【专利技术属性】
技术研发人员:朱如海陈捷
申请(专利权)人:贵州爱信诺航天信息有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1