可扩展标记语言数据解析方法及装置制造方法及图纸

技术编号:10190475 阅读:152 留言:0更新日期:2014-07-09 10:37
本发明专利技术公开了可扩展标记语言数据解析方法及装置。方法包括:终端根据XML数据格式,确定需要解析的所有结构化XML数据的结构解析起点、结构解析数目以及每个结构化XML数据中包含的各数据项的描述信息;终端解析Web服务器发来的XML数据中的元素关系及属性关系,建立元素关系映射载体和属性关系映射载体;终端根据所述结构解析起点、结构解析数目以及每个XML数据结构中包含的各数据项的描述信息,遍历所述元素关系映射载体和属性关系映射载体,抽取出与所述每个结构化XML数据中包含的各数据项的描述信息匹配的数据的取值。本发明专利技术提高了XML数据解析效率。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了可扩展标记语言数据解析方法及装置。方法包括:终端根据XML数据格式,确定需要解析的所有结构化XML数据的结构解析起点、结构解析数目以及每个结构化XML数据中包含的各数据项的描述信息;终端解析Web服务器发来的XML数据中的元素关系及属性关系,建立元素关系映射载体和属性关系映射载体;终端根据所述结构解析起点、结构解析数目以及每个XML数据结构中包含的各数据项的描述信息,遍历所述元素关系映射载体和属性关系映射载体,抽取出与所述每个结构化XML数据中包含的各数据项的描述信息匹配的数据的取值。本专利技术提高了XML数据解析效率。【专利说明】可扩展标记语言数据解析方法及装置
本专利技术涉及数据处理
,具体涉及可扩展标记语言数据解析方法及装置。
技术介绍
可扩展标记语言(XML, Extensible Markup Language)用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。XML定位于传输和存储数据,其焦点是数据的内容,提供统一的方法来描述和交换独立于应用程序的数据形式。当下很多Web应用均使用XML进行数据传输,先是数据发送方与接收方协商数据格式以及XML文档形式,后由发送方生成XML通过网络链路或其他方式传递至接收方,接收方根据协商XML形式对文档进行解析和数据提取,从而达到远程数据交流的目的。目前Web服务主要是通过本地终端的应用和远程的服务器进行通讯,XML作为数据载体,终端应用获取传输来的XML文档后,根据服务协议对XML进行解析,去逐一理解XML中的元素或属性,然后将所需要的数据提取出来。在此过程中,关注的重点集中于对数据的定义和传输,服务器将各种服务数据组织成不同的XML文档发送至终端应用,终端应用接收到XML以后根据数据协议,对不同的XML实施不同方式的解析。这里可以设想一种Web服务,在用户的终端上部署应用,可以和远端服务器进行数据通信。于是在用户享受Web服务的过程中,该本地应用不断地请求和接收服务器端发送的各种XML,然后针对不同的XML进行解析以获取服务数据。但是Web服务的形式会随着用户体验的增加或者用户的反馈而升级,数据通信的方式会随之改变,当初所定义XML格式会有所扩展,格式数量也会有所增加。由于本地应用对XML的解析总是具有针对性,每种格式都有相应的解析过程,当XML格式变化或数量增加后,本地应用的固件也需要随之升级以适应新的数据形式,导致终端应用的维护工作越发繁琐。
技术实现思路
本专利技术提供XML数据解析方法及装置,以提高XML数据解析效率。本专利技术的技术方案是这样实现的:—种可扩展标记语言XML数据解析方法,该方法包括:终端获取XML数据的协议标识,根据该协议标识确定XML数据格式;根据XML数据格式,确定需要解析的所有结构化XML数据的结构解析起点、结构解析数目以及每个结构化XML数据中包含的各数据项的描述信息,其中,每个数据项的描述信息包括:载体元素深度、父元素标题、载体元素标题、载体属性标题;终端解析Web服务器发来的XML数据中的元素关系及属性关系,建立元素关系映射载体和属性关系映射载体,其中元素关系映射载体包括:元素深度、元素标题、元素取值、第一属性关系、父元素关系、第一子元素关系、前项兄弟元素关系、后项兄弟元素关系,属性关系映射载体包括:属性标题、属性取值、从属元素关系、前项兄弟属性关系、后项兄弟属性关系;终端根据所述结构解析起点、结构解析数目以及每个XML数据结构中包含的各数据项的描述信息,遍历所述元素关系映射载体和属性关系映射载体,抽取出与所述每个结构化XML数据中包含的各数据项的描述信息匹配的数据的取值。所述方法进一步包括:当终端发现XML数据协议版本更新时,或者终端发现自身产生了新的XML数据解析需求时,更新已有的结构化XML数据的结构解析起点、结构解析数目以及每个结构化XML数据中包含的各数据项的描述信息。所述终端确定需要解析的所有结构化XML数据的结构解析起点、结构解析数目以及每个结构化XML数据中包含的各数据项的描述信息之后进一步包括:终端建立结构描述文档,该文档包括:结构解析起点、结构解析数目以及每个结构化XML数据中包含的各数据项的描述信息;同时,终端建立结构参考载体和结构描述载体,所述结构参考载体包括:结构起点、结构数目以及至少一个数据项参考载体,其中,所述结构起点对应结构化描述文档的结构解析起点,所述结构数目对应结构化描述文档的结构解析起点,所述数据项参考载体对应结构化描述文档的数据项描述;所述结构描述载体的数目与所述结构数目相同,每个结构描述载体由至少一个数据项描述载体组成,每个数据项描述载体包括数据项取值和数据项参考载体,所述数据项参考载体对应结构参考载体中同一位置的数据项参考载体。所述终端根据所述结构解析起点、结构解析数目以及每个XML数据结构中包含的各数据项的描述信息,遍历所述元素关系映射载体和属性关系映射载体为:终端根据结构参考载体中的结构起点、结构数目以及至少一个数据项参考载体,遍历所述元素关系映射载体和属性关系映射载体;且,所述终端抽取出与每个结构化XML数据中包含的各数据项的描述信息匹配的数据的取值之后进一步包括:终端将抽取出的数据的取值填充到对应结构描述载体的数据项描述载体的数据取值中。所述终端遍历所述元素关系映射载体和属性关系映射载体包括:终端按照该原则:从根元素节点开始,首先查找元素的属性节点以及属性节点的后项兄弟节点,然后查找元素节点的子节点,再次查找元素节点的后项兄弟节点,遍历所述元素关系映射载体和属性关系映射载体。一种XML数据解析装置,包括:需求结构化描述单元:接收应用模块根据XML数据协议确定的需要解析的所有结构化XML数据的结构解析起点、结构解析数目以及每个结构化XML数据中包含的各数据项的描述信息,其中,每个数据项的描述信息包括:载体元素深度、父元素标题、载体元素标题、载体属性标题;数据关系映射单元:解析Web服务器发来的XML数据中的元素关系及属性关系,建立元素关系映射载体和属性关系映射载体,其中元素关系映射载体包括:元素深度、元素标题、元素取值、第一属性关系、父元素关系、第一子元素关系、前项兄弟元素关系、后项兄弟元素关系,属性关系映射载体包括:属性标题、属性取值、从属元素关系、前项兄弟属性关系、后项兄弟属性关系,将元素关系映射载体和属性关系映射载体发送给解析模块;解析模块:根据需求结构化描述单元中的结构解析起点、结构解析数目以及每个XML数据结构中包含的各数据项的描述信息,遍历数据关系映射单元发来的元素关系映射载体和属性关系映射载体,抽取出与所述每个结构化XML数据中包含的各数据项的描述信息匹配的数据的取值。所述需求结构化描述单元进一步包括:接收应用模块发来的更新的需要解析的所有结构化XML数据的结构解析起点、结构解析数目以及每个结构化XML数据中包含的各数据项的描述信息。所述需求结构化描述单元进一步用于,根据需要解析的所有结构化XML数据的结构解析起点、结构解析数目以及每个结构化XML数据中包含的各数据项的描述信息生成结构描述文档;同时,建立结构参考载体和结构描述载体,所述结构本文档来自技高网
...
可扩展标记语言数据解析方法及装置

【技术保护点】
一种可扩展标记语言XML数据解析方法,其特征在于,该方法包括:终端获取XML数据的协议标识,根据该协议标识确定XML数据格式;根据XML数据格式,确定需要解析的所有结构化XML数据的结构解析起点、结构解析数目以及每个结构化XML数据中包含的各数据项的描述信息,其中,每个数据项的描述信息包括:载体元素深度、父元素标题、载体元素标题、载体属性标题;终端解析Web服务器发来的XML数据中的元素关系及属性关系,建立元素关系映射载体和属性关系映射载体,其中元素关系映射载体包括:元素深度、元素标题、元素取值、第一属性关系、父元素关系、第一子元素关系、前项兄弟元素关系、后项兄弟元素关系,属性关系映射载体包括:属性标题、属性取值、从属元素关系、前项兄弟属性关系、后项兄弟属性关系;终端根据所述结构解析起点、结构解析数目以及每个XML数据结构中包含的各数据项的描述信息,遍历所述元素关系映射载体和属性关系映射载体,抽取出与所述每个结构化XML数据中包含的各数据项的描述信息匹配的数据的取值。

【技术特征摘要】

【专利技术属性】
技术研发人员:吴亮徐永郝刚陈渊深
申请(专利权)人:三星电子中国研发中心三星电子株式会社
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1