当前位置: 首页 > 专利查询>西门子公司专利>正文

用于处理XML数据的处理模块、设备和方法技术

技术编号:3939301 阅读:176 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种用于通过使用有限状态自动机处理XML数据的模块和方法,其中所述XML数据基于预先确定的XML范式,并且其中所述有限状态自动机包括基于所述预先确定的XML范式而设置的状态和转换。在所述有限状态自动机中,所述有限状态自动机的涉及所述XML范式的元素或属性的至少一个转换包括长度可变的二进制代码,所述长度可变的二进制代码被配置为对所述XML范式的所述元素或属性进行编码。本发明专利技术提供了在若干技术领域的若干系统或设备中的XML数据的改进处理,其中能够节约所述系统和设备中的存储器资源和处理资源或者成本。

【技术实现步骤摘要】

本专利技术涉及一种用于通过使用有限状态自动机处理XML数据的模块和方法,其中所述XML数据基于预先确定的XML范式(schema),并且其中所述有限状态自动机包括基于 所述预先确定的XML范式而设置的状态和转换。
技术介绍
在当前许多技术、应用、系统、装置等中以及在一些
(工业系统、通信系 统等)中,通过使用可扩展标记语言(XML)执行数据交换。XML是用于创建定制标记语言的 通用规范。XML通常允许用户定义标记元素并且例如使得能够共享结构化数据、对文档进行 编码和/或对数据进行串行化。然而,除了开发XML的可能之外以及XML在一些
以及一些技术环境中的 广泛使用之外,文本XML数据也具有存储器需求庞大、处理时间长的缺陷,并且缺少紧凑性 (compactness)0因此,已经引入了二进制XML格式,以便能够对文本XML数据进行更有效并且更加 节约存储器资源的处理。这样的二进制XML格式例如是用于XML(BiM)的ISO 23001:1 二 进制MPEG格式或者W3C高效XML互换(EXI)。特别地,二进制XML或者二进制可扩展标记语言是指以二进制格式定义XML的紧 凑表示形式的任意规范。二进制XML格式通常减小了 XML文档的大小,并且由此降低了存 储器需求。此外,二进制XML格式例如减少了计算时间和计算资源,这会在执行XML文档或 文件的解析和/或处理时发生。然而,随着诸如BiM或EXI的一些二进制XML格式被具有有限资源的不适于提供 和支持若干这些二进制XML格式的市场系统和设备(例如,诸如家庭TI MSP430的那些小型 uControler)所采用,由于对于每种格式需要有限状态自动机的特定集合,所以这进而需要 额外的存储器资源。因此,当利用若干种二进制XML格式时,仍然存在与存储器需求增加相关的缺点。
技术实现思路
本专利技术的目标是使得能够对数据进行改进的操作和处理,尤其是对若干
的若干系统、应用和/或设备中的XML数据进行改进的操作和处理。该目标通过一种包括根据权利要求1的特征的被配置为用于处理XML数据的处理 模块、一种包括根据权利要求8的特征的设备、一种包括根据权利要求14的特征的方法以 及一种包括根据权利要求15的特征的自动机发生器来实现。本专利技术进一步的实施例是根据相应的从属权利要求提供的。本专利技术的目标通过一种处理模块来实现,所述处理模块被配置为用于通过使用有 限状态自动机对XML数据进行处理,其中-所述XML数据基于预先确定或预先定义的XML范式;_所述有限状态自动机包括状态和转换,所述状态和转换基于所述预先确定的XML范式所设置;并且-所述转换中涉及或定义所述XML范式的元素或属性的至少一个(或每个)转换包括长度可变的二进制代码,即与从特定状态进行的转换的所有代码相比长度可变的二 进制代码,所述长度可变的二进制代码被设置为对所述XML范式的所述元素或属性的例示 (instantiation)进行编码。因此,本专利技术通过对所有若干种格式使用一个有限状态自动机而允许支持若干种二进制XML格式(例如,BiM或EXI),其中所述有限状态自动机是关于预先定义或预先确定 的特定XML范式而提供的。诸如W3C XML范式或IS0/IEC 19757-2 Relax NG的XML范式 通常包括一组规则,XML文档必须遵循这组规则以便根据该范式被认为是“有效的”。以这种方式,能够对XML数据进行改进的操作和处理,其中特别地,显著减少了负责操作和处理XML数据的组件的存储器需求和处理时间。此外,还向相应组件提供了与处 理XML数据相关的有所增加的灵活性,原因在于在此不存在对预先定义的特定二进制XML 格式的约束。根据本专利技术的实施例,所述转换中涉及以所述XML范式所声明的元素或属性的所述至少一个(或每个)转换包括固定长度的二进制代码,即与从特定状态进行的转换的所 有代码相比长度固定的二进制代码,作为进一步的代码,所述固定长度的二进制代码被设 置为对在所述XML范式中所声明的所述元素或属性进行编码。此外,根据本专利技术的实施例,如果所述XML数据是文本XML,则所述处理模块被配 置为将所述文本XML编码为二进制XML格式的XML数据,其中所述有限状态自动机的所述 状态和转换通常被配置为通过使用所述固定长度的二进制代码或者使用向所述转换中的 所述至少一个(或每个)转换分配的所述长度可变的二进制代码将所述文本XML编码为所 述二进制XML格式的所述XML数据,所述至少一个(或每个)转换涉及在所述XML范式中 所声明的元素或属性。以这种方式,所述处理模块作为编码模块。由此,例如所述处理模块能够为了传输 目的而将文本XML编码为二进制XML数据格式。这里必须要注意到的是,根据本专利技术,术语“在所述XML范式中所声明的元素和/ 或属性”需要以通常关于W3C XML范式所定义和使用的常规方式来理解。根据本专利技术的实施例,如果所述XML数据是二进制XML格式的XML数据,则所述处 理模块被配置为将所述二进制XML格式的所述XML数据解码为文本XML,其中所述有限状态 自动机的所述状态和转换被配置为通过使用所述固定长度的二进制代码或者使用向每个 所述转换分配的所述长度可变的二进制代码将所述二进制XML格式的所述XML数据解码为 所述文本XML。以这种方式,所述处理模块用作解码模块。由此,例如所述处理模块能够将以二进 制XML数据格式接收的XML数据解码为文本XML数据格式以便进一步使用XML数据。根据本专利技术的实施例,所述长度可变的二进制代码表示根据二进制XML格式BiM 的代码。IS0/IEC 23001-1 BiM是目前最为普遍使用的二进制XML格式。最初,其被设计为 对MPEG的MPEG-7元数据格式进行编码。例如,这种二进制格式通常开放了在资源有限的系统、特别是嵌入式系统中使用XML的机会。此外,BiM提供了文本XML数据的显著压缩, 并且由此使得能够在传送XML数据时节约带宽。而且,BiM还允许对XML文档的各部分进 行处理,而不仅是处理整个XML文档。例如,XML文档的部分处理能够实现并确保了进一步 的存储器资源节约并且进一步降低了诸如处理时间的处理成本。因此,本专利技术能够支持最为常用的二进制XML格式之一,并且还利用了 BiM的优 势_适合于资源有限的系统、良好的文本XML数据压缩、节约存储器资源、文本XML数据的 部分处理以及降低处理成本。根据本专利技术进一步的实施例,所述固定长度的二进制代码表示根据二进制XML格 式W3C EXI的代码。目前,EXI表示一种新的二进制格式,其改进了与XML的兼容性。EXI表示BiM的 替换方式,并且也可以在资源有限的设备中使用,其中EXI提供以上列出的与BiM相关的优 势,并且还能够在例如也传送对于特定XML范式无效的XML文档的异类网络或环境中良好 地执行数据通信。因此,本专利技术还能够支持未来的二进制XML格式,并且还进一步利用了 EXI的优 势-例如在异类网络或环境中进行良好的数据通信。根据本专利技术的实施例,所生成的有限状态自动机的数目依赖于所述XML范式的所 定义的综合类型的数目-通过使用所述XML范式而根据所述二进制XML格式EXI所生成的第一有限状态 自本文档来自技高网
...

【技术保护点】
一种处理模块(12,12_1,12_2),所述处理模块(12,12_1,12_2)被配置为通过使用有限状态自动机(121,121_1,121_2)对XML数据进行处理,其中:-所述XML数据基于预先确定的XML范式;-所述有限状态自动机(121,121_1,121_2)包括状态(50-57)和转换,所述状态(50-57)和转换基于所述预先确定的XML范式所设置;并且-所述转换中涉及所述XML范式的元素或属性的至少一个转换包括长度可变的二进制代码,所述长度可变的二进制代码被设置为对所述XML范式的所述元素或属性进行编码。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:J霍耶尔S卡比希
申请(专利权)人:西门子公司
类型:发明
国别省市:DE[德国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1