编解码设备、方法和计算机程序技术

技术编号:4484082 阅读:199 留言:0更新日期:2012-04-11 18:40
一种信息处理设备,包括:读出单元,用于从存储单元读出对应关系信息,其中该对应关系信息包括结构化文档的文档结构和用于对该文档结构进行编码的第一代码;验证单元,用于基于该对应关系信息中所包括的文档结构,来验证包括在要处理的结构化文档中的部分的语法是否有效;以及编码单元,用于针对被所述验证单元验证为语法有效的部分,使用所述第一代码来对该结构化文档进行编码。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于对XML数据进行编码和解码的信息处理 技术。
技术介绍
由于诸如XML文档和HTML文档等结构化文档为文本格 式,因此分析这些结构化文档的处理设备主要以文本格式进行 对结构化文档的读/写和保存等。然而,由于结构化文档包括冗 余数据,对作为文本数据的结构化文档进行读/写会占用计算机 的时间。因此,近年来开发了 一种称为二进制XML的4支术,该 技术通过以二进制数据格式表示/处理结构化文档来减小数据 大小。注意,XML表示可扩展标记"i吾言(extensible Markup Language), 而HTML表示超文本才示i己i吾言(HyperText Markup Language)。例如,利用由Sun Microsystems//^司开发的Fast Infoset,通 过按照包括在XML数据中的诸如要素名称和属性名称等词汇 出现在XML数据中的顺序为这些词汇分配编号,来对它们进行 编码。这能够减小XML数据的大小。将表示代码和词汇之间的 对应关系的表称为编码表。注意,在通过如下链接所获得的页 面中详细讨i仑了 Fast Infoset:http:〃www.iso.本文档来自技高网...

【技术保护点】
一种信息处理设备,包括: 读出单元,用于从存储单元读出对应关系信息,其中所述对应关系信息包括结构化文档的文档结构和用于对所述文档结构进行编码的第一代码; 验证单元,用于基于所述对应关系信息中所包括的所述文档结构,来验证包括在要处 理的结构化文档中的部分的语法是否有效;以及 编码单元,用于针对被所述验证单元验证为语法有效的部分,使用所述第一代码来对所述结构化文档进行编码。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:内田均
申请(专利权)人:佳能株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1