使用XML表示电子字典数据的方法技术

技术编号:2912385 阅读:434 留言:0更新日期:2012-04-11 18:40
本发明专利技术是一种使用可扩展标记语言(简称为XML)表示电子字典数据的方法,其通过产生更具结构性、标准性及可读性的XML文件作为中间过渡的数据文件,可以克服出版商提供的原始数据和应用到电子字典硬件上的二进制数据之间差别太大的问题,且由于统一的规范定义了不同的原始数据的方式,当修改了二进制数据后,只要修改负责从XML文件生成二进制数据的转换程序即可,大大降低测试难度及工作量。

【技术实现步骤摘要】

本专利技术涉及的是一种表示电子字典数据的方法,更确切地说是涉及一种使用可扩展标记语言(eXtensible Markup Language,简称为XML)表示电子字典数据的方法。
技术介绍
随着数字化时代的来临,学习也逐渐走向电子化、信息化,电子字典或词典(electronic dictionary)的普及,大大减少了人们学习时烦琐的查阅数据的时间。除了电子字典机,目前手机、个人数字助理(PDA)、MP3或MP4等产品纷纷加入了电子字典功能。对于开发者而言,处理电子字典数据的做法通常是针对出版商所提供不同格式的原始数据,通过相应的程序来生成最终应用到硬件上的二进制数据。当这些二进制数据的格式被修改后,原先用来生成这些二进制数据的程序都必须做相应的修改。而使用二进制数据调试、查找错误及修正都会比较麻烦而容易出错,尤其面对电子字典越来越庞大的数据量,更是使得测试工作相加繁重。为了解决出版商所提供的原始数据和应用到硬件上的二进制数据之间差别太大的问题,建立一种中间过渡的数据文件是非常必要的。
技术实现思路
本专利技术的目的就是在提供一种使用可扩展标记语言(XML)表示电子字典数据的方法,用以本文档来自技高网...

【技术保护点】
一种使用可扩展标记语言表示电子字典数据的方法,其特征在于,其包括: 将各种原始数据通过相应的处理程序,以生成相应的可扩展标记语言文件,所述的原始数据是由各出版商提供以应用在电子字典的文本数据;以及 将这些可扩展标记语言文件通过一个转换程序,以生成相应的二进制数据,所述的二进制数据用来应用到电子字典硬件上;其中,所述的可扩展标记语言文件的生成规则包括: (1)所述的可扩展标记语言文件定义了一个根节点,这个根节点其下包括一个格式信息节点、至少一个纪录节点及一些根节点属性,所述的根节点属性可用来提供这个根节点的基本信息; (2)所述的格式信息节点定义了电子字典数据统一的排版信息,其包括至少一格式类型...

【技术特征摘要】
1、一种使用可扩展标记语言表示电子字典数据的方法,其特征在于,其包括:将各种原始数据通过相应的处理程序,以生成相应的可扩展标记语言文件,所述的原始数据是由各出版商提供以应用在电子字典的文本数据;以及将这些可扩展标记语言文件通过一个转换程序,以生成相应的二进制数据,所述的二进制数据用来应用到电子字典硬件上;其中,所述的可扩展标记语言文件的生成规则包括:(1)所述的可扩展标记语言文件定义了一个根节点,这个根节点其下包括一个格式信息节点、至少一个纪录节点及一些根节点属性,所述的根节点属性可用来提供这个根节点的基本信息;(2)所述的格式信息节点定义了电子字典数据统一的排版信息,其包括至少一格式类型节点,且所述的格式类型节点包括类型属性及排版方式属性,其中类型属性内容为所欲统一排版的对象,排版方式属性的内容规范排版方式;以及(3)所述的纪录节点用来包含电子字典数据中每一个词条的可见内容和用于程序处理的检索信息及其它标志信息,所述的纪录节点其下包含一个标题节点、至少一个显示页节点和一些纪录节点属性;其中,(a)所述的纪录节点属性内容记载了纪录节点所对应的词条的唯一辨识码,它标识了词条在整个电子字典数据中的位置;(b)所述的标题节点其下包括一个检索输入方式节点、至少一个检索结果显示节点和一个显示段落节点,其中所述的检索输入方式节点包含了检索用的方式及字符串,所述的检索结果显示节点则用于包含检索时结果的显示,而所述的显示段落节点内容则是显示时的标题段落,其下包括至少一个...

【专利技术属性】
技术研发人员:陆春勇顾周怡
申请(专利权)人:金宝电子中国有限公司
类型:发明
国别省市:44[中国|广东]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1