面向用户的电子词典、电子词典系统及其生成方法技术方案

技术编号:2870815 阅读:228 留言:0更新日期:2012-04-11 18:40
一种用于建立/维护面向用户的电子词典的方法,其特征在于包括以下步骤:    定义一个实体对象,用于表示所述电子词典中的词条或词条的属性,在该实体对象中包含实体对象的名称和实体对象的类型;    建立一个实体对象实例库,用于存储由所述实体对象产生的实体对象实例;    定义一个关系对象,用于表示两个实体对象之间的有向关系,在该关系对象中包含:关系对象的类型、源实体对象和目标实体对象;    建立一个关系对象实例库,用于存储由所述关系对象产生的关系对象实例;其中,与所述电子词典中的一个词条相关的所有实体对象实例通过相应的关系对象实例连接在一起形成一个有向关系图;以及    通过对所述实体对象和/或关系对象进行实例化和对所述实体对象实例库和/或关系对象实例库中的实例进行操作,来动态地在所述电子词典中增加词条、增加词条的属性、删除词条或删除词条的属性。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术一般涉及信息处理领域,具体地说,涉及用于信息处理方面的电子词典、电子词典系统及其生成方法。
技术介绍
电子词典被广泛地用于信息处理方面。一般来说,可以将电子词典看成是一个信息收藏库,用于收集数据的属性、特征来源、用法以及与其他数据间的关系等。然而,不同的应用对于电子词典中词条可能具有不同的要求。例如,对于广泛用于机器翻译系统、信息检索系统或自然语言理解系统等文字处理方面的电子词典来说,一种应用要求词典中的词条应包含一个词的词性和词干,而另一种应用可能要求词典中的词条要包含一个词的词意和语义关系。并且在进一步的应用过程中,对于词条的要求也会发生变化。此外,对于电子商务通、个人数字助理等便携式普及运算设备中提供的电子名片夹之类的电子词典来说,不同的用户因为工作性质或业务范围不同,对词典中的词条可能也具有不同的要求。于是,对于电子词典系统来说,具有良好的可重用性和可维护性是非常重要的。在现有的电子词典系统中,将关于一个词条的所有属性(例如在用于文字处理方面的电子词典中,将一个词的词意、词性、词干和发音等)都封装成一个对象。通过不断地将该对象实例化,来生成词典中的各词条。图1,以用于文字处理方面的电子词典为例说明了现有电子词典中存在的问题。如图1(a)所示,在该电子词典中,词条包括词、词性、词意等属性,并且每个属性都是由对象中的一个变量来表示的,具体地说,分别由名称、词性标记、词意数组等来表示。其中,名称用于表示该词条中的词,例如图1(b)中的“fast”;词性标记用于表明该词条中的词的词性,例如,在图1(c)中使用一个8比特字节来描述词的词性,每一比特表明一个特定的词性(名词、动词等),值为“1”时表明词具有该属性;词意数组用于存储该词条中词的所有含义,例如,图1(d)和图1(e)示出了词“fast”的部分词意。在图1所示的这种电子词典中,一旦完成了该数据结构的设计,就无法将新的属性加入到词条中去,除非设计新的数据结构。另一方面,如果一些词条的属性随着用户不断提出新的要求而发生了变化,或者需要向词典中添加新的具有不同属性的词条,则必须用新的对象来表示这些具有不同属性的词条,并且要分别为这些新的对象分配不同的标识符。由于这些对象代表了现实世界中的同一实体一词典中的词条,所以这些对象中的大多数变量都是相同的。于是,产生了大量相似的对象,这将导致对象之间关系复杂化。例如,在图1所示的电子词典中,如果最初词典中的词条仅表示了单个词、词的发音、词性、词意和语义关系,并且使用对象○1来表示它,然而,在实际应用中,可能要求词条中还应包括习惯用语、习惯用语的含义、语义关系和中心词(这里,中心词是习惯用语的核心,决定该习惯用语的基本意义),这时就需要定义另外一个对象○2来表示包括习惯用语及其必要属性的词条。由于对象○1和○2都代表了词典中的词条,而且有许多变量都是相同的,所以造成数据冗余。此外,由于这样的对象具有不同的标识符,所以对于系统调试和维护来说,也是非常费时和费力的。美国专利US 6,356,913中公开了一种可以动态修改的数据库方案。如图2所示,在该专利中使用树形结构来表示一种通用的可以动态修改的数据库方案,包括叶子节点、分枝包容器节点、根节点、属性节点和映射包容器节点,不同的节点具有不同的数据结构。其中,每个叶子节点代表一个属性的一个实例;每个分枝包容器节点对应于一个不同的属性并且可以标识出哪些叶子节点代表了该包容器节点的属性的实例;根节点代表了数据库中的一个记录并且可以标识出在不同的包容器节点中代表了根节点记录的一个属性的一个实例的叶子节点;每个属性节点对应于一个不同的属性并且标识出对应于该属性的分枝包容器节点;并且,映射包容器节点标识出多个属性节点。可以采用以上这种通用的、可动态修改的数据库方案来解决现有电子词典中存在的问题即是否可以对词条的属性进行动态修改的问题。具体来说,使用叶子节点来存储词典中各词条的属性的实例,使用分枝包容器节点来存储每种属性,使用根节点来存储词条,这样,如果需要为某一词条添加新的属性,则就增加一个新的分枝包容器节点,并且使用相应的叶子节点来存储该属性的实例,此外还将该叶子节点连到代表该词条的根节点上。从数据库观点来看,每增加一个新的分枝包容器节点,实际上就是定义一个新表。于是,虽然使用US 6,356,913就可以动态地修改词条中的属性。但是,由于在这种数据库方案中各类节点分别用数据库中的不同的表来实现,并且随着用户提出不同的要求,要不断地增删数据库中的表,于是维护起来是非常麻烦的,不具有可维护性。此外,在树这种数据结构中,每个节点有且仅有一个父节点,即每一层上的数据元素只能和上一层中的一个元素相关(即其父节点),然而在电子词典中,每个子节点的父节点可能不只一个,即存在一个属性可能被几个词条共用的情况。
技术实现思路
于是,为了解决现有电子词典的可重用性问题,以及可维护性问题,本专利技术提出一种用户可以任意地修改(增加、删除)词条中的属性的。在本专利技术中,使用一个实体对象来代表与词条相关的各种信息,例如在用于文字处理方面的电子词典中,使用一个实体对象来代表词典中的词或词的发音、词意、词性、词的形态等,而且使用关系对象来表示两个实体对象之间的关系,并且该关系是有向的,即从源实体对象到目标实体对象的关系。这样,在本专利技术的电子词典中,与词典中的一个词条相关的所有实体对象实例通过相应的关系对象实例连接在一起形成了一个有向关系图。在本专利技术中,由于将与词条相关的各属性单独封装成一个实体对象,这样,当用户需要为词典中的某一词条增加一个新的属性时,只需产生与该属性相对应的实体对象实例,并将该实体对象实例通过相应的关系对象实例连到该词条上,即加入到该词条的有向关系图中,就可以动态地为词条增加属性,而且同时能够维持该词条中的其他属性值不变,于是本专利技术的电子词典具有可重用性。此外,由于在本专利技术中只使用一个实体对象来代表各种属性,所以本专利技术的电子词典同时也具有便于维护的优点。根据本专利技术的一个方面,提供了一种用于建立/维护面向用户的电子词典的方法,其特征在于包括以下步骤定义一个实体对象,用于表示所述电子词典中的词条或词条的属性,在该实体对象中包含实体对象的名称和实体对象的类型;建立一个实体对象实例库,用于存储由所述实体对象产生的实体对象实例;定义一个关系对象,用于表示两个实体对象之间的有向关系,在该关系对象中包含关系对象的类型、源实体对象和目标实体对象;建立一个关系对象实例库,用于存储由所述关系对象产生的关系对象实例;其中,与所述电子词典中的一个词条相关的所有实体对象实例通过相应的关系对象实例连接在一起形成一个有向关系图;以及通过对所述实体对象和/或关系对象进行实例化和对所述实体对象实例库和/或关系对象实例库中的实例进行操作,来动态地在所述电子词典中增加词条、增加词条的属性、删除词条或删除词条的属性。根据本专利技术的另一个方面,提供了一种面向用户的电子词典,包括实体对象实例库用来存储由一个实体对象产生的多个实体对象实例,其中,该实体对象用于表示所述电子词典中的词条或词条的属性,在该实体对象中包含实体对象的名称和实体对象的类型;关系对象实例库用来存储由一个关系对象产生的多个关系对象实例,其中,该关系对本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:刘世霞杨力平
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1