当前位置: 首页 > 专利查询>联合国专利>正文

用于创建通用语言的表达的系统和记录其使用的转换规则的记录介质技术方案

技术编号:2877981 阅读:206 留言:0更新日期:2012-04-11 18:40
用户可以用来以各种语言通信的一种系统。翻译部分(300)参考通用语言字典(200)将构建给定自然语言表达的构成元素,翻译成对应与该构成元素的通用语言元素并输入该通用语言字典(200)。所翻译成的通用语言元素按照该顺序、翻译规则(220)和关于该二元关系的表达的规则进行连接,从而创建以二元关系表达的通用语言的表达。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种用于克服在翻译、解释等中的语言困难,适用于信息交换和/或信息存储的技术。更具体地说,本专利技术涉及一种适于在计算机、网络等中执行的信息交换和信息存储的语言转换技术,并且能够应用于机器翻译、机器解释等方面。
技术介绍
在今天的因特网时代,人们的活动已经遍布全球。在国际活动中,通信(communications)是最重要的。因而,语言上的差异是个重要的事。然而,目前并不存在完美的全球通用语言。即使被广泛使用的英语也不可能是全球通用语言。事实上,人们属于各种语言区,并且他们中的每个都需要通过使用他/她自己的语言通信。当前,为了获得在不同语言之间的通信,需要在这些语言之间进行翻译。在某些情形中,必需在两种语言之间存在能够从这两种语言中翻译出的另一语言。翻译一般依靠人力。或者,已经为一些语言开发了翻译软件,并且也可以为其执行机器翻译。事实上,常规翻译软件分析以一定语言撰写的句子的结构和意思。接着,根据其语法使用要翻译成的单词重新编写所述句子的元素。由此,显然难以实现完美的翻译。即使在两种非常类似的语言之间的翻译也难以实现100%准确。在考虑到人类所使用的语言的前提下,人类在各种场合中、各种条件下创建用语言表达的信息,诸如报告、论文、文学以及娱乐等。以语言书写的信息一般地以诸如印刷形式、数字数据形式等形式、以该信息原始撰写的语言来分别加以存储。可以将所述信息翻译成为不同的语言,还可以翻译成的形式存储。由此,具有相同内容的信息可以以不同的语言来存储。在网络时代不能认为这是有效率的。尤其是,当该内容改变时,不仅需要改变原始文件,而且所改变的部分还必须以所翻译的文本加以翻译。因而,就文件管理而言这也不是有效的方法。一般地,在许多情形中,不会将以一种语言所原始撰写的信息翻译为不同的语言。尤其是很少翻译成多种语言。由此,在使用不同语言的人之间的信息交换自然受到限制。在此条件下,需要开发能够容易和精确地使用各种语言以小的成本在人们之间实现通信的一种系统。另外,需要积累独立于特定语言的信息,并且根据需要将该信息转换成所期望的语言。
技术实现思路
本专利技术的目的之一是提供一种创建通用语言的表达的系统,由此能够容易和精确地使用各种语言以小的成本在各种语言之间实现通信。本专利技术的另一目的之一是提供用于记录为其使用的重写规则的记录介质。为了实现所述目的,根据本专利技术的第一方面,提供一种能够由计算机来处理的创建通用语言的表达的系统,能够基于它转换到其它语言,包括转换规则部分,用于对应于至少一种自然语言来存储重写规则,将参考该规则把自然语言的表达转换到通用语言的表达;以及转换处理部分,用于通过参考存储在转换规则部分中的重写规则将给定自然语言的表达转换为通用语言的表达。其中所述转换规则部分具有作为重写规则的通用语言字典,用于通过构建通用语言的通用语言元素来定义构建自然语言的自然语言元素,它对应于每个自然语言元素具有的信息;以及重写规则,用于规定在根据以自然语言构建的句子安排的通用语言元素之间的连接关系,并且用于以包括两个通用单词的二元关系和指示它们具有一定关系的关系来表达所述连接关系。并且其所述转换处理部分执行用于将构建以给定自然语言表达的自然语言表达的组元,重写为对应于参考通用语言字典使用通用语言字典的通用语言元素的处理、以及用于通过根据在通用语言元素中的次序应用所述重写规则来连接多个重写的通用语言元素的处理、以及用于创建使用根据在二元关系中的表达规则以二元关系表达的通用语言的表达。根据本专利技术的第二方面,提供用于记录与至少一种自然语言兼容的重写规则的记录介质,所述重写规则能够由计算机来处理,在使用自然语言的表达和使用通用语言的表达之间相互转换时参考,所述重写规则具有通用语言字典,用于通过构建通用语言的通用语言元素来定义构建自然语言的自然语言元素,它对应于每个自然语言元素具有的信息;以及重写规则,用于规定在根据在自然语言构建的句子中安排的通用语言元素之间的连接关系,并且用于以包括两个通用单词的二元关系和指示它们具有一定关系的关系来表达所述连接关系。附图说明图1是示出在本专利技术中使用的硬件系统的结构的一例子的方框图;图2是根据本专利技术用于创建通用语言的表达的系统的功能结构的方框图;图3是示意地示出在本专利技术中使用的通用语言字典的结构的例子的解释图;图4是示意地示出在本专利技术中使用的重写规则的结构的例子的解释图;实施本专利技术的最优模式下面将参考附图描述本专利技术的实施例。将通过使用以英语作为自然语言的表达和基于此创建通用语言的表达的情形作为一例子来描述本专利技术。当然,可以基于各种语言创建通用语言的表达。根据本专利技术,要用作创建表达的通用语言是一种能够基本上由计算机处理,并且还适用于经由网络通信的语言。由此,如果其能够由计算机处理,通用语言的符号可以是诸如数字就足够了。然而,它可以是以人们可理解的方式来表达。例如,通用语言中的代码能够等同于特定自然语言中的符号。在本实施例中,使用在通用语言中的符号是基于英语的例子。这是因为英语是广泛使用的语言并且被广泛用作计算机语言的符号。当然,通用语言的符号可以基于非英语语言。或者,它可以是其本身能够被人类理解的人造语言中的符号。图1示出能够用于根据本专利技术构建通用语言的表达系统的硬件系统的结构的例子。图1示出的是一般的计算机系统。即,图1所示的硬件系统具有操作设备10、带有键盘21和鼠标22的输入设备20、带有显示设备31和打印机32的输出设备30,包括硬盘等的存储器设备40、以及用于连接网络的通信控制设备50。其中,输入设备20和输出设备30都是一般术语。因而,例如输出设备30不一定是带有显示设备31和打印机32的设备。操作设备10具有中央处理单元(CPU)11、只读存储器(ROM)12和随机存取存储器(RAM)13。CPU11将应用软件程序装载到RAM13中,并且在存储器设备40中执行相同的安装,以执行不同类型的应用软件的处理。应用软件程序之一是用于执行创建在本实施例中使用的通用语言中的表达的处理的一种程序。该程序是由诸如CD-ROM(只读光盘存储器)和软磁盘的记录介质提供的。另外,该程序可以通过在网络上等从提供程序的服务器上下载来获得。在两种情形中,它都被转换成可执行形式并且存储在根据本实施例的存储器设备40中。另外,根据本实施例,重写规则是用于在自然语言和通用语言之间的转换。像上述程序,该重写规则可以记录在记录介质上的形式来提供。或者可以在网络上获得它们。接着,该重写规则存储于存储器设备40中。图2示出了本实施例的功能结构。如图2所示,该结构包括转换准备处理部分100,用于准备作为通用语言表达的基础的自然语言表达的数据;转换规则部分200,用于存储要参考用于将自然语言的表达转换为通用语言的表达的重写规则,以兼容至少一种自然语言;转换处理部分300,用于通过参考存储在所述转换规则部分200中的重写规则,来执行将由所述转换准备处理部分100给定的自然语言的表达转换为通用语言的表达的转换处理;存储处理部分400,用于执行在存储器设备40中存储所创建的通用语言的表达的处理;以及输出处理部分500,用于执行在创建处理的处理中和创建处理之后输出表达的处理。转换准备处理部分100执行用于参考转换处理部分300采集自然本文档来自技高网
...

【技术保护点】
用于创建能够由计算机处理的通用语言表达的一种系统,并且能够基于它转换到其它语言,包括:转换规则部分,用于通过参考存储在所述转换规则部分中的重写规则将给定自然语言的表达转换到通用语言的表达,转换处理部分,用于通过参考存储在转换规则部分 中的重写规则将给定自然语言的表达转换为通用语言的表达,其中所述转换规则部分具有这样的重写规则:通用语言字典,用于通过构建通用语言的通用语言元素来定义构建自然语言的自然语言元素,它对应于每个自然语言元素具有的信息;以及重写规则,用 于规定在根据自然语言的句子结构安排的通用语言元素之间的连接关系、和用于以包括两个通用单词和指示它们具有一定关系的关系的二元关系来表达所述连接关系;以及其中所述转换处理部分执行用于参考所述通用语言字典将构建给定自然语言的所述表达的自然语言 表达的组元重写为对应其的通用语言字典中的通用语言元素的处理;和用于通过根据在通用语言元素中的次序应用所述重写规则连接多个重写的通用语言元素的处理;和用于根据对应在二元关系中的表达的规则创建以二元关系表达的通用语言的表达。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:内田裕士朱美英
申请(专利权)人:联合国内田裕士朱美英
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1