进行多语种口述词语实时翻译的实时翻译装置与方法制造方法及图纸

技术编号:3046442 阅读:252 留言:0更新日期:2012-04-11 18:40
一种实时翻译装置(11),它具有语音接收器或麦克风(101),语音文字转换器(102),接收第一语言并将其翻译成第二选择语言的文字到文字口语翻译装置(103),将翻好的第二选择语言转换成语音输出的文字语音转换器(105)以及发出语音输出的语音发生器或扬声器(211)。还具有第二语音接收器或麦克风(201),语音文字转换器(202),接收第二语言并将其翻译成第一选择语言的文字到文字口语翻译装置(203),将翻好的第一选择语言转换成语音输出的文字语音转换器(105)以及发出语音输出的语音发生器或扬声器(111)。语音到文字的转换与/或文字翻译与/或文字到语音的转换存在着平行处理。两块声卡(151,152)或一块声卡(151)上两个独立工作的信道(151A,151B)可提供第一与第二语音接收器(101,201)与第一与第二扬声器(111,211)。平行处理可由中央处理器(cpu),平行处理技术来进行,或通过软件控制的开关技术进行处理。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及提供多语种“口述词语”交流、会话与/或对话、会议以及对公众讲话系统的实时翻译装置。本专利技术特别涉及旅游、商务或专业翻译的多语种会话翻译装置,但是不限于这些用途。
技术介绍
毋庸置疑,人类具有的最大能力是能用长期进化演变而成的复杂语言进行交流。但是,这也成了人类面临的最大障碍。即使近来在商贸领域以及其他许多涉及世界不同国家人民交流的领域中,人们频繁地使用着“全球化”这个字眼,实现全球化的主要“障碍”还是语言障碍。语言障碍限制了使用许多不同语言之一进行交流的人们相互交流与一对一交流的能力。在许多场合需要用翻译,这些场合包括●在语言不同的异国他乡,旅游者在问路、购物或类似装置最基本场合拼命想让人听懂自己的意思。●商人与使用其不会讲的语言的国家的潜在客户或商业同事通电话。●演讲者想在会议上或通过广播对讲不同语言的听众发表讲话,与之进行交流。但是,翻译装置的创造必然联系到典型的口语翻译的基本结构,或要用自然语言处理系统来处理讲话者发出的语音,用模拟-数字转换器将其转换成数字形式。对该信号进行处理,抽出各种特征,如各不同频率的语音强度以及强度的随时变化。这些特征作为语音识别系统的输入,该系统通常采用隐马尔可夫模型(HMM)技术来识别最可能生成该语音信号的词语序列。语音识别器输出最有可能的词语序列,作为自然语言处理系统的输入。当自然语言处理系统需要生成发音时,它将句子送至将词语转换为语音序列并确定语调类型的模块,并将信息送至语音合成系统,由其生成语音输出。大多数翻译装置看到口语翻译的难度,就口语转换成书面语言,再用一套翻译的规则与范畴对书面语言进行详细分析。自然语言处理系统应用了大量的语言结构知识,包括词语是什幺,词语如何结合成句子,词语的意思是什幺,词语的意思对整句的意思起何作用。但是,如不考虑人类智慧的另一方面——即他们的普遍知识与表达能力,则语言学的知识就不全靠得住。例如,在回答问题或参与谈话时,人不仅要知道所用语言的结构,而且要知道普通常识以及谈话的场景。与自然语言处理有关的不同形式的知识包括语音与音系知识、词法知识、句法知识、语意知识以及语用知识。语音与音系知识是关于单词与语音的联系以及如何发音的。词法知识是关于单词是如何由称为词素的基本单位构成的。词素是语言的最基本单位,例如friendly这个词是从名词friend与后缀“-ly”的意思派生出来的,将名词变成了形容词。句法知识是关于如何将词语结合起来构成正确的句子,确定每个单词在句子中的结构作用,以及什幺短语是什幺其他短语的构成部分的。典型的语言句法结构基于无上下文语法的概念,即从什幺短语从属什幺短语这样的方式阐述句子结构的。这种句法信息往往用树形结构表示。语意知识是关于词语的意思以及这些意思如何结合起来构成句子的意思的。这是研究独立于上下文的意思的——即不考虑句子使用的上下文时的句子意思。句子独立于上下文的意思的表示方式被称为其逻辑形式。逻辑形式将单词可能有的含义代码化,确定单词与短语之间的语意关系。自然语言处理系统还包括将一种表达方式变换成另一种表达方式的翻译处理。例如,将一个句子变换成句法结构与逻辑形式的处理叫解析,是用一个叫解析器的元件进行的。解析器使用单词、词义,即词典,一套定义合法结构的规则,即语法来确定输入句子的句法结构以及逻辑形式。从形式上来说,语言的无上下文语法是一个包括终结词汇、非终结词汇、一套有限的生成规则以及一切生成物的开始符的四元组。非终结词汇与终结词汇是不相交的。一套终结符号被称为语言的词汇。语用知识关心的是如何在不同场合使用句子,以及使用如何影响句子的解释。但是,典型的自然语言处理只取得了有限的成功,因为其处理器只在窄小的框架内工作。自然语言处理器接受输入的句子,按词汇学,将句子划分成的单词,按句法学,确定单词的类型,按语意学理解单词的含义,按语用学确定要产生成的反应,生成概反应。自然语言处理器要使用许多类型的知识,要存贮不同知识结构的不同类型的知识,将其分门别类组织起来。典型的自然语言处理器要用非常复杂的机器。典型的自然语言处理器所用的知识与容量必须降低其复杂性,才能使得自然语言处理器能操作,能应用,因为自然语言处理器必须做到能对输入的句子作出比较正确的反应。自然语言处理器以前所用方法已经发现有许多问题,涉及典型口语翻译系统的许多组件。在口语翻译系统方面,以前有一种方法是将分析句子的句法规则与转换句型或转换规则结合起来。其结果是句法规则与转换规则变得相互依赖,系统变得不标准化,很难扩充或应用于新的翻译领域。在授予索尼公司的第6,266,642号美国专利中,提出了一种口语翻译的方法与便携式装置。但是它要求对至少一种源语言的至少一种源表达采取识别步骤,要识别至少一种源表达的步骤包括对至少一个讲话输入进行操作,生成中间源语言数据结构,用一个模型从中间源语言数据结构生成至少一种源识别假设,从至少一种源识别假设确定最佳源识别假设,从最佳源识别假设生成至少一种源表达。很清楚,这要进行详细的计算机分析,不是便携式或会话翻译装置拿来就可用的。第6,278,968号美国专利也详细说明了一种大型的计算机翻译装置。该专利技术涉及将一种语言翻成另一种语言。更具体地说,该专利技术涉及为至少是部分依据使用者选择要进行翻译的特定话题提供语言翻译。因此,该翻译装置能力有限,不能提供真正的会话翻译。所以,很少有翻译装置从物理硬件与通讯信道着手来提供便携式会话实时翻译装置。应当注意到第6,266,642号美国专利声称提供了一种便携式装置,该专利技术的实施例有一个便携式装置能进行口语翻译。其中有个实施例是一台手提电脑,另一个实施例是手机。便携式实施例可以是自足式的或非自足式的。自足式便携式实施例包括接收自然口语输入,进行翻译以及输出翻好的自然口语的硬件与软件。非自足式的实施例包括接收自然口语输入,将输入数字化以及通过各种通讯方法将数字化的输入传送至进行翻译的远程硬件与软件用的硬件与软件,远程的硬件与软件生成对对用户讲的自然口语。但是,这种翻译装置的结构只允许单向通讯,因此不是适合于双向会话的便携式翻译装置。
技术实现思路
本专利技术的目的是为不同语言间的口述词语障碍提供一种电子解决方案。广义地说,本专利技术提供一种多语种会话翻译装置,该装置有用一个或多个声卡与软件操作的两个声道,对第一个人用一种口述词语讲的话进行翻译,并让用第二种口述词语的第二个人在其讲话被翻译与被第一个人收听的同时或基本同时所收听到,使得两人能在正常时间听懂不同口述词语的正常会话。该翻译装置可以是便携式的或手持的,有内装或附加耳机或类似装置。该系统的其他型号可附加于电话系统或个人讲话系统或类似装置。本专利技术的实时翻译装置包括(a)语音接收器;(b)语音文字转换器;(c)接收第一语言并翻译成第二选择语言的文字至文字口语转换器;(d)将翻好的第二选择语言转换成语音输出的文字语音转换器;以及(e)发出语音输出的扬声器。本专利技术的一种形式的实时翻译装置包括(a)至少一个语音接收器;(b)至少一个语音文字转换器;(c)至少一个接收第一选择语言文字并翻译成第二选择语言文字与/或接收第二选择语言文字并翻译成第一选择语言文字的文字至文字口语转换器;(d)至少一个将翻好的第一与/或第二选择语言转换成语音输出的本文档来自技高网
...

【技术保护点】
一种实时翻译装置,包括(a)语音接收器;(b)语音文字转换器;(c)接收第一语言并翻译成第二选择语言的文字至文字口语转换器;(d)将翻好的第二选择语言转换成语音输出的文字语音转换器;以及(e)发出语音输出的扬声器;其特征是该实时翻译装置作为一种多语种会话翻译装置,有用一个或多个声卡与软件操作的两个声道,对第一个用一种口述词语讲的话进行翻译,并让用第二种口述词语的第二个人在其讲话被翻译与被第一个人收听的同时或基本同时所收听到,使得两人能在正常时间听懂不同口述词语的正常会话。

【技术特征摘要】
AU 2001-12-17 PR9569;US 2002-2-20 10/081,7731.一种实时翻译装置,包括(a)语音接收器;(b)语音文字转换器;(c)接收第一语言并翻译成第二选择语言的文字至文字口语转换器;(d)将翻好的第二选择语言转换成语音输出的文字语音转换器;以及(e)发出语音输出的扬声器;其特征是该实时翻译装置作为一种多语种会话翻译装置,有用一个或多个声卡与软件操作的两个声道,对第一个人用一种口述词语讲的话进行翻译,并让用第二种口述词语的第二个人在其讲话被翻译与被第一个人收听的同时或基本同时所收听到,使得两人能在正常时间听懂不同口述词语的正常会话。2.根据权利要求1所述的翻译装置,其特征是翻译装置是便携式的或手提式的或是一个耳机或类似装置。3.根据权利要求1所述的翻译装置,其特征是能装在电话系统或个人讲话系统或类似装置上。4.一种实时翻译装置;包括(a)至少一个语音接收器;(b)至少一个语音文字转换器;(c)至少一个接收第一选择语言文字并翻译成第二选择语言文字与/或接收第二选择语言文字并翻译成第一选择语言文字的文字至文字口语转换器;(d)至少一个将翻好的第一与/或第二选择语言转换成语音输出的文字语音转换器;以及(e)至少一个发出语音输出的扬声器。5.根据权利要求4所述的翻译装置,其特征是该实时翻译装置包括由两个独立的带软件的电子声音发生器形成的两个声道,这样可在翻成第二选择语言的文字被带软件的第二独立电子声音发生器转换成语音的同时,将正在接收的第一语言的第一语音转换成文字。6.根据权利要求4所述的翻译装置,其特征是独立电子声音发生器是两块个人电脑声卡或类似装置,或是一块个人电脑声卡的两个有独立软件控制的左右信道。7.一种便携式实时翻译装置,包括(a)接收第一与第二选择语音的第一与第二语音接收器;(b)第一与第二语音文字转换器;(c)至少一个接收第一选择语言文字并翻译成第二选择语言文字与/或接收第二选择语言文字并翻译成第一选择语言文字的文字至文字口语转换器;(d)至少一个将翻好的第一与第二选择语言转换成第一与第二语音输出的文字语音转换器;以及(e)第一与第二发出语音输出的扬声器。8.根据权利要求7所述的翻译装置,其特征是具有一种结构,能处理语音到文字或文字到语音的第一与第二转换与/或文字到文字语音翻译过程中的“重叠”,使得接收语音与发出翻好的语音之间的时间滞后在合理的会话时间内,使这个时间小于1秒,最多不超过2秒。9.根据权利要求8所述的翻译装置,其特征是该结构能使语音的翻译与发出用基本上与输入语音的语音片段一致的语音片段进行,形成一个连续的有间隔语音片段流,来模仿会话,最好这样的语音片段是一个句子或句子的一部分。10.根据权利要求7所述的有两个声道的翻译装置,其特征是有“重叠”处理,使得接收、翻译第一语言的第一语音与发出翻好的语音与接收第二语言的第二语音以及翻译与发出第二翻好的语音由独立处理路径同时或显然同时进行。11.根据权利要求10所述的翻译装置,其特征是两个声道包括独立个人电脑声卡或类似装置或一张声卡的独立信道或类似装置。12.根据权利要求10所述的有两个声道的翻译装置,其特征是两个声道包括以保持同时合理实时处理两条路径的速率来开关两条处理路径的开关系统。13.一种提供实时语音翻译的方法,该方法包括的步骤是(a)提供接收第一与第二选择语音的第一与第二语音接收器;(b)提供分别与第一与第二语音接收器相连接的第一与第二发出语音输出的语音扬声器;(c)将上述第一与第二语音接收器来的上述第一与第二选择语音转换成文字;(d)提供从上述第一语音接收器接收第一选择语言文字并翻译成第二选择语言文字与/或接收第二选择语言文字并翻译成第一选择语言文字的文字至文字口语转换器;(e)提供将翻好的第一与第二选择语言转换成第一与第二...

【专利技术属性】
技术研发人员:内维尼加雅拉特尼
申请(专利权)人:内维尼加雅拉特尼
类型:发明
国别省市:AU[澳大利亚]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利