现场维护语音到语音翻译的系统和方法技术方案

技术编号:7133788 阅读:302 留言:0更新日期:2012-04-11 18:40
提供一种更新把第一语言翻译成第二语言的语音到语音翻译系统的、包括书面单词和口语单词的词汇表的方法和设备。所述方法包括把第一语言中的生词添加到第一语言的第一识别字典中,和把描述与所述生词联系起来,其中所述描述包含发音和单词类别信息。随后在与第一语言相关的第一机器翻译模块中更新所述生词和描述。第一机器翻译模块包括第一标注模块、第一翻译模型和第一语言模块,并被配置成把生词翻译成第二语言中的对应翻译单词。可选的是,本发明专利技术可被用于双向或多向翻译。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种跨语种交流的语音到语音翻译系统,更具体地说,涉及一种现场 维护方法和设备,所述方法和设备使用户能够增加新的词条,及在现场改进和修改其系统 的内容和使用,而不需要语言或技术知识或专长。
技术介绍
自动语音识别(ASR)和机器翻译(MT)技术已成熟到可用于为限定领域和非限定 领域开发膝上型计算机或移动设备上的实用语音翻译系统的程度。特别地,关于各种应用 领域(包括旅游、医疗部署和军事应用),在研究领域和研究实验室中开发了领域限定的 语音到语音翻译系统。以前在 A. Waibel,C. Fugen 的 “Spoken language translation,,, Signal Processing Magazine, IEEE,2008 年 5 月;25(3) :70-79, In Proc. HLT,2003 ;和Nguyen Bach, Matthias Eck, Paisarn Charoenpornsawat, Thilo Kdhleri ▲ SebastianStiiker, ThuyLinh Nguyen, Roger Hsiao, Alex Waibel, Stephan Vogel, Tanja Schultz 禾口 Alan W. Black 的“The CMU TransTac 2007 eyes-free and hands-free two-way speech-to-speech translation system,,,In Proc. of the IWSLT, Trento, Italy, 2007 年10月中看到了这样的系统。不过,这些系统受到限制,因为它们借助有限的词汇表工作, 所述词汇表由系统开发人员预先定义,并且由应用领域以及预想的使用所述系统的场所确 定。从而,词汇表和语言用法主要是根据例证情形、并由在这种情形下收集或假定的数据确 定的。不过,在现场(field)情况下,实际的单词和语言用法偏离实验室的预期情形。即 使在诸如旅游之类的简单领域中,当用户旅行到不同的地点,与不同的人互动,和追求不同 的目的和需要时,语言用法也会在现场发生显著变化。从而,总是会出现新的单词和新的措 辞。这种生词-用语音识别的话来说“集外词(00V)”会被误识别为集内词,从而被错误翻 译。用户可尝试释义,不过如果不能输入或者表达关键单词或者概念(例如,人名或城市名 称),那么单词或措辞的缺乏会导致交流中断。尽管需要用户可修改的语音到语音翻译系统,不过迄今为止一直未提出实际的解 决方案。虽然在系统中添加单词看起来容易,不过事实证明进行这种修改格外困难。必须 对整个系统内的许多组件模块进行适当的修改,必须重新训练多数模块,以恢复组件的平 衡和综合功能。事实上,为了学习生词,必须修改或者重新优化大约20个不同模块。这种 修改要求关于语音翻译系统的组件的专门知识和经验,结果,基于专利技术人的理解,迄今为止 只由专家在实验室中进行了这样的修改,它需要专家经验,时间和成本。例如,如果为欧洲用户设计的系统在词汇表中不包含地名“Hong Kong",那么一旦 说话者说出句子“Let' s go to Hong Kong”,系统就会识别词典中发音最近似的单词,从 而产生“Let' s go to home call”。此时,并不明显该错误是识别错误的结果,还是整个语 音到语音翻译系统中缺少该单词的结果。用户于是着手校正系统。这可用几种校正技术之 一来实现。最简单的可能是复述或者键入,不过更有效的是利用如其它公开文献和现有技 术描述的交叉模式纠错技术(Waibel等,美国专利5855000)来实现。一旦确定了期望的单 词序列的正确拼写(“Let' s go to Hong Kong”),系统就进行翻译。如果“Hong Kong” 在词典中,那么系统会根据词典正常继续进行翻译和合成。不过,如果识别和翻译词典中没 有“Hong Kong”,那么系统需要确定该单词是否是命名实体。最后并且最重要的是,即使通 过用户的干预,名称或单词可被正确地翻译成输出语言,但如果不学习所述名称或单词,那 么当用户下次说出相同的单词时,系统会再次失败。不幸的是,仅仅通过在单词表中键入生词,并不能解决学习生词的问题,相反它需 要在语音翻译系统的大约20个不同点,和在语音翻译系统的所有层面做出改变。目前,它 还涉及词条的人工标注和编辑,涉及所需单词的庞大数据库的收集,语言模型概率和翻译 模型概率的再训练,和整个系统的重新优化,以便重新建立所有组件和组件的词典之间的 一致性,以及恢复系统中单词、短语和概念之间的统计平衡(概率必须总和为1,从而单个 单词的添加会影响到所有单词)。结果,现有语音翻译系统的即使微小的修改通常也要求使用研究实验室中的高级 计算工具和语言学资源。不过对实际的现场应用来说,要求每种修改都在实验室中进行是 不可接受的,因为它花费太多的时间,努力和成本。改为需要学习和定制模块,所述学习和 定制模块使用户无法察觉所有的复杂性,在后台半自主地或者自主地进行所有关键的操作 和语言处理步骤,并借助简单的直观界面,以可能的干扰最小的方式与人类用户交互作用, 从而完全消除现场对语言或技术专长的需要。在本专利技术中,我们提供满足这些需要的学习 和定制模块的详细说明。不幸的是,翻译系统通常复杂得惊人,以致用户访问是不实际的,或者用户访问不 被使用。从而,需要使用机器翻译技术、并且赋予用户修改能力以能够提供跨语种交流,而 不需要语言或技术知识或专长的系统和方法,从而使得能够克服语言障碍和使人们更亲r t [ ο
技术实现思路
在各个实施例中,本专利技术通过提供一种更新语音翻译系统的词汇的方法和设备, 解决了上述问题。在各个实施例中,提供一种更新把第一语言翻译成第二语言的语音到语 音翻译系统的、包括书面单词和口语单词的词汇表的方法。所述方法包括把第一语言中的 生词添加到第一语言的第一识别字典中,和把描述与所述生词联系起来,其中所述描述包 含发音和单词类别信息。随后在与第一语言相关的第一机器翻译模块中更新所述生词和描 述。第一机器翻译模块包括第一标注模块、第一翻译模型和第一语言模块,并被配置成把生 词翻译成第二语言中的对应翻译单词。可选的是,对双向翻译来说,所述方法另外包括下述步骤把翻译后的单词从第二 语言回译成第一语言的生词,使所述生词与第二语言中对应的翻译的单词关联,并把翻译的单词及其描述添加到第二语言的第二识别字典中。随后用翻译的单词和描述更新与第二 语言相关的第二机器翻译模块。第二机器翻译模块包含第二标注模块、第二翻译模型和第 ~‘语曰丰旲块ο在实施例中,所述方法还包括下述步骤把第一单词输入与第一语言相关的文本 到语音发音字典中,把第二单词输入与第二语言相关的文本到语音发音字典中。输入信号 可以是不同的模式(例如,说话和非言语的(norwertal)拼写,说话和言语拼写,书写和说 话等)(这里称为“交叉模式”),或者可以是相同的模式(说话和复述,书写和重写,等)。本专利技术的一个实施例目的在于一种现场可维护的语音到语音翻译系统,用于在第 一语言和第二语言之间交流。所述系统包括两个语音识别单元和两个对应的机器翻译单 元,每个语本文档来自技高网
...

【技术保护点】
一种更新把第一语言翻译成第二语言的语音翻译系统的、包括书面单词和口语单词的词汇表的方法,所述方法包括:  把第一语言中的生词添加到第一语言的第一识别字典中;  把描述与所述生词联系起来,其中所述描述包含发音和单词类别信息;和  在与第一语言相关的第一机器翻译模块中更新所述生词和描述,其中第一机器翻译模块包括第一标注模块、第一翻译模型和第一语言模块,并被配置成把生词翻译成第二语言中的对应翻译单词。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:I·R·莱恩
申请(专利权)人:移动技术有限责任公司
类型:发明
国别省市:US

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1