一种机器与人工翻译相融合的口语翻译方法和装置制造方法及图纸

技术编号:10438331 阅读:166 留言:0更新日期:2014-09-17 14:33
本发明专利技术提出了一种机器与人工翻译相融合的口语翻译方法及装置。所述方法包括:识别连续的语音段落,并对其进行断句切分,得到以句子为单位的输入文本;根据所述输入文本进行数据库搜索,查找是否有对应的目标语句,若有则直接将目标语句以语音输出;使用机器翻译对所述输入文本进行翻译得到目标语句,并对所述目标语句进行置信度打分;由人工翻译所输入文本获得目标语句;根据所述机器翻译的翻译置信度评估以及人工翻译的质量进行评估,并采用语音合成的方法将评估较好的翻译目标语句生成韵律可调的语音输出。

【技术实现步骤摘要】
一种机器与人工翻译相融合的口语翻译方法和装置
本专利技术涉及计算机信息自动处理领域,具体涉及一种机器与人工翻译相融合的口语翻译方法和装置。
技术介绍
自动翻译系统的研究开发已经进行了50年了——事实上自从本世纪40年代电子计算机诞生之日起就开始了计算机应用于语音翻译的探索。从上个世纪80年代末期以来,人们开始致力于语音翻译(Speech-to-speechTranslation)技术的研究。所谓的语音翻译就是让计算机实现从一种语言的语音到另一种语言的语音翻译的过程。其基本设想是,让计算机像人一样充当持不同语言的说话人之间翻译的角色。由于说话人使用的语言一般都是日常生活中的口语,而人们也正希望计算机翻译系统可以接受并实现任意口语语句的翻译,并且,这种希望随着语音识别技术和口语解析技术的快速发展和提高,已经成为不再渺茫的设想。因此,语音翻译又常被称作口语翻译(SpokenLanguageTranslation,SLT)。口语翻译涉及自动语音识别、机器翻译、语音合成等多种学科和技术,因此具有重大的研究意义。在上个世纪90年代早期,伴随着语音识别技术的不断提高,口语翻译逐渐蓬勃发展起来。随着其核心技术的不断发展,口语翻译不再是限定于某个领域内的高质量翻译,而要以实现不同语言之间的交流为目标。口语翻译中的研究侧重于以下几个方面:1)在交互式的语音翻译中挖掘对话结构;2)研究书面语与口语的不同;3)处理系统的性能和鲁棒性问题。近年来,随着语音识别中统计框架的建立,在机器翻译以及口语翻译中越来越多的系统开始使用统计方法进行建模。并且传统的口语翻译系统,由于受到技术限制,只能应用在某些语音受限的环境下,而当前技术的主要挑战是如何解决现实生活中的口语交流问题。具体的应用场景从国际会议(包括体育运动会)信息综合服务到旅游信息咨询等,因此从社会与经济的角度来看,口语翻译(SLT)与我们这个日益全球化的世界有很大的相关性。口语信息表达作为人们日常交流的一种主要沟通方式,语言表达的简洁性和使用范围的广泛性越来越受到人们的重视。开发基于口语信息内容处理的机器翻译系统,在便于使用和携带的嵌入式系统平台上应用成为人们开发实用性机器翻译系统的一个重要内容。但是,口语自身的一些特点使得实用性口语翻译系统的研发困难重重。口语翻译的主要困难在于1)在口语对话、网络聊天等真实场景中,输入的句子往往缺乏规范性,很难扑捉其内在的语法结构信息,造成统计翻译的结果较生硬、稳定性差等问题;2)统计机器翻译是以数据驱动的,其赖以生存的根基是双语数据资源。而在当前的数据积累中,面向口语的双语语料(中英)相当匮乏。因此目前,完全依赖统计方法的口语翻译系统并不能完全满足人们日常生活的广泛需求。3)口语翻译有别于文本翻译,其主要完成不同语言的人群的交流问题,因此其对翻译的实时性要求高,尤其在网络环境下如何优化翻译流程是提高用户体验的关键。
技术实现思路
本专利技术旨在提供一种机器与人工翻译相融合的口语翻译方法,可以解决单纯使用机器进行口语翻译,其结果生硬、稳定性差等问题,并通过不断积累以句子为单位的大规模口语翻译数据库,提高翻译的自动化程度,加速口语翻译系统的市场化进程。根据本专利技术一方面,其提供了一种机器与人工翻译相融合的口语翻译方法,包括:步骤1、识别连续的语音段落,并对其进行断句切分,得到以句子为单位的输入文本;步骤2、根据所述输入文本进行数据库搜索,查找是否有对应的目标语句,若有则直接将目标语句以语音输出,否则转步骤3;步骤3、使用机器翻译对所述输入文本进行翻译得到目标语句,并对所述目标语句进行置信度打分;步骤4、由人工翻译所输入文本获得目标语句;步骤5、根据所述机器翻译的翻译置信度评估以及人工翻译的质量进行评估,并采用语音合成的方法将评估较好的翻译目标语句生成韵律可调的语音输出。根据本专利技术另一方法,其公开了一种机器与人工翻译相融合的口语翻译装置,包括:语音识别与碎片化模块,识别连续的语音段落,并对其进行断句切分,得到以句子为单位的输入文本;模版检索和替换模块,根据所述输入文本进行数据库搜索,查找是否有对应的目标语句,若有则直接将目标语句以语音输出,否则进入第一翻译模块;基于层次短语的机器翻译模块,使用机器翻译对所述输入文本进行翻译得到目标语句,并对所述目标语句进行置信度打分;智能的人工众包翻译模块,由人工翻译所输入文本获得目标语句;质量评估模块,根据所述机器翻译的翻译置信度评估以及人工翻译的质量进行评估,并给出判定的最后翻译结果;语音合成输出模块,采用语音合成的方法将质量评估模块判定出的最后翻译结果生成韵律可调的语音输出。本专利技术提出的上述方案中所述将不同翻译方法的结果以语音合成的方式统一传递给用户,满足了语音交流的实时性需求。为形象传递源语言用户情感,本识别方法通过识别用户情感并以图示或者合成的方式展现给目标语言用户,提高用户应用场景下的体验。本专利技术通过段落断句实现了以句子为单位的人工高质量翻译语料的入库和有效利用,克服了传统人工意译数据难以被统计翻译方法利用的问题;本专利技术通过语音合成将不同翻译方法的结果都稳定得输出为包含情感的语音,能够很好的解决语音翻译中的实时沟通问题;本专利技术可以解决海量移动用户在日常生活、旅游、学习、简单对话等场景下的口语翻译问题,加快口语自动翻译技术的市场化,具有非常重大的实用意义。附图说明图1为本专利技术提出的机器与人工翻译相融合的口语翻译方法流程图;图2为本专利技术对字符串“ABCDEFGH”进行语句切分的示意图;图3为本专利技术所能预见到的未来2年内的用户增长曲线图;图4为本专利技术中翻译置信度评估方法的流程示意图;图5为本专利技术提出的机器与人工翻译相融合的口语翻译装置模拟图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术作进一步的详细说明。参见图1,根据本专利技术机器翻译与人工众包翻译相融合的口语翻译方法的流程如下:S11:通过终端设备输入源语言的语音,将输入的连续语音以语音的自动识别、标点符号的自动添加等为核心进行切分断句,得到翻译所需的以句子为单位的输入文本;S12:每一句文本语料输入系统之后,首先在翻译数据库中进行检索,如果匹配成功,输出检索到的翻译文本,并跳转到步骤S17;S13:若无法检索到相应数据,则启动智能管理模块,通过计算输入句子的复杂度,并结合用户的等级情况决定是否启用人工翻译,同时将数据送入机器翻译模块;S14:基于层次短语的统计机器翻译方法,融合强制对齐的参数训练结果进行翻译置信度评估;S15:如果决定启用人工翻译,则使用人工众包翻译的方法,并在后台使用可视化终端使译员能够完成逐句的文本翻译;S16:根据翻译置信度对机器翻译结果与人工翻译结果进行综合评估,输出较优的翻译文本结果;S17:将输出的翻译文本生成质量稳定的语音输出,可形象传递用户情感,能够很好地解决面对面实时翻译的实际需求。下面通过实施例二详细说明上述方法步骤。步骤S11中连续语音的碎片化处理方法在线连续语音识别中,语音会源源不断的输入到语音识别模块中。尽管特征变换和每帧语音的后验概率可以实时的计算,但解码器和内存却无法承受如果长的语音数据。因此在线连续语音识别中对语音的断句切分非常重要,它不仅是系统稳定运行本文档来自技高网
...
一种机器与人工翻译相融合的口语翻译方法和装置

【技术保护点】
一种机器与人工翻译相融合的口语翻译方法,其特征在于,包括: 步骤1、识别连续的语音段落,并对其进行断句切分,得到以句子为单位的输入文本; 步骤2、根据所述输入文本进行数据库搜索,查找是否有对应的目标语句,若有则直接将目标语句以语音输出,否则转步骤3; 步骤3、使用机器翻译对所述输入文本进行翻译得到目标语句,并对所述目标语句进行置信度打分; 步骤4、由人工翻译所输入文本获得目标语句; 步骤5、根据所述机器翻译的翻译置信度评估以及人工翻译的质量进行评估,并采用语音合成的方法将评估较好的翻译目标语句生成韵律可调的语音输出。

【技术特征摘要】
1.一种机器与人工翻译相融合的口语翻译方法,其特征在于,包括:步骤1、识别连续的语音段落,并对其进行断句切分,得到以句子为单位的输入文本;步骤2、根据所述输入文本进行数据库搜索,查找是否有对应的目标语句,若有则直接将目标语句以语音输出,否则转步骤3;步骤3、使用机器翻译对所述输入文本进行翻译得到目标语句,并对所述目标语句进行置信度打分;步骤4、由人工翻译所输入文本获得目标语句;步骤5、根据所述机器翻译的翻译置信度评估以及人工翻译的质量进行评估,并采用语音合成的方法将评估较好的翻译目标语句生成韵律可调的语音输出;其中,所述步骤3中采用基于层次短语的统计方法的机器翻译系统,输出包含置信度度量的目标语句,其具体过程包括:从双语语料库中抽取海量对齐短语片断,作为知识源“记忆”在存储介质上,对语音识别出的输入文本利用搜索算法匹配短语片段并组合成要翻译的目标语句;并且融合基于强制对齐模型参数训练的置信度计算方法,为每个目标语句生成置信度分数。2.根据权利要求1所述的方法,其特征在于,所述步骤1中进行断句切分,得到以句子为单位的输入文本具体包括:将语音段落为单元输入的连续语音以韵律为主要特征进行切分断句,并结合语音的自动识别、标点符号的自动添加进行断句切分,且在不损失识别率的前提条件下进行。3.根据权利要求1所述的方法,其特征在于,步骤2具体包括:对每一个输入文本,采用融合语义信息的基于向量空间模型的TF-IDF方法计算输入文本与数据库中语句的相似度,进而得到目标语句。4.根据权利要求1所述的方法,其特征在于,在执行步骤4之前还需要如下判断:计算输入文本的复杂度,并结合用户的类别确定是否需要人工翻译。5.如权利要求1-3任一项所述的方法,其特征在于,步骤1中根据不同语言模型的识别概率判断是否断句,其中所述语言模型...

【专利技术属性】
技术研发人员:高鹏
申请(专利权)人:北京紫冬锐意语音科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1