基于动态窗口的翻译处理方法和装置制造方法及图纸

技术编号:22186342 阅读:38 留言:0更新日期:2019-09-25 03:42
本发明专利技术提出了一种基于动态窗口的翻译处理方法和装置,其中,方法包括:按照预设的窗口滑动参数控制目标窗口在输入的源端词语中滑动;将翻译后的目标词与目标窗口当前范围内的目标词进行相似度计算;根据相似度计算结果进行语音合成输出目标译文。由此,降低了同声传译的翻译延时,提高了翻译效率。

Translation Processing Method and Device Based on Dynamic Window

【技术实现步骤摘要】
基于动态窗口的翻译处理方法和装置
本专利技术涉及语音处理
,尤其涉及一种基于动态窗口的翻译处理方法和装置。
技术介绍
通常,在进行同声传译过程中,先对待翻译的语音信号进行识别,然后进行句子边界识别,识别出一个句子。通过标点符号标注模型对句子进行处理,形成一个完整的可被翻译的句子,经过机器翻译引擎进行目标译文的生成。然而,上述翻译过程,从演讲者开始语音输出到最后生成目标端的译文,环节较多,延时较大。例如在英中同声传译场景中,往往需要等待演讲者的停顿进行断句,在接收几秒甚至十几秒后内容后,才能识别出一个完整的句子,进行译文生成。
技术实现思路
为此,本专利技术的第一个目的在于提出一种基于动态窗口的翻译处理方法,降低了同声传译的翻译延时,提高了翻译效率。本专利技术的第二个目的在于提出一种基于动态窗口的翻译处理装置。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种计算机可读存储介质。本专利技术第一方面实施例提出了一种基于动态窗口的翻译处理方法,包括以下步骤:按照预设的窗口滑动参数控制目标窗口在输入的源端词语中滑动;将翻译后的目标词与所述目标窗口当前范围内的目标源端词语进行相似度计算;根据相似度计算结果进行语音合成输出目标译文。另外,本专利技术实施例的基于动态窗口的翻译处理方法,还具有如下附加的技术特征:可选地,在所述按照预设的窗口滑动参数控制目标窗口在输入的源端词语中滑动之前,还包括:判断当前输入的源端词语的长度是否满足所述目标窗口的初始长度;若获知所述当前输入的源端词语的长度满足所述目标窗口的初始长度,则对所述述当前输入的源端词语进行翻译生成目标词。可选地,还包括:根据对齐方法计算每个词的对齐关系,获取样本目标词对应的样本源端词句;根据所述样本目标词对应的样本源端词句训练所述目标窗口的初始长度。可选地,所述按照预设的窗口滑动参数控制目标窗口在输入的源端词语中滑动,包括:获取所述目标窗口当前的起始位置和结束位置;根据预设函数和预设阈值计算所述起始位置和所述结束位置的状态值;根据所述起始位置和所述结束位置的状态值控制所述目标窗口在输入的源端词语中滑动。可选地,在所述按照预设的窗口滑动参数控制目标窗口在输入的源端词语中滑动之前,还包括:根据所述目标窗口当前的起始位置和输入的源端词语的当前位置获取预调整序列;若根据预先训练的调序函数确定所述输入的源端词语的当前位置与所述目标窗口对应的词语语义相似度满足预设条件,则对所述预调整序列进行词语位置的调整。本专利技术第二方面实施例提出了一种基于动态窗口的翻译处理装置,包括:滑动模块,用于按照预设的窗口滑动参数控制目标窗口在输入的源端词语中滑动;计算模块,用于将翻译后的目标词与所述目标窗口当前范围内的目标源端词语进行相似度计算;合成模块,用于根据相似度计算结果进行语音合成输出目标译文。另外,本专利技术实施例的基于动态窗口的翻译处理装置,还具有如下附加的技术特征:可选地,还包括:判断模块,用于判断当前输入的源端词语的长度是否满足所述目标窗口的初始长度;生成模块,用于在获知所述当前输入的源端词语的长度满足所述目标窗口的初始长度时,对所述述当前输入的源端词语进行翻译生成目标词。可选地,所述滑动模块,包括:获取单元,用于获取所述目标窗口当前的起始位置和结束位置;计算单元,用于根据预设函数和预设阈值计算所述起始位置和所述结束位置的状态值;控制单元,用于根据所述起始位置和所述结束位置的状态值控制所述目标窗口在输入的源端词语中滑动。可选地,还包括:获取模块,用于根据所述目标窗口当前的起始位置和输入的源端词语的当前位置获取预调整序列;调整模块,用于在根据预先训练的调序函数确定所述输入的源端词语的当前位置与所述目标窗口对应的词语语义相似度满足预设条件时,对所述预调整序列进行词语位置的调整。本专利技术第三方面实施例提出了一种计算机设备,包括处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如第一方面实施例所述的基于动态窗口的翻译处理方法。本专利技术第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面实施例所述的基于动态窗口的翻译处理方法。本专利技术实施例提供的技术方案至少具有如下附加的技术特征:能够根据演讲者内容,动态调整注意力的窗口大小,实时生成译文,降低同声传译时延。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是现有技术的同声传译的流程示意图;图2是根据本专利技术一个实施例的基于动态窗口的翻译处理方法的流程图;图3是根据本专利技术一个实施例的注意力机制的注意力计算示意图;图4是根据本专利技术另一个实施例的注意力机制的注意力计算示意图;图5是根据本专利技术一个实施例的动态窗口的动态变化示意图;图6是根据本专利技术一个实施例的基于动态窗口的翻译处理装置的结构示意图;图7是根据本专利技术另一个实施例的基于动态窗口的翻译处理装置的结构示意图;图8是根据本专利技术又一个实施例的基于动态窗口的翻译处理装置的结构示意图;以及图9是根据本专利技术还一个实施例的基于动态窗口的翻译处理装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。针对上述
技术介绍
中提到的,在传统的同声传译过程中,如图1所示,需要先识别语音,基于识别到的语音中的停顿进行自动断句,进而,在断句后识别出句号等标点所在的位置,基于标点识别的位置进行标点的添加,将添加标点后的语音信息进行机器翻译,进而,根据翻译后的文本进行语音合成输出,在该方法中,在一定程度上都会造成延时很大,例如演讲者可能语速较快,说完十几秒后才停顿。或者语音识别错误造成断句模块准确率下降,十几秒后才判断出是否是一个完整的句子,翻译的延时较大。为了解决上述技术问题,本专利技术提出一种利用动态窗口注意力机制的同声传译装置,无需等待演讲者说完一个完整的句子,可以动态的滑动注意力窗口,实时生成目标译文。具体而言,图2是根据本专利技术一个实施例的基于动态窗口的翻译处理方法的流程图,如图2所示,该方法包括:步骤101,按照预设的窗口滑动参数控制目标窗口在输入的源端词语中滑动。其中,源端词语为接收到的待翻译的词语。可以理解,在本申请实施例中,采用端到端的神经网络翻译模型,在神经网络翻译模型中,注意力模块对于翻译质量的提升起着非常重要的作用。在实际应用中,如图3所示,基于注意力模块的注意力机制可以实现输入的远端词句和翻译后的语句的相似度的识别,基于相似度确定目标词中比较重要的需要重点关注的词,参照图3(图中以灰度值标识相似度,灰度值越高,相似度越高),与翻译后的目标词越相似的词可能就是越需要关注的词,需要赋予较高的权重等,由此,来目标词进行不同词的注意力的调整,使得在后续得到目标译文时可以提高翻译的质量。当然,考虑到在如图3所示的注意力机制中,仍然是以的得到的整个句子作为注意力处理的基础,要求模型能够得到源端词句所有的词(完整的句子)后,才能进行注意力计算。而得本文档来自技高网
...

【技术保护点】
1.一种基于动态窗口的翻译处理方法,其特征在于,包括以下步骤:按照预设的窗口滑动参数控制目标窗口在输入的源端词语中滑动;将翻译后的目标词与所述目标窗口当前范围内的目标源端词语进行相似度计算;根据相似度计算结果进行语音合成输出目标译文。

【技术特征摘要】
1.一种基于动态窗口的翻译处理方法,其特征在于,包括以下步骤:按照预设的窗口滑动参数控制目标窗口在输入的源端词语中滑动;将翻译后的目标词与所述目标窗口当前范围内的目标源端词语进行相似度计算;根据相似度计算结果进行语音合成输出目标译文。2.如权利要求1所述的方法,其特征在于,在所述按照预设的窗口滑动参数控制目标窗口在输入的源端词语中滑动之前,还包括:判断当前输入的源端词语的长度是否满足所述目标窗口的初始长度;若获知所述当前输入的源端词语的长度满足所述目标窗口的初始长度,则对所述述当前输入的源端词语进行翻译生成目标词。3.如权利要求2所述的方法,其特征在于,还包括:根据对齐方法计算每个词的对齐关系,获取样本目标词对应的样本源端词句;根据所述样本目标词对应的样本源端词句训练所述目标窗口的初始长度。4.如权利要求1所述的方法,其特征在于,所述按照预设的窗口滑动参数控制目标窗口在输入的源端词语中滑动,包括:获取所述目标窗口当前的起始位置和结束位置;根据预设函数和预设阈值计算所述起始位置和所述结束位置的状态值;根据所述起始位置和所述结束位置的状态值控制所述目标窗口在输入的源端词语中滑动。5.如权利要求1所述的方法,其特征在于,在所述按照预设的窗口滑动参数控制目标窗口在输入的源端词语中滑动之前,还包括:根据所述目标窗口当前的起始位置和输入的源端词语的当前位置获取预调整序列;若根据预先训练的调序函数确定所述输入的源端词语的当前位置与所述目标窗口对应的词语语义相似度满足预设条件,则对所述预调整序列进行词语位置的调整。6.一种基于动态窗口的翻译处理装置,其特征在于,包括:滑动模块,用于...

【专利技术属性】
技术研发人员:熊皓张睿卿张传强何中军吴华李芝王海峰
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1