【技术实现步骤摘要】
一种同传翻译方法、装置、设备及存储介质
[0001]本申请涉及翻译
,尤其涉及一种同传翻译方法、装置、设备及存储介质。
技术介绍
[0002]机器翻译,又称自动翻译,是利用计算机将一种自然语言(源语言)转换成另一种自然语言(目标语言)的过程。同传翻译(或同声传译),是指在源语言句子尚未结束时同时开始目标语言的产生。
[0003]目前研究较多的是文本
‑
文本的同传翻译和语音
‑
文本的同传翻译。其中,文本
‑
文本的同传翻译往往作为更复杂的语音同传系统的子模块和实时语音识别共同工作,完成语音同传任务,而语音
‑
文本的同传翻译直接端到端的完成源语言语音
‑
目标语言文本的实时翻译过程,语音
‑
文本的同传翻译直接降低了跨语言交流的时间成本,在一系列多语言沟通交流场景下发挥了重要作用,如国际会议、跨语言实时字幕生成等。
[0004]目前的同传翻译方案主要为基于wait
‑
k的同传翻译方案,基于wait
‑
k的同传翻译方案的大致思路是,从输入的第k个数据单位(比如字符)开始翻译,即输入第k个数据单元时,输出一个数据单元,输入第k+1个数据单元时,输出第2个数据单元,以此类推,即输入相对输出固定延迟k步。为了获得较好的同传翻译效果,通常需要设置较低的延迟,然而延迟偏低会导致翻译结果不忠实原文,即翻译质量不佳,为了获得较好的翻译质量,实用中必需采用相对较高的延迟,而过高的延 ...
【技术保护点】
【技术特征摘要】
1.一种同传翻译方法,其特征在于,包括:对当前输入数据单元和当前已获得的输出数据单元进行处理,以获得处理结果;根据所述处理结果预测当前输入数据单元的位置处是否进行数据输出,以及在预测出进行数据输出时,确定输出数据单元并输出;其中,数据输出位置的预测以及所述数据输出位置处输出数据的确定以使翻译质量和翻译延迟共同优化为方向进行。2.根据权利要求1所述的同传翻译方法,其特征在于,所述对当前输入数据单元和当前已获得的输出数据单元进行处理,以获得处理结果,包括:对当前输入数据单元进行编码,以获得当前输入数据单元的编码结果;若需要在当前输入数据单元的位置处进行输出决策,则根据当前输入数据单元的编码结果和历史输入数据单元的编码结果,确定当前输入数据单元对应的上下文向量;根据当前已获得的输出数据单元确定用于预测下一输出数据单元的向量,作为输出数据预测向量;所述根据所述处理结果预测当前输入数据单元的位置处是否进行数据输出,以及在预测出进行数据输出时,确定输出数据单元并输出,包括:根据所述当前输入数据单元对应的上下文向量和所述输出数据预测向量,预测当前输入数据单元的位置处是否进行数据输出,以及在预测出进行数据输出时,确定输出数据单元并输出。3.根据权利要求2所述的同传翻译方法,其特征在于,所述若需要在当前输入数据单元的位置处进行输出决策,则根据当前输入数据单元的编码结果和历史输入数据单元的编码结果,确定当前输入数据单元对应的上下文向量,包括:若根据预设的决策步长确定需要在当前输入数据单元的位置处进行输出决策,则根据当前输入数据单元的编码结果和历史输入数据单元的编码结果,确定当前输入数据单元对应的上下文向量。4.根据权利要求1所述的同传翻译方法,其特征在于,所述对当前输入数据单元和当前已获得的输出数据单元进行处理,以获得处理结果,根据所述处理结果预测当前输入数据单元的位置处是否进行数据输出,以及在预测出进行数据输出时,确定输出数据单元并输出,包括:利用预先建立的同传翻译模型,对当前输入数据单元和当前已获得的输出数据单元进行处理,并根据处理结果预测当前输入数据单元的位置处是否进行数据输出,以及在预测出进行数据输出时,确定输出数据单元并输出;其中,所述同传翻译模型采用训练数据单元序列训练得到,所述同传翻译模型的训练目标为,联合优化所述同传翻译模型在所述训练数据单元序列上的翻译质量和翻译延迟。5.根据权利要求4所述的同传翻译方法,其特征在于,所述同传翻译模型包括:编码模块、注意力模块、向量预测模块和输出位置及输出数据预测模块;所述编码模块,用于对当前输入数据单元进行编码,以获得当前输入数据单元的编码结果;所述注意力模块,用于确定当前输入数据单元和历史输入数据单元分别对应的权重,并根据确定出的权重、当前输入数据单元的编码结果以及历史输入数据单元的编码结果,
确定当前输入数据单元对应的上下文向量;所述向量预测模块,用于根据当前已获得的输出数据单元确定用于预测下一输出数据单元的向量,作为输出数据预测向量;所述输出位置及输出数据预测模块,用于根据当前输入数据单元对应的上下文向量和所述输出数据预测向量,预测当前输入数据单元的位置处是否进行数据输出,以及在预测出进行数据输出时,确定输出数据单元并输出。6.根据权利要求4所述的同传翻译方法,其特征在于,建立所述同传翻译模型的过程包括:将所述训练数据单元序列中的数据单元依次逐个输入同传翻译模型,以得到所述训练数据单元序列中数据单元对应的预测结果,以及所述训练数据单元序列对应的翻译结果;其中,所述训练数据单元序列中一数据单元对应的预测结果包括:在该数据单元的位置处输出设定的各数据单元的概率以及不进行输出的概率;根据所述训练数据单元序列中数据单元对应的预测结果,以及所述训练数据单元序列到对应翻译结果的所有可能的同传路径,确定同传翻译模型在翻译质量这一维度上的预测损失以及在翻译延迟这一维度上的预测损失;根据所述同传翻译模型在翻译质量这一维度上的预测损失以及在翻译延迟这一维度上的预测损失,更新同传翻译模型的参数。7.根据权利权利要求6所述的同传翻译方法,其特征在于,所述根据所述训练数据单元序列中数据单元对应的预测结果,以及所述训练数据单元序列到对应翻译结果的所有可能的同传路径,确定同传翻译模型在翻译质量这一维度上的预测损失以及在翻译延迟这一维度上的预测损失,包括:根据所述训练数据单元序列中数据单元对应的预测结果,确定所述所有可能的同传路径的概率和;根据所述所有可能的同传路径的概率和,确定所述同传翻译模型在翻译质量这一维度上的预测损失;根据所述...
【专利技术属性】
技术研发人员:刘丹,李小喜,刘俊华,魏思,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。