翻译模型的训练方法、翻译方法及设备技术

技术编号:37329008 阅读:14 留言:0更新日期:2023-04-21 23:07
本公开涉及翻译模型的训练方法、翻译方法及设备。提供了一种翻译模型的训练方法,所述翻译模型能够将第一类型的数据转换成第二类型的数据,所述方法包括:将第二类型的样本数据应用于与所述翻译模型相关联的回译模型,以获得训练样本数据,以及基于所述训练样本数据来进行所述翻译模型的训练。来进行所述翻译模型的训练。来进行所述翻译模型的训练。

【技术实现步骤摘要】
翻译模型的训练方法、翻译方法及设备


[0001]本公开涉及信息处理领域,尤其是涉及翻译模型的训练方法、翻译方法及设备。

技术介绍

[0002]语音翻译(Speech Translation,ST)在当前得到广泛应用,其主要用于将源语言的语音表示,例如某种语言的单词、句子、段落等等,翻译成目标语言的内容,使之能够以适当方式呈现给用户。在一种示例实现中,语音翻译旨在将源语言语音翻译成目标语言文本,广泛应用于会议演讲翻译、视频字幕翻译、AR增强翻译等各种场景。

技术实现思路

[0003]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0004]在本公开实施例的第一方面,提供了一种用于翻译模型的训练方法,所述翻译模型能够将第一类型的数据转换成第二类型的数据,所述方法包括:将第二类型的样本数据应用于与所述翻译模型相关联的回译模型,以获得训练样本数据,以及基于所述训练样本数据来进行所述翻译模型的训练。
[0005]在本公开实施例的第二方面,提供了一种翻译方法,所述翻译方法包括:获取根据本公开中任一实施例所述的训练方法训练得到的翻译模型,并且基于所获取的翻译模型,将第一类型的数据翻译为第二类型的数据。
[0006]在本公开实施例的第三方面,提供了一种用于翻译模型的训练装置,所述翻译模型能够将第一类型的数据转换成第二类型的数据,所述装置包括:获得单元,配置为将第二类型的样本数据应用于与所述翻译模型相关联的回译模型,以获得训练样本数据,以及训练单元,配置为基于所述训练样本数据来进行所述翻译模型的训练。
[0007]在本公开实施例的第四方面,提供了一种翻译装置,所述装置包括:获取单元,配置为获取根据本公开任一实施例所述的翻译模型训练方法训练得到的翻译模型,以及翻译单元,配置为基于所获取的翻译模型,将第一类型的数据翻译为第二类型的数据。
[0008]在本公开实施例的第五方面,提供一种电子设备,包括:存储器;和耦接至存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行本公开中所述的任一实施例的方法。
[0009]在本公开实施例的第六方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序在被处理器执行时导致实现本公开中所述的任一实施例的方法。
[0010]在本公开实施例的第七方面,提供一种计算机程序产品,包括指令,该指令在由处理器执行时导致实现本公开中所述的任一实施例的方法。
[0011]在本公开实施例的第八方面,提供一种计算机程序,包括程序代码,该程序代码在由处理器执行时导致实现本公开中所述的任一实施例的方法。
[0012]通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征、方面及其优点将会变得清楚。
附图说明
[0013]下面参照附图说明本公开的优选实施例。此处所说明的附图用来提供对本公开的进一步理解,各附图连同下面的具体描述一起包含在本说明书中并形成说明书的一部分,用于解释本公开。应当理解的是,下面描述中的附图仅仅涉及本公开的一些实施例,而非对本公开构成限制。在附图中:
[0014]图1示意性示出了根据本公开的实施例的翻译操作的示意性概念图。
[0015]图2A示意性示出了根据本公开的实施例的翻译模型训练方法的流程图。
[0016]图2B示意性示出了根据本公开的实施例的翻译方法的流程图。
[0017]图3A示意性示出了根据本公开的实施例的翻译模型训练装置的框图。
[0018]图3B示意性示出了根据本公开的实施例的翻译装置的框图。
[0019]图4A和4B示意性示出了根据本公开的实施例的语音翻译的示例性实现。
[0020]图5示出本公开的电子设备的一些实施例的框图。
[0021]图6示出本公开的电子设备的另一些实施例的框图。
[0022]应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不一定是按照实际的比例关系绘制的。在各附图中使用了相同或相似的附图标记来表示相同或者相似的部件。因此,一旦某一项在一个附图中被定义,则在随后的附图中可能不再对其进行进一步讨论。
具体实施方式
[0023]下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,但是显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。以下对实施例的描述实际上也仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。
[0024]应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值应被解释为仅仅是示例性的,不限制本公开的范围。
[0025]本公开中使用的术语“包括”及其变型意指至少包括后面的元件/特征、但不排除其他元件/特征的开放性术语,即“包括但不限于”。此外,本公开使用的术语“包含”及其变型意指至少包含在其后面的元件/特征、但不排除其他元件/特征的开放性术语,即“包含但不限于”。在本公开上下文中,“包括”与“包含”是同义的。术语“基于”意指“至少部分地基于”。
[0026]整个说明书中所称“一个实施例”、“一些实施例”或“实施例”意味着与实施例结合描述的特定的特征、结构或特性被包括在本专利技术的至少一个实施例中。例如,术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一
些实施例”表示“至少一些实施例”。而且,短语“在一个实施例中”、“在一些实施例中”或“在实施例中”在整个说明书中各个地方的出现不一定全都指的是同一个实施例,但是也可以指同一个实施例。需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0027]需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。除非另有指定,否则“第一”、“第二”等概念并非意图暗示如此描述的对象必须按时间上、空间上、排名上的给定顺序或任何其他方式的给定顺序。
[0028]常规的语音翻译系统可由两部分级联组成:语音识别(ASR)部分先将语音转换为源语言的转写文字(transcript),机器翻译(MT)部分将识别出的转写文字翻译为目标语言的翻译结果(translation)。各个部分通常利用相应的模型来进行操作,诸如语音转换模型、文字翻译模型等。但对于无法转录或转写的语言(本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于翻译模型的训练方法,所述翻译模型能够将第一类型的数据转换成第二类型的数据,所述方法包括:将第二类型的样本数据应用于与所述翻译模型相关联的回译模型,以获得训练样本数据,以及基于所述训练样本数据来进行所述翻译模型的训练。2.根据权利要求1所述的方法,其中,所述第一类型为语音类型和文本类型中的一者,所述第二类型为语音类型和文本类型中的另一者。3.根据权利要求1所述的方法,其中,所述第一类型的数据和所述训练样本类型均为离散形式的语音数据。4.根据权利要求1所述的方法,其中,所述第一类型的数据为连续语音信号,所述训练样本数据为离散形式的语音数据。5.根据权利要求1所述的方法,其中,所述回译模型包括与所述翻译模型相匹配的反向构建的模型。6.根据权利要求1

5中任一项所述的方法,其中,将第二类型的样本数据应用于与所述翻译模型相关联的回译模型,以获得训练样本数据包括:以第二类型的样本数据作为回译模型的输入以得到模型输出数据,以及将模型输出数据或者对模型输出数据进行处理后得到的数据作为训练样本数据,其中,对模型输出数据的处理包括产生数据扰动的处理。7.根据权利要求1所述的方法,其中,所述第一类型的数据包括连续语音信号,并且所述翻译模型包括:离散化单元,被配置为从连续语音信号提取出离散形式的语音数据,以及翻译单元,被配置为将离散形式的语音数据转换为作为第二类型的数据的目标语言文本。8.根据权利要求7所述的方法,其中,回译模型包括与所述翻译单元相匹配地反向构建的模型,其能够由作为第二类型的样本数据的目标语言训练文本得到离散形式的语音数据作为训练样本数据。9.根据权利要求8所述的方法,其中,所述第一类型的数据包括连续语音信号,并且所述翻译模型包括:离散化单元,被配置为从连续语音信号提取出离散形式的语音数据,语音转换单元,被配置为将离散形式的语音数据转换为中间文本数据,以及机器翻译单元,被配置为将中间文本数据转换为作为第二类型的数据的目标语言文本。10.根据权利要求9所述的方法,其中,回译模型包括与所述机器翻译单元相匹配地反向构建的模型,其能够由作为第二类型的样本数据的目标语言训练文本得到特定文本数据作...

【专利技术属性】
技术研发人员:叶蓉张栋王明轩高汝霆
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1