System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 嵌入式翻译模型的训练方法、翻译方法、训练装置制造方法及图纸_技高网

嵌入式翻译模型的训练方法、翻译方法、训练装置制造方法及图纸

技术编号:40229335 阅读:5 留言:0更新日期:2024-02-02 22:32
本申请属于嵌入式翻译技术领域,公开了一种嵌入式翻译模型的训练方法、翻译方法、训练装置、存储介质、设备和计算机程序产品,包括:获取与多个语种一一对应的多个语料库;根据嵌入式翻译模型包括的与每个语种对应的嵌入模块,确定每个语种的采样比例值;按照与语种对应的采样比例值,从与语种对应的语料库中提取训练语料以对所述语种对应的嵌入模块进行训练,获得嵌入式翻译模型的训练后的嵌入模块。在进行嵌入式翻译模型的训练时,针对语料资源进行了分析,调整了简单与复杂语料的训练量,解决了相关技术中,由于语料资源不平衡,造成对于训练采样不平衡的问题。

【技术实现步骤摘要】

本申请属于嵌入式翻译,具体涉及一种嵌入式翻译模型的训练方法、翻译方法、训练装置、存储介质、设备和计算机程序产品。


技术介绍

1、嵌入式翻译具有模块化的可插拔性,在多语翻译场景下,调用不同的嵌入模块到基座模型中,即可实现语种源为多语种的翻译。

2、目前,对于嵌入式翻译模型的训练主要目的在于训练嵌入模块的相关参数,现有方法为按语种的原始语料分布来确定采样比例,如果某个语种数据量占比较大,则采样比例也相应增加;反之对于低资源语种,则采样比例也相应减小。

3、这些方式会造成在训练过程中对于收敛能力较差的语种得不到充分的训练,最终造成采样不平衡的训练结果。


技术实现思路

1、本申请旨在提供一种嵌入式翻译模型的训练方法、翻译方法、训练装置、存储介质、设备和计算机程序产品,至少解决了由于语料资源不平衡,造成训练采样不平衡的问题。

2、第一方面,本申请实施例公开了一种嵌入式翻译模型的训练方法,包括:获取与多个语种一一对应的多个语料库;不同所述语料库的训练语料一一对应,且具有对应关系的训练语料的语义相同;根据嵌入式翻译模型包括的与每个所述语种对应的嵌入模块,确定每个语种的采样比例值;按照与所述语种对应的采样比例值,从与所述语种对应的语料库中提取训练语料以对所述语种对应的嵌入模块进行训练,获得嵌入式翻译模型的训练后的嵌入模块。

3、第二方面,本申请实施例还公开了一种嵌入式翻译方法,包括:确定待处理文本的语种;根据所述待处理文本的语种,将与所述语种对应的嵌入模块嵌入翻译模块,获得可运行模型;所述嵌入模块由如第一方面所述的方法训练获得;将所述待处理文本输入所述可运行模型,获得翻译结果。

4、第三方面,本申请实施例还公开了一种嵌入式翻译模型的训练装置,包括:训练集构建模块,用于获取与多个语种一一对应的多个语料库;不同所述语料库的训练语料一一对应,且具有对应关系的训练语料的语义相同;采样比例计算模块,用于根据嵌入式翻译模型包括的与每个所述语种对应的嵌入模块,确定每个语种的采样比例值;嵌入训练模块,用于按照与所述语种对应的采样比例值,从与所述语种对应的语料库中提取训练语料以对所述语种对应的嵌入模块进行训练,获得嵌入式翻译模型的训练后的嵌入模块。

5、第四方面,本申请实施例还公开了一种嵌入式翻译装置,其特征在于,包括:语种判断模块,用于确定待处理文本的语种;前翻译模块,用于根据所述待处理文本的语种,将与所述语种对应的嵌入模块嵌入翻译模块,获得可运行模型;所述嵌入模块由如第一方面所述的方法训练获得;后翻译模块,用于将所述待处理文本输入所述可运行模型,获得翻译结果。

6、第五方面,本申请实施例还公开了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面或第二方面所述的方法。

7、第六方面,本申请实施例还公开了一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面或第二方面所述的方法的步骤。

8、第七方面,本申请实施例还公开了一种计算机程序产品,其特征在于,所述计算机程序产品上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面或第二方面所述的方法的步骤。

9、综上,在本申请实施例中,通过获取与多个语种一一对应的多个语料库,并根据嵌入式翻译模型包括的与每个所述语种对应的嵌入模块,确定每个语种的采样比例值,以按照与所述语种对应的采样比例值,从与所述语种对应的语料库中提取训练语料以对所述语种对应的嵌入模块进行训练,从而获得训练后的嵌入式翻译模型的嵌入模块。由此,基于本申请实施例的方法,在进行嵌入式翻译模型的训练时,通过针对不同语种的语料资源进行分析,根据语料自身的属性确定了不同语种的适当的采样比例,进而可以通过采样比例调控对应于不同语种的嵌入模块的训练量,解决了嵌入式翻译模型的训练过程中,训练采样不平衡的问题。

本文档来自技高网...

【技术保护点】

1.一种嵌入式翻译模型的训练方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述嵌入式翻译模型还包括翻译模块,所述根据嵌入式翻译模型包括的与每个所述语种对应的嵌入模块,确定每个语种的采样比例值,包括:

3.如权利要求2所述的方法,其特征在于,所述根据所述中间层数据,获得所述嵌入模块对应的语种的拟合程度值,包括:

4.如权利要求1所述的方法,其特征在于,所述按照与所述语种对应的采样比例值,从与所述语种对应的语料库中提取训练语料以对所述语种对应的嵌入模块进行训练,获得嵌入式翻译模型的训练后的嵌入模块,包括:

5.如权利要求4所述的方法,其特征在于,所述按照与所述语种对应的采样比例值,从与所述语种对应的语料库中提取训练语料以对所述语种对应的嵌入模块进行训练,获得嵌入式翻译模型的训练后的嵌入模块,还包括:

6.一种嵌入式翻译方法,其特征在于,包括:

7.一种嵌入式翻译模型的训练装置,其特征在于,包括:

8.一种嵌入式翻译装置,其特征在于,包括:

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的方法。

10.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种嵌入式翻译模型的训练方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述嵌入式翻译模型还包括翻译模块,所述根据嵌入式翻译模型包括的与每个所述语种对应的嵌入模块,确定每个语种的采样比例值,包括:

3.如权利要求2所述的方法,其特征在于,所述根据所述中间层数据,获得所述嵌入模块对应的语种的拟合程度值,包括:

4.如权利要求1所述的方法,其特征在于,所述按照与所述语种对应的采样比例值,从与所述语种对应的语料库中提取训练语料以对所述语种对应的嵌入模块进行训练,获得嵌入式翻译模型的训练后的嵌入模块,包括:

5.如权利要求4所述的方法,其特征在于,所述按照与所述语种对应的采样比例值,从与...

【专利技术属性】
技术研发人员:于鹏邢启洲李健陈明武卫东
申请(专利权)人:北京捷通华声科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1