当前位置: 首页 > 专利查询>鹏城实验室专利>正文

多语言翻译模型的生成方法、翻译方法、终端及介质技术

技术编号:36865977 阅读:84 留言:0更新日期:2023-03-15 19:08
本发明专利技术实施例提供了一种多语言翻译模型的生成方法、翻译方法、终端及存储介质,通过获取多个第一单语语句,对预设自回归语言模型进行训练,生成预训练语言模型;所述预设自回归语言模型由解码器组成;获取多个双语语句对,并将所述双语语句对中互译的两个语句拼接,生成双语训练样本;基于所述双语训练样本对所述预训练语言模型进行训练,生成多语言翻译模型;所述多语言翻译模型用于将给定的源语言翻译出目标语句。通过上述方案,利用稀缺语言资源生成高翻译质量的多语言翻译模型,实现高质量的多语言翻译。量的多语言翻译。量的多语言翻译。

【技术实现步骤摘要】
多语言翻译模型的生成方法、翻译方法、终端及介质


[0001]本专利技术涉及人工智能
,尤其涉及一种多语言翻译模型的 生成方法、翻译方法、终端及计算机可读存储介质。

技术介绍

[0002]机器翻译又称为自动翻译,是利用计算机将一种自然语言(源语 言)转换为另一种自然语言(目标语言)的技术。神经网络翻译模型 是机器翻译的一种实现形式,其依赖于含有大量数据的语料库来进行 翻译模型的训练。但是机器翻译领域中翻译模型所需的训练语句属于 稀缺资源,不论是单语语料还是双语语料都十分的匮乏。
[0003]目前为了通过稀缺的训练语句实现多语言之间的翻译,通常采用 两种方式:第一种方式是通过多个不同的翻译模型(例如中

日、中
‑ꢀ
英、中

俄),可以选定桥接语言实现从源语言到多种目标语言的翻 译(例如英



俄、英



日);第二种方式是基于传统的神经网络 翻译模型,强行将所有的双语语料进行共同训练,最终得到一个涉及本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多语言翻译模型的生成方法,其特征在于,所述多语言翻译模型的生成方法包括:获取多个第一单语语句,对预设自回归语言模型进行训练,生成预训练语言模型;所述预设自回归语言模型由解码器组成;获取多个双语语句对,并将所述双语语句对中互译的两个语句拼接,生成双语训练样本;基于所述双语训练样本对所述预训练语言模型进行训练,生成多语言翻译模型;所述多语言翻译模型用于将给定的源语言翻译出目标语句。2.根据权利要求1所述的多语言翻译模型的生成方法,其特征在于,所述多个第一单语语句由多种语言的单语语句组成;所述多个双语语句对由至少三种互译语种不同的双语语句对组成。3.根据权利要求1所述的多语言翻译模型的生成方法,其特征在于,所述第一单语语句和所述双语语句对中的源语句、目标语句中的至少一种语句采用的语言相同。4.根据权利要求1所述的多语言翻译模型的生成方法,其特征在于,获取多个双语语句对,并将所述双语语句对中互译的两个语句拼接生成双语训练样本,具体包括:确定各双语语句对中源语句的语言标识、目标语句的语言标识,以及由所述源语句翻译至目标语句的翻译标识;按照预设顺序,对所述双语语句对中源语句的语言标识、源语句、翻译标识、目标语句的语言标识以及目标语句进行拼接,生成双语训练样本。5.根据权利要求1所述的多语言翻译模型的生成方法,其特征在于,基于所述双语训练样本对所述预训练语言模型进行训练,生成多语言翻译模型,具体包括:获取多个第二单语语句,并确定各第二单语语句的语言标识;将所述第二单语语句的语言标识以及对应的第二单语语句进行拼接,生成单语训练样本;根据所述单语训练样本以及所述双语训练样本对所述预训练语言模型进行训练,生成所述多语言翻译模型。6.根据权利要求1所述的多语言翻译模型的生成方法,其特征在于,所述第二单语语句和所述双语语句对中的源语句、目标语句中的至少一种语句采用的语言相同。7.根据权利要求1所述的多语言翻译模型的生成方法,其特征在于,所述获取多个第一单语语句,对预设自回归语言模型进行训练,生成预训练语言模型,具体包括:确定各第一单语语句的语系,并将语系相同的第一单语语句组成语系集合;按照所述语系集合,对所述预设自回归语言模型进行训练,生成预训练语言...

【专利技术属性】
技术研发人员:陶恒韬王晖颜达森王进张艳易泽轩
申请(专利权)人:鹏城实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1