一种文本翻译模型训练方法、文本翻译方法及相关装置制造方法及图纸

技术编号:33730751 阅读:28 留言:0更新日期:2022-06-08 21:26
本申请实施例提供一种文本翻译模型训练方法、文本翻译方法及相关装置,能够获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本;根据映射关系对第一语言文本进行标注,得到第一语言文本的标签,标签为第一语言文本对应的目标语言文本;根据第一语言文本和标签对文本翻译模型进行训练,得到训练后的文本翻译模型。由于本申请实施例能够通过映射关系对第一语言文本进行标注,从而得到第一语言文本的标签,如此采用第一语言文本和标签对文本翻译模型进行训练,能够得到翻译精度高的训练后的文本翻译模型,通过采用训练后的文本翻译模型进行翻译,能够提高翻译的准确性和效率。提高翻译的准确性和效率。提高翻译的准确性和效率。

【技术实现步骤摘要】
一种文本翻译模型训练方法、文本翻译方法及相关装置


[0001]本申请涉及人工智能
,具体涉及一种文本翻译模型训练方法、文本翻译方法及相关装置,该相关装置包括文本翻译模型训练装置、文本翻译装置、计算机设备和计算机可读存储介质。

技术介绍

[0002]随着信息化的发展,应用系统越来越繁杂,但是应用和应用之间进行交互需要通过应用的特征串来实现。特征串可以理解为代码,其包括应用的一些重要的配置信息或者基础数据参数信息。
[0003]目前很多时候直接使用中文来对应用的特征串进行描述,可以理解为是使用中文来作为应用的特征串的标识。在应用和应用之间交互的时候,需要通过传递特征串来实现,但是在传递特征串会使用到对特征串进行描述的中文。由于应用系统对中文识别会涉及到对中文的转码问题,导致出现辨识度不够的问题。因此,传递特征串的时候通常会用采用相近含义的英文或拼音,数字,比如少儿教育频道,在传递的特征串的时候使用ChildenEduChannel进行描述。现有会采用人工的方式将中文转化为非中文的形式,但是,采用人工的方式,在开发过程中,可能会由不同的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本翻译模型训练方法,其特征在于,包括:获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本;根据所述映射关系对所述第一语言文本进行标注,得到所述第一语言文本的标签,所述标签为所述第一语言文本对应的目标语言文本;根据所述第一语言文本和所述标签对文本翻译模型进行训练,得到训练后的文本翻译模型。2.根据权利要求1所述的文本翻译模型训练方法,其特征在于,所述获取预设第一语言文本和预设目标语言文本之间的映射关系,包括:获取双语文本,所述双语文本包括第二语言文本和第三语言文本,所述第二语言文本为与所述第一语言文本语言相同的文本,所述第三语言文本为与所述目标语言文本的语言相同的语言文本;对所述第二语言文本进行分词处理,得到第一分词结果;对所述第三语言文本进行分词处理,得到第二分词结果;将所述第一分词结果和所述第二分词结果进行对齐,得到对齐结果;根据所述对齐结果生成所述预设第一语言文本和预设目标语言文本之间的映射关系。3.根据权利要求2所述的文本翻译模型训练方法,其特征在于,所述将所述第一分词结果和所述第二分词结果进行对齐,得到对齐结果,包括:将所述第一分词结果和所述第二分词结果进行对齐,得到初始对齐结果;根据所述第二语言文本的语法规则,对所述初始对齐结果进行对齐,得到对齐结果。4.根据权利要求2所述的文本翻译模型训练方法,其特征在于,所述根据所述对齐结果生成所述预设第一语言文本和预设目标语言文本之间的映射关系,包括:根据所述对齐结果,得到所述第一分词结果和所述第二分词结果的映射关系;根据所述第一分词结果和所述第二分词结果的映射关系生成所述预设第一语言文本和预设目标语言文本之间的映射关系。5.根据权利要求1所述的文本翻译模型训练方法,其特征在于,所述根据所述第一语言文本和所述标签对文本翻译模型进行训练,得到训练后的文本翻译模型,包括:通过所述文本翻译模型对所述第一语言文本进行翻译,得到实际翻译文本;计算所述实际翻译文本和所述第一语言文本的标签之间的损失值;根据所述损失值调整所述文本翻译...

【专利技术属性】
技术研发人员:蒋清峰
申请(专利权)人:深圳TCL新技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1