音译模型的训练方法、装置、设备以及存储介质制造方法及图纸

技术编号:35329277 阅读:12 留言:0更新日期:2022-10-26 11:45
本公开提供了一种音译模型的训练方法、装置、设备以及存储介质,涉及深度学习、自然语言处理等人工智能领域,实现方案为:获取第一语种类型的多个待译样本文本;获取与多个待译样本文本分别对应的多个标注样本文本,第一语种类型和第二语种类型不相同,第二语种类型是所述标注样本文本对应的语种类型;确定多个待译样本文本和对应的所述多个标注样本文本之间的多个标注发音信息;以及根据多个待译样本文本、所述多个标注样本文本,以及所述多个标注发音信息训练初始的音译模型,以得到目标音译模型。由此,有效地建模出待译样本文本和标注样本文本之间的发音维度的特征,避免了由于发音歧义对翻译效果的影响,从而提升了翻译准确性和翻译效果。性和翻译效果。性和翻译效果。

【技术实现步骤摘要】
音译模型的训练方法、装置、设备以及存储介质


[0001]本公开涉及计算机
,尤其涉及深度学习、自然语言处理等人工智能
,具体涉及一种音译模型的训练方法、装置、设备以及存储介质。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]相关技术中,通常采用基于规则进行匹配的方法,或者对海量的训练数据进行序列标注,以辅助实际应用当中将语种类型A的输入文本转换为语种类型B的输出文本,这种方式下,可能会由于发音歧义而导致翻译不够准确,翻译效率不高,翻译效果不佳。

技术实现思路

[0004]本公开提供了一种用于音译模型的训练方法、装置、设备以及存储介质。
[0005]根据本公开的第一方面,提供了一种音译模型的训练方法,包括:获取第一语种类型的多个待译样本文本;获取与所述多个待译样本文本分别对应的多个标注样本文本,所述第一语种类型和第二语种类型不相同,所述第二语种类型是所述标注样本文本对应的语种类型;确定所述多个待译样本文本和对应的所述多个标注样本文本之间的多个标注发音信息;以及根据所述多个待译样本文本、所述多个标注样本文本,以及所述多个标注发音信息训练初始的音译模型,以得到目标音译模型。
[0006]根据本公开的第二方面,提供了一种音译方法,包括:获取第一语种类型的待译文本;将所述待译文本输入至如上述的音译模型的训练方法训练得到的目标音译模型之中,以得到所述目标音译模型输出的预测文本,其中,所述第一语种类型和第二语种类型不相同,所述第二语种类型是所述预测文本对应的语种类型。
[0007]根据本公开的第三方面,提供了一种音译模型的训练装置,包括:第一获取模块,用于获取第一语种类型的多个待译样本文本;第二获取模块,用于获取与所述多个待译样本文本分别对应的多个标注样本文本,所述第一语种类型和第二语种类型不相同,所述第二语种类型是所述标注样本文本对应的语种类型;确定模块,用于确定所述多个待译样本文本和对应的所述多个标注样本文本之间的多个标注发音信息;以及训练模块,用于根据所述多个待译样本文本、所述多个标注样本文本,以及所述多个标注发音信息训练初始的音译模型,以得到目标音译模型。
[0008]根据本公开的第四方面,提供了一种音译装置,包括:第三获取模块,用于获取第一语种类型的待译文本;第四获取模块,用于将所述待译文本输入至如上述音译模型的训练装置训练得到的目标音译模型之中,以得到所述目标音译模型输出的预测文本,其中,所
述第一语种类型和第二语种类型不相同,所述第二语种类型是所述预测文本对应的语种类型。
[0009]根据第五方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面所述的音译模型的训练方法,或者执行如第二方面所述的音译方法。
[0010]根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如第一方面所述的音译模型的训练方法,或者执行如第二方面所述的音译方法。
[0011]根据第七方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如第一方面所述的音译模型的训练方法,或者实现如第二方面所述的音译方法。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0014]图1是根据本公开第一实施例的示意图;
[0015]图2是根据本公开第二实施例的示意图;
[0016]图3是根据本公开第三实施例的示意图;
[0017]图4是根据本公开第四实施例的示意图;
[0018]图5是本公开实施例中应用效果示意图;
[0019]图6是本公开实施例中音译方法的流程示意图;
[0020]图7是根据本公开第五实施例的示意图;
[0021]图8是根据本公开第六实施例的示意图;
[0022]图9是根据本公开第七实施例的示意图;
[0023]图10是用来实现本公开实施例的音译模型的训练方法的电子设备的框图。
具体实施方式
[0024]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0025]图1是根据本公开第一实施例的示意图。
[0026]其中,需要说明的是,本实施例的音译模型的训练方法的执行主体为音译模型的训练装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在电子设备中,电子设备可以包括但不限于终端、服务器端等。
[0027]本公开实施例涉及深度学习、自然语言处理等人工智能

[0028]其中,人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于
模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
[0029]深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。深度学习的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
[0030]而自然语言处理,能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
[0031]本公开实施例中,正是为了解决相关技术中可能会由于发音歧义而导致翻译不够准确,翻译效率不高,翻译效果不佳的技术问题,提供了一种译模型的训练方法,由于该音译模型是参考多个待译样本文本和对应的多个标注样本文本之间的多个标注发音信息来训练得到的,从而能够有效地建模出待译样本文本和标注样本文本之间的发音维度的特征,避免了由于发音歧义对翻译效果的影响,从而提升了翻译准确性和翻译效果。
[0032]如图1所示,该音译模型的训练方法包括:
[0033]S101:获取第一语种类型的多个待译样本文本。
[0034]其中,第一语种类型可以例如为英语、韩语、日语等,待译样本文本,可以是待翻译的样本文本,样本文本比如一段第一语种类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音译模型的训练方法,包括:获取第一语种类型的多个待译样本文本;获取与所述多个待译样本文本分别对应的多个标注样本文本,所述第一语种类型和第二语种类型不相同,所述第二语种类型是所述标注样本文本对应的语种类型;确定所述多个待译样本文本和对应的所述多个标注样本文本之间的多个标注发音信息;以及根据所述多个待译样本文本、所述多个标注样本文本,以及所述多个标注发音信息训练初始的音译模型,以得到目标音译模型。2.根据权利要求1所述的方法,其中,所述根据所述多个待译样本文本、所述多个标注样本文本,以及所述多个标注发音信息训练初始的音译模型,以得到目标音译模型,包括:将所述多个待译样本文本输入至所述初始的音译模型,以得到所述音译模型输出的多个预测样本文本;确定所述多个待译样本文本和对应的所述多个预测样本文本之间的多个预测发音信息;如果所述多个预测发音信息和所述多个标注发音信息之间满足设定条件,则所述音译模型训练完毕。3.根据权利要求1所述的方法,其中,所述确定所述多个待译样本文本和对应的所述多个标注样本文本之间的多个标注发音信息,包括:确定与所述多个待译样本文本分别对应的多个第一发音特征;确定与所述多个标注样本文本分别对应的多个第二发音特征;确定所述多个第一发音特征和对应的所述多个第二发音特征之间的多个第一发音相似信息,并将所述多个发音相似信息作为所述多个标注发音信息。4.根据权利要求2所述的方法,其中,所述确定所述多个待译样本文本和对应的所述多个预测样本文本之间的多个预测发音信息,包括:确定与所述多个待译样本文本分别对应的多个第一发音特征;确定与所述多个预测样本文本分别对应的多个第三发音特征;确定所述多个第一发音特征和对应的所述多个第三发音特征之间的多个第二发音相似信息,并将所述多个第二发音相似信息作为所述多个预测发音信息。5.根据权利要求3或4所述的方法,其中,所述确定与所述多个待译样本文本分别对应的多个第一发音特征,包括:对所述多个待译样本文本分别进行切分处理,以得到与所述多个待译样本文本分别对应的多个样本子文本;确定与所述多个样本子文本分别对应的多个发音子特征,并将所述多个发音子特征作为所述多个第一发音特征。6.根据权利要求5所述的方法,其中,所述对所述多个待译样本文本分别进行切分处理,以得到与所述多个待译样本文本分别对应的多个样本子文本,包括:基于音节维度对所述多个待译样本文本分别进行切分处理,以得到与所述多个待译样本文本分别对应的多个样本子文本,所述样本子文本的发音对应一个发音单元。7.根据权利要求5所述的方法,在所述确定与所述多个样本子文本分别对应的多个发
音子特征后,还包括:对所述多个发音子特征和对应的多个发音特征进行对齐处理;在所述对齐处理之后,确定所述多个第一发音特征和对应的所述多个发音特征之间的多个发音相似信息;其中,所述发音特征是所述第二发音特征或者所述第三发音特征,所述发音相似信息是所述第一发音相似信息或者所述第二发音相似信息。8.一种音译方法,包括:获取第一语种类型的待译文本;将所述待译文本输入至如上述权利要求1

7任一项所述的音译模型的训练方法训练得到的目标音译模型之中,以得到所述目标音译模型输出的预测文本,其中,所述第一语种类型和第二语种类型不相同,所述第二语种类型是所述预测文本对应的语种类型。9.一种音译模型的训练装置,包括:第一获取模块,用于获取第一语种类型的多个待译样本文本;第二获取模块,用于获取与所述多个待译样本文本分别对应的多个标注样本文本,所述第一语种类型和第二语种类型不相同,所述第二语种类型是所述标注样本文本对应的语种类型;确定模块,用于确定所述多个待译样本文本和对应的...

【专利技术属性】
技术研发人员:王乔飞乔刚李林高
申请(专利权)人:百度国际科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1