音译模型的训练方法、装置、设备以及存储介质制造方法及图纸

技术编号：35329277 阅读：12 留言：0更新日期：2022-10-26 11:45

本公开提供了一种音译模型的训练方法、装置、设备以及存储介质，涉及深度学习、自然语言处理等人工智能领域，实现方案为：获取第一语种类型的多个待译样本文本；获取与多个待译样本文本分别对应的多个标注样本文本，第一语种类型和第二语种类型不相同，第二语种类型是所述标注样本文本对应的语种类型；确定多个待译样本文本和对应的所述多个标注样本文本之间的多个标注发音信息；以及根据多个待译样本文本、所述多个标注样本文本，以及所述多个标注发音信息训练初始的音译模型，以得到目标音译模型。由此，有效地建模出待译样本文本和标注样本文本之间的发音维度的特征，避免了由于发音歧义对翻译效果的影响，从而提升了翻译准确性和翻译效果。性和翻译效果。性和翻译效果。

全部详细技术资料下载

【技术实现步骤摘要】
音译模型的训练方法、装置、设备以及存储介质

[0001]本公开涉及计算机
，尤其涉及深度学习、自然语言处理等人工智能
，具体涉及一种音译模型的训练方法、装置、设备以及存储介质。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]相关技术中，通常采用基于规则进行匹配的方法，或者对海量的训练数据进行序列标注，以辅助实际应用当中将语种类型A的输入文本转换为语种类型B的输出文本，这种方式下，可能会由于发音歧义而导致翻译不够准确，翻译效率不高，翻译效果不佳。

技术实现思路

[0004]本公开提供了一种用于音译模型的训练方法、装置、设备以及存储介质。
[0005]根据本公开的第一方面，提供了一种音译模型的训练方法，包括：获取第一语种类型的多个待译样本文本；获取与所述多个待译样本文本分别对应的多个标注样本文本，所述第一语种类型和第二语种类型不相同，所述第二语种类型是所述标注样本文本对应的语种类型；确定所述多个待译样本文本和对应的所述多个标注样本文本之间的多个标注发音信息；以及根据所述多个待译样本文本、所述多个标注样本文本，以及所述多个标注发音信息训练初始...

【技术保护点】

【技术特征摘要】
1.一种音译模型的训练方法，包括：获取第一语种类型的多个待译样本文本；获取与所述多个待译样本文本分别对应的多个标注样本文本，所述第一语种类型和第二语种类型不相同，所述第二语种类型是所述标注样本文本对应的语种类型；确定所述多个待译样本文本和对应的所述多个标注样本文本之间的多个标注发音信息；以及根据所述多个待译样本文本、所述多个标注样本文本，以及所述多个标注发音信息训练初始的音译模型，以得到目标音译模型。2.根据权利要求1所述的方法，其中，所述根据所述多个待译样本文本、所述多个标注样本文本，以及所述多个标注发音信息训练初始的音译模型，以得到目标音译模型，包括：将所述多个待译样本文本输入至所述初始的音译模型，以得到所述音译模型输出的多个预测样本文本；确定所述多个待译样本文本和对应的所述多个预测样本文本之间的多个预测发音信息；如果所述多个预测发音信息和所述多个标注发音信息之间满足设定条件，则所述音译模型训练完毕。3.根据权利要求1所述的方法，其中，所述确定所述多个待译样本文本和对应的所述多个标注样本文本之间的多个标注发音信息，包括：确定与所述多个待译样本文本分别对应的多个第一发音特征；确定与所述多个标注样本文本分别对应的多个第二发音特征；确定所述多个第一发音特征和对应的所述多个第二发音特征之间的多个第一发音相似信息，并将所述多个发音相似信息作为所述多个标注发音信息。4.根据权利要求2所述的方法，其中，所述确定所述多个待译样本文本和对应的所述多个预测样本文本之间的多个预测发音信息，包括：确定与所述多个待译样本文本分别对应的多个第一发音特征；确定与所述多个预测样本文本分别对应的多个第三发音特征；确定所述多个第一发音特征和对应的所述多个第三发音特征之间的多个第二发音相似信息，并将所述多个第二发音相似信息作为所述多个预测发音信息。5.根据权利要求3或4所述的方法，其中，所述确定与所述多个待译样本文本分别对应的多个第一发音特征，包括：对所述多个待译样本文本分别进行切分处理，以得到与所述多个待译样本文本分别对应的多个样本子文本；确定与所述多个样本子文本分别对应的多个发音子特征，并将所述多个发音子特征作为所述多个第一发音特征。6.根据权利要求5所述的方法，其中，所述对所述多个待译样本文本分别进行切分处理，以得到与所述多个待译样本文本分别对应的多个样本子文本，包括：基于音节维度对所述多个待译样本文本分别进行切分处理，以得到与所述多个待译样本文本分别对应的多个样本子文本，所述样本子文本的发音对应一个发音单元。7.根据权利要求5所述的方法，在所述确定与所述多个样本子文本分别对应的多个发
音子特征后，还包括：对所述多个发音子特征和对应的多个发音特征进行对齐处理；在所述对齐处理之后，确定所述多个第一发音特征和对应的所述多个发音特征之间的多个发音相似信息；其中，所述发音特征是所述第二发音特征或者所述第三发音特征，所述发音相似信息是所述第一发音相似信息或者所述第二发音相似信息。8.一种音译方法，包括：获取第一语种类型的待译文本；将所述待译文本输入至如上述权利要求1
‑
7任一项所述的音译模型的训练方法训练得到的目标音译模型之中，以得到所述目标音译模型输出的预测文本，其中，所述第一语种类型和第二语种类型不相同，所述第二语种类型是所述预测文本对应的语种类型。9.一种音译模型的训练装置，包括：第一获取模块，用于获取第一语种类型的多个待译样本文本；第二获取模块，用于获取与所述多个待译样本文本分别对应的多个标注样本文本，所述第一语种类型和第二语种类型不相同，所述第二语种类型是所述标注样本文本对应的语种类型；确定模块，用于确定所述多个待译样本文本和对应的...

【专利技术属性】
技术研发人员：王乔飞，乔刚，李林高，
申请(专利权)人：百度国际科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人