一种单词转换音素方法及其模型的训练方法、电子设备技术

技术编号:44734982 阅读:20 留言:0更新日期:2025-03-21 18:00
本申请提供一种单词转换音素方法及其模型的训练方法、电子设备,方法包括:获取训练数据;将训练单词输入至字母序列分块模块,得到与训练单词对应的预测字母块序列和特征矩阵;将特征矩阵输入至音素序列生成与分块模块,得到与训练单词对应的预测音素块序列;根据预测字母块序列、预测音素块序列、真实字母块序列、真实音素块序列,对单词转换音素模型进行迭代训练,直至达到预设条件,得到训练后的单词转换音素模型。该训练方法中,通过采用三元组数据对单词转换模输出的字母块序列和音素块序列进行联合训练,从而使后续训练得到的单词转换模型可输出字母块序列和音素块序列,且字母块序列中的字母块与音素块序列中的音素块一一对应。

【技术实现步骤摘要】

本申请实施例涉及智能转换,特别涉及一种单词转换音素方法及其模型的训练方法、电子设备


技术介绍

1、单词到音素的转换是语音合成、语音识别以及语音评测中的重要组成部分。目前,在单词转换音素模型中,只关注将单词字母序列转换成音素序列,并不关注字母与音素的对齐关系。这样,当该技术应用于语音评测领域对用户的发音水平进行打分与反馈时,难以将字母与音素进行一一对齐,向用户反馈单词中哪些字母用户发音存在问题。如对于单词“fume”有四个字母,字母块序列为“f”、“u”、“m”和“e”,音素块序列为“f”、“y”、“um”和“m”,其中字母块“u”对应音素块“y”和“um”,字母块“e”不发音,根据拼读规则可与前面的字母块“m”合并作为一个单元对应音素“m”。若转换模型未将字母块与音素块进行正确对应,则会造成错误反馈,影响用户体验。


技术实现思路

1、本申请提供一种单词转换音素方法及其模型的训练方法、电子设备,在该训练方法中,通过使用三元组数据对单词转换模型进行训练,后续训练得到的单词转换模型可输出字母块序列和音素块序列,且本文档来自技高网...

【技术保护点】

1.一种单词转换音素模型的训练方法,其特征在于,所述单词转换音素模型包括字母序列分块模块和音素序列生成与分块模块,所述方法包括:

2.根据权利要求1所述的训练方法,其特征在于,所述字母序列分块模块为编码模块,所述音素序列生成与分块模块为解码模块。

3.根据权利要求2所述的训练方法,其特征在于,所述单词转换音素模型包括长短期记忆网络、卷积神经网络、注意力机制模型和转换器模型中的其中一种。

4.根据权利要求3所述的训练方法,其特征在于,所述字母序列分块模块包括输入层、隐含层和输出层,所述特征矩阵为所述输出层的输出或所述隐含层的输出。p>

5.根据权...

【技术特征摘要】

1.一种单词转换音素模型的训练方法,其特征在于,所述单词转换音素模型包括字母序列分块模块和音素序列生成与分块模块,所述方法包括:

2.根据权利要求1所述的训练方法,其特征在于,所述字母序列分块模块为编码模块,所述音素序列生成与分块模块为解码模块。

3.根据权利要求2所述的训练方法,其特征在于,所述单词转换音素模型包括长短期记忆网络、卷积神经网络、注意力机制模型和转换器模型中的其中一种。

4.根据权利要求3所述的训练方法,其特征在于,所述字母序列分块模块包括输入层、隐含层和输出层,所述特征矩阵为所述输出层的输出或所述隐含层的输出。

5.根据权利要求1-4任意一项所述的训练方法,其特征在于,所述获取训练数据,包括:

6.根据权利要求1-4任意一项...

【专利技术属性】
技术研发人员:雷延强班志华
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1