【技术实现步骤摘要】
本申请实施例涉及智能转换,特别涉及一种单词转换音素方法及其模型的训练方法、电子设备。
技术介绍
1、单词到音素的转换是语音合成、语音识别以及语音评测中的重要组成部分。目前,在单词转换音素模型中,只关注将单词字母序列转换成音素序列,并不关注字母与音素的对齐关系。这样,当该技术应用于语音评测领域对用户的发音水平进行打分与反馈时,难以将字母与音素进行一一对齐,向用户反馈单词中哪些字母用户发音存在问题。如对于单词“fume”有四个字母,字母块序列为“f”、“u”、“m”和“e”,音素块序列为“f”、“y”、“um”和“m”,其中字母块“u”对应音素块“y”和“um”,字母块“e”不发音,根据拼读规则可与前面的字母块“m”合并作为一个单元对应音素“m”。若转换模型未将字母块与音素块进行正确对应,则会造成错误反馈,影响用户体验。
技术实现思路
1、本申请提供一种单词转换音素方法及其模型的训练方法、电子设备,在该训练方法中,通过使用三元组数据对单词转换模型进行训练,后续训练得到的单词转换模型可输出字母块
...【技术保护点】
1.一种单词转换音素模型的训练方法,其特征在于,所述单词转换音素模型包括字母序列分块模块和音素序列生成与分块模块,所述方法包括:
2.根据权利要求1所述的训练方法,其特征在于,所述字母序列分块模块为编码模块,所述音素序列生成与分块模块为解码模块。
3.根据权利要求2所述的训练方法,其特征在于,所述单词转换音素模型包括长短期记忆网络、卷积神经网络、注意力机制模型和转换器模型中的其中一种。
4.根据权利要求3所述的训练方法,其特征在于,所述字母序列分块模块包括输入层、隐含层和输出层,所述特征矩阵为所述输出层的输出或所述隐含层的输出。
...【技术特征摘要】
1.一种单词转换音素模型的训练方法,其特征在于,所述单词转换音素模型包括字母序列分块模块和音素序列生成与分块模块,所述方法包括:
2.根据权利要求1所述的训练方法,其特征在于,所述字母序列分块模块为编码模块,所述音素序列生成与分块模块为解码模块。
3.根据权利要求2所述的训练方法,其特征在于,所述单词转换音素模型包括长短期记忆网络、卷积神经网络、注意力机制模型和转换器模型中的其中一种。
4.根据权利要求3所述的训练方法,其特征在于,所述字母序列分块模块包括输入层、隐含层和输出层,所述特征矩阵为所述输出层的输出或所述隐含层的输出。
5.根据权利要求1-4任意一项所述的训练方法,其特征在于,所述获取训练数据,包括:
6.根据权利要求1-4任意一项...
【专利技术属性】
技术研发人员:雷延强,班志华,
申请(专利权)人:广州视源电子科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。