音素处理方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号：43758101 阅读：27 留言：0更新日期：2024-12-24 16:02

本申请提供了一种音素处理方法、装置、电子设备及计算机可读存储介质，该方法包括：获取第一语言的第一音素集以及第二语言的第二音素集；确定第一音素集中各个音素在第二音素集中的相似音素；若第一音素集中的部分目标音素在第二音素集中无法匹配到相似音素，在第二音素集中扩充与目标音素匹配的音素。本申请提供的音素处理方法，通过确定两种语言之间的音素集中，一个音素集相较于另一个音素集中缺失的目标音素，并在缺失该目标音素的音素集中添加匹配的音素，使得后续对包括这两种语言的文本进行语音转化时，提高语音转化结果的发音准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机，具体涉及一种音素处理方法、装置、电子设备及计算机可读存储介质。

技术介绍

1、tts(text-to-speech)技术现已被广泛地应用于智能语音助手、车载导航、有声电子书以及各大公共场所的语音信息公告等人机交互系统中，为人们的生活带来了极大的便捷。音素翻译作为tts文本前端处理的重要环节，能够从输入文本中获取语言学特征并输向tts后端模块用以预测声学特征，因而音素翻译质量的高低对后端输出语音的品质有很大的影响。

2、在国际化的今天，有越来越多的中英混合文本需要处理。虽然使用端到端语音合成模型可以不需要前端模块直接将英语这类基于拉丁字符的语言输入到后端声学特征预测网络中预测声学特征，但是汉语是一种连续书写的语言，且汉字与其读音的关联度较低，所以要实现一个性能较好的中文混合tts，前端模块仍然是必要的。而中英文由于音素集不相同，例如中文音素集中存在英文音素集中不存在的音素，因此在进行中英混合文本的处理时，存在发声异常的问题。

技术实现思路

1、本申请提供了一种音...

【技术保护点】

1.一种音素处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的音素处理方法，其特征在于，所述第一音素集中各个音素包括对应的第一发音特征，所述第二音素集中各个音素包括对应的第二发音特征，所述确定所述第一音素集中各个音素在所述第二音素集中的相似音素，包括：

3.根据权利要求1所述的音素处理方法，其特征在于，所述第一音素集中各个音素包括对应的第一发音特征，所述第二音素集中各个音素包括对应的第二发音特征，所述在所述第二音素集中扩充与所述目标音素匹配的音素，包括：

4.根据权利要求1所述的音素处理方法，其特征在于，所述在所述第二音素集中扩充与所述目标...

【技术特征摘要】

1.一种音素处理方法，其特征在于，所述方法包括：

4.根据权利要求1所述的音素处理方法，其特征在于，所述在所述第二音素集中扩充与所述目标音素匹配的音素之后，所述方法还包括：

5.根据权利要求4所述的音素处理方法，其特征在于，所述根据所述扩充后的第二音素集中的音素以及所述映射关系，对所述目标文本进行语音转化之前，所述方法还包括：

【专利技术属性】
技术研发人员：孔迪妮，宋西军，
申请(专利权)人：TCL科技集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人