一种语音合成纠错的方法和装置制造方法及图纸

技术编号：27836674 阅读：11 留言：0更新日期：2021-03-30 12:05

本发明专利技术涉及一种语音合成纠错的方法和装置，该方法包括：获取用户录入的需要纠正读音的目标词条的参考读音；预测所述目标词条的至少一个音素序列；根据所述参考读音，计算每个所述至少一个音素序列的声学置信度；根据声学置信度最高的音素序列纠正所述目标词条的读音。本发明专利技术中，当需要纠正词条读音时，用户仅需要读出词条的正确读音，即可根据该正确读音自动给出声学置信度最高的音素序列，从而对语音合成系统合成的读音进行纠正，大大降低了用户纠正语音合成系统多音字读音的成本，解决用户在纠错过程中“会说不会标”的问题。的问题。的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音合成纠错的方法和装置

[0001]本专利技术涉及语音识别领域，具体涉及一种语音合成纠错的方法和装置。

技术介绍

[0002]当前语音合成系统的发音多是根据词典和字表来确定的，当合成语音出现多音字读音错误时，往往需要用户通过更新词典中词条的注音来进行纠正，纠正时需要用户手动标注音标，对用户在语言方面的专业性有一定要求，特别是当纠正的语种为方言时，对专业性要求更高。

技术实现思路

[0003]本专利技术提供一种语音合成纠错的方法和装置，能够解决提高对于语音合成后出现的发音错误予以正音的便捷性的技术问题。
[0004]本专利技术解决上述技术问题的技术方案如下：
[0005]第一方面，本专利技术提供一种语音合成纠错的方法，包括：
[0006]获取用户录入的需要纠正读音的目标词条的参考读音；
[0007]预测所述目标词条的至少一个音素序列；
[0008]根据所述参考读音，计算每个所述至少一个音素序列的声学置信度；
[0009]根据声学置信度最高的音素序列纠正所述目标词条的读音。
[0010]本专利技术的有益效果是：当需要纠正词条读音时，用户仅需要读出词条的正确读音，即可根据该正确读音自动给出声学置信度最高的音素序列，从而对语音合成系统合成的读音进行纠正，大大降低了用户纠正语音合成系统多音字读音的成本，解决用户在纠错过程中“会说不会标”的问题。
[0011]进一步，所述预测所述目标词条的至少一个音素序列，具体包括：
[0012]通过内...

【技术保护点】

【技术特征摘要】
1.一种语音合成纠错的方法，其特征在于，包括：获取用户录入的需要纠正读音的目标词条的参考读音；预测所述目标词条的至少一个音素序列；根据所述参考读音，计算每个所述至少一个音素序列的声学置信度；根据声学置信度最高的音素序列纠正所述目标词条的读音。2.根据权利要求1所述的语音合成纠错的方法，其特征在于，所述预测所述目标词条的至少一个音素序列，具体包括：通过内置的字典，获取所述目标词条中每个单字的全部读音；将每个单字的全部读音排列组合，形成音素序列。3.根据权利要求1所述的语音合成纠错的方法，其特征在于，所述根据所述参考读音，计算每个所述至少一个音素序列的声学置信度，具体包括：通过声学模型确定每一帧所述参考读音对应的所述音素序列中的音素和后验概率；根据每一帧参考读音的后验概率，确定所述音素序列中每个音素的后验概率；根据所述音素序列中每个音素的后验概率，确定所述音素序列的后验概率，作为所述音素序列的声学置信度。4.根据权利要求1至3任一项所述的语音合成纠错的方法，其特征在于，所述根据声学置信度最高的音素序列纠正所述目标词条的读音，具体包括：使用语音合成引擎合成所述声学置信度最高的音素序列的合成读音并播放；响应于用户确认所述合成读音正确，将所述目标词条和所述合成读音更新到语音合成系统的注音词典中。5.一种语音合成纠错的装置，其特征在于，包括：获取模块，用于获取用户录入的需要纠正读音的目标词条的参考读音；预测模块，用于预测所述目标词条的至少一个音素序列；计算模块，用于根据所述参考读音，计算每个所述...

【专利技术属性】
技术研发人员：王鸣，
申请(专利权)人：厦门云知芯智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人