一种发音纠正方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:33723466 阅读:21 留言:0更新日期:2022-06-08 21:16
本发明专利技术公开一种发音纠正方法、装置、计算机设备及存储介质,涉及人工智能技术领域。具体方案包括:计算机设备响应于用户跟读预设语音的语音输入,获取用户跟读语音,并根据预设语音和用户跟读语音的发音感知相似的分析,确定目标发音片段,目标发音片段为用户跟读语音中,发音准确度满足预设规则的片段,且根据目标发音片段,以及预设语音中与目标发音片段对应的片段生成发音纠正语音,发音纠正语音用于纠正用户跟读语音中的目标发音片段。本发明专利技术通过对比的方式同时呈现目标发音片段和预设语音中与目标发音片段对应的片段,同时辅助以自然语言的引导,能够主动有效引导学习者对发音不准确的地方进行发音纠正,提升了发音纠正的效率。效率。效率。

【技术实现步骤摘要】
一种发音纠正方法、装置、计算机设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种发音纠正方法、装置、计算机设备及存储介质。

技术介绍

[0002]在语言学习中,“示范

模仿朗读”是一种常见的语言学习方式。在这种语言学习方式中,计算机设备会先向学习者示范一整句话的正确的发音,然后录制学习者模仿的跟读语音,并确定跟读语音中发音有问题的单词或音节,且向学习者指出。
[0003]相关技术中,计算机设备通过训练好的发音模型来确定跟读语音中发音有问题的单词或音节,并进行标识显示,以提示学习者的发音存在缺陷。
[0004]但是,上述方式难以主动引导学习者对发音不准确的地方进行发音纠正,发音纠正的效率低。

技术实现思路

[0005]本专利技术提供一种发音纠正方法、装置、计算机设备及存储介质,解决了发音纠正的效率低的问题。
[0006]为达到上述目的,本专利技术采用如下技术方案:
[0007]第一方面,本专利技术提供一种发音纠正方法,该方法包括:
[0008]响应于用户跟读预设语音的语音输入,获取用户跟读语音;
[0009]根据预设语音和用户跟读语音的发音感知相似的分析,确定目标发音片段,目标发音片段为用户跟读语音中,发音准确度满足预设规则的片段;
[0010]根据目标发音片段,以及预设语音中与目标发音片段对应的片段生成发音纠正语音,发音纠正语音用于纠正用户跟读语音中的目标发音片段。
[0011]在一种可能的实现方式中,根据预设语音和用户跟读语音的发音感知相似的分析,确定目标发音片段,包括:对用户跟读语音进行预处理,得到目标语音;获取预设语音中每个第一内容的发音的波形和目标语音中与每个第一内容对应的第二内容的发音的波形;根据每个第二内容的发音的波形和对应的第一内容的发音的波形的感知相似度,确定每个第二内容的发音准确度;将发音准确度小于预设阈值的第二内容的发音确定为目标发音片段。
[0012]在一种可能的实现方式中,第一内容或第二内容为:词语、词组和音节中的任意一项。
[0013]在一种可能的实现方式中,获取预设语音中每个第一内容的发音的波形和所述目标语音中对应的第二内容的发音的波形,包括:计算目标语音和预设语音的声音感知差距;根据声音感知差距和预存的时间对齐算法,将目标语音的发音的波形和预设语音的发音的波形对齐;根据预设语音中预先标注的声音起始信息,截取对齐的预设语音和目标语音的发音的波形,得到每个第一内容的发音的波形和对应的第二内容的发音的波形。
[0014]在一种可能的实现方式中,目标发音片段为目标词语的发音片段,根据目标发音片段,以及预设语音中与目标发音片段对应的片段生成发音纠正语音,包括:根据目标词语的发音片段和预设语音中与目标词语对应的词语的发音片段,生成第一纠正语音,第一纠正语音用于纠正目标词语的发音;确定目标词语的发音片段中的目标音节片段,目标音节片段为目标词语中发音准确度小于预设阈值的音节;根据目标音节片段和预设语音中与目标音节片段对应的片段生成第二纠正语音,第二纠正语音用于纠正目标音节片段的发音;发音纠正语音包括第一纠正语音和第二纠正语音。
[0015]在一种可能的实现方式中,根据目标发音片段,以及预设语音中与目标发音片段对应的片段生成发音纠正语音,包括:将目标发音片段和预设语音中与目标发音片段对应的片段以对比的方式添加至预存的语音模板中,生成发音纠正语音;或者,根据目标发音片段生成发音纠正语音;或者,根据预设语音中与目标发音片段对应的片段生成发音纠正语音。
[0016]在一种可能的实现方式中,上述发音纠正方法还包括:获取预设语音对应的目标内容;根据每个第二内容的发音准确度,确定目标内容中与每个第二内容对应的内容的发音评价参数;采用第一标记方式对发音评价参数大于预设值的内容进行标记,采用第二标记方式对发音评价参数小于或等于预设值的内容进行标记,第一标记方式与第二标记方式不同;显示标记后的目标内容,标记后的目标内容用于提示用户的用户跟读语音的发音准确度。
[0017]在一种可能的实现方式中,上述发音纠正方法还包括:在目标内容的所有内容的发音评价参数的平均值小于预设参数的情况下,再次输出预设语音;或者,在目标内容中发音评价参数小于预设参数的内容数量在目标内容的内容总数中的占比小于预设占比的情况下,再次输出预设语音;或者,在目标内容的所有内容的发音评价参数的总和小于预设和值的情况下,再次输出预设语音。
[0018]第二方面,本专利技术提供一种发音纠正装置,包括:
[0019]获取模块,用于响应于用户跟读预设语音的语音输入,获取用户跟读语音;
[0020]确定模块,用于根据预设语音和用户跟读语音的发音感知相似的分析,确定目标发音片段,目标发音片段为用户跟读语音中,发音准确度满足预设规则的片段;
[0021]语音合成模块,用于根据目标发音片段,以及预设语音中与目标发音片段对应的片段生成发音纠正语音,发音纠正语音用于纠正用户跟读语音中的目标发音片段。
[0022]在一种可能的实现方式中,确定模块具体用于:对用户跟读语音进行预处理,得到目标语音;获取预设语音中每个第一内容的发音的波形和目标语音中与每个第一内容对应的第二内容的发音的波形;根据每个第二内容的发音的波形和对应的第一内容的发音的波形的感知相似度,确定每个第二内容的发音准确度;将发音准确度小于预设阈值的第二内容的发音确定为目标发音片段。
[0023]在一种可能的实现方式中,第一内容或第二内容为:词语、词组、音节中的任意一项。
[0024]在一种可能的实现方式中,确定模块具体用于:计算目标语音和预设语音的声音感知差距;根据声音感知差距和预存的时间对齐算法,将目标语音的发音的波形和预设语音的发音的波形对齐;根据预设语音中预先标注的声音起始信息,截取对齐的预设语音和
目标语音的发音的波形,得到每个第一内容的发音的波形和对应的第二内容的发音的波形。
[0025]在一种可能的实现方式中,目标发音片段为目标词语的发音片段,语音合成模块具体用于:根据目标词语的发音片段和预设语音中与目标词语对应的词语的发音片段,生成第一纠正语音,第一纠正语音用于纠正目标词语的发音;确定目标词语的发音片段中的目标音节片段,目标音节片段为目标词语中发音准确度小于预设阈值的音节;根据目标音节片段和预设语音中与目标音节片段对应的片段生成第二纠正语音,第二纠正语音用于纠正目标音节片段的发音;发音纠正语音包括第一纠正语音和第二纠正语音。
[0026]在一种可能的实现方式中,语音合成模块具体用于:将目标发音片段和预设语音中与目标发音片段对应的片段以对比的方式添加至预存的语音模板中,生成发音纠正语音;或者,根据目标发音片段生成发音纠正语音;或者,根据预设语音中与目标发音片段对应的片段生成发音纠正语音。
[0027]在一种可能的实现方式中,上述发音纠正装置还包括评价模块和显示模块,获取模块还用于:获取预设语音对应的目标内本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种发音纠正方法,其特征在于,包括:响应于用户跟读预设语音的语音输入,获取用户跟读语音;根据所述预设语音和所述用户跟读语音的发音感知相似的分析,确定目标发音片段,所述目标发音片段为所述用户跟读语音中,发音准确度满足预设规则的片段;根据所述目标发音片段,以及所述预设语音中与所述目标发音片段对应的片段生成发音纠正语音,所述发音纠正语音用于纠正所述用户跟读语音中的所述目标发音片段。2.根据权利要求1所述的发音纠正方法,其特征在于,所述根据所述预设语音和所述用户跟读语音的发音感知相似的分析,确定目标发音片段,包括:对所述用户跟读语音进行预处理,得到目标语音;获取所述预设语音中每个第一内容的发音的波形和所述目标语音中与每个第一内容对应的第二内容的发音的波形;根据每个第二内容的发音的波形和对应的第一内容的发音的波形的感知相似度,确定每个第二内容的发音准确度;将发音准确度小于预设阈值的第二内容的发音确定为所述目标发音片段。3.根据权利要求2所述的发音纠正方法,其特征在于,所述第一内容或所述第二内容为:词语、词组、音节中的任意一项。4.根据权利要求2或3所述的发音纠正方法,其特征在于,所述获取所述预设语音中每个第一内容的发音的波形和所述目标语音中对应的第二内容的发音的波形,包括:计算所述目标语音和所述预设语音的声音感知差距;根据所述声音感知差距和预存的时间对齐算法,将所述目标语音的发音的波形和所述预设语音的发音的波形对齐;根据所述预设语音中预先标注的声音起始信息,截取对齐的所述预设语音和所述目标语音的发音的波形,得到每个第一内容的发音的波形和对应的第二内容的发音的波形。5.根据权利要求1

3中任一项所述的发音纠正方法,其特征在于,所述目标发音片段为目标词语的发音片段,所述根据所述目标发音片段,以及所述预设语音中与所述目标发音片段对应的片段生成发音纠正语音,包括:根据所述目标词语的发音片段和所述预设语音中与所述目标词语对应的词语的发音片段,生成第一纠正语音,所述第一纠正语音用于纠正所述目标词语的发音;确定所述目标词语的发音片段中的目标音节片段,所述目标音节片段为所述目标词语中发音准确度小于预设阈值的音节;根据所述目标音节片段和所述预设语音中与所述目标音节片段对应的片段生成第二纠正语音,所述第二纠正语音用于纠正所述目标音节片段的发音;所述发音纠正语音包括所述第一纠正语音和所述第二纠正语音。6.根据权利要求1

3中任一项所述的发音纠正方法,其特征在于,所述根据所述目标发音片段,以及所述预设语音中与所述目标发音片段对应的片段生成发音纠正语音,包括:将所述目标发音片段和所述预设语音中与所述目标发音片段对应的片段以对比的方式添加至预存的语音模板中,生成所述发音纠正语音;或者,根据所述目标发音片段生成所述发音纠正语音;
或者,根据所述预设语音中与所述目标发音片段对应的片段生成所述发音纠正语音。7.根据权利要求2或3所述的发音纠正方法,其特征在于,所述发音纠正方法还包括:获取所述预设语音对应的目标内容;根据每个第二内容的发音准确度,确定所述目标内容中与每个第二内容对应的内容的发音评价参数;采用第一标记方式对发音评价参数大于预设值的内容进行标记,采用第二标记方式对发音评价参数小于或等于所述预设值的内容进行标记,所述第一标记方式与所述第二标记方式不同;显示标记后的目标内容,所述标记后的目标内容用于提示用户的所述用户跟读语音的发音准确度。8.根据权利要求7所述的发音纠正方法,其特征在于,所述发音纠正方法还包括:在所述目标内容的所有内容的发音评价参数的平均值小于预设参数的情况下,再次输出所述预设语音;或者,在所述目标内容中发音评价参数小于所述预设参数的内容数量在所述目标内容的内容总数中的占比小于预设占比的情况下,再次输出所述预设语音;或者,在所述目标内容的所有内容的发音评价参数的总和小于预设和值的情况下,再次输出所述预设语音。9.一种发音纠正装置,其特征在于,包括:获取模块,用于响应于用户跟读预设语音的语音输入,获取用户跟读语音;确定模块,用于根据所述预设语音和所述用户跟读语音的发音感知相似的分析,确定目标发音片段,所述目标发...

【专利技术属性】
技术研发人员:朱奇峰
申请(专利权)人:苏州清睿智能科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1