发音检错方法、装置、电子设备及存储介质制造方法及图纸

技术编号：21550177 阅读：23 留言：0更新日期：2019-07-06 22:50

本发明专利技术实施例公开了一种发音检错方法、装置、电子设备及存储介质，其中方法包括：基于预设拆分规则对目标词句进行拆分处理，得到所述目标词句的不同时长的发音单元；将用户朗读目标词句的音频数据和所述不同时长的发音单元进行对齐处理，确定所述不同时长的发音单元各自对应的音频片段；计算所述不同时长的发音单元各自对应的音频片段与所述不同时长的发音单元的标准音频之间的相似度；依据相似度计算结果，判断用户的错误发音单元。本发明专利技术实施例实现了在多个级别进行发音检错，提高了定位用户错误发音单元的准确性。

Pronunciation error detection methods, devices, electronic devices and storage media

全部详细技术资料下载

【技术实现步骤摘要】
发音检错方法、装置、电子设备及存储介质
本专利技术实施例涉及语音识别
，尤其涉及一种发音检错方法、装置、电子设备及存储介质。
技术介绍
在英文学习的过程中，口语练习，需要时常纠正发音，在这一过程中，需要正确评价每个音节甚至每个元音，辅音的发音。目前，在英文发音评测系统中，用户待输入的语音数据所对应的文本是已知的，系统得到音频后，将录入音频和相应文本进行强制对齐，以确定文本的每个音素(即单个音标)对应的音频片段，并将各音频片段与标准音素集进行似然计算，根据各音素的似然得分直接确定每个音素的发音效果。然而，现有的英文发音评测系统仍存在一定的不足：在强制对齐过程中，每个音素的持续时间短，且在时序上受前后发音影响，只根据某个音素的评分直接确定该音素的发音质量是不准确的。
技术实现思路
本专利技术实施例提供了一种发音检错方法、装置、电子设备及存储介质，以解决现有技术中存在的，仅根据单个音素的评分直接判定该音素发音质量时，判定准确性低的技术问题。第一方面，本专利技术实施例提供了一种发音检错方法，包括：基于预设拆分规则对目标词句进行拆分处理，得到所述目标词句的不同时长的发音单元；将用户朗读目标词句的音频数据和所述不同时长的发音单元进行对齐处理，确定所述不同时长的发音单元各自对应的音频片段；计算所述不同时长的发音单元各自对应的音频片段与所述不同时长的发音单元的标准音频之间的相似度；依据相似度计算结果，判断用户的错误发音单元。第二方面，本专利技术实施例还提供了一种发音检错装置，包括：拆分模块，用于基于预设拆分规则对目标词句进行拆分处理，得到所述目标词句的不同时长的发音单元...

【技术保护点】
1.一种发音检错方法，其特征在于，所述方法包括：基于预设拆分规则对目标词句进行拆分处理，得到所述目标词句的不同时长的发音单元；将用户朗读目标词句的音频数据和所述不同时长的发音单元进行对齐处理，确定所述不同时长的发音单元各自对应的音频片段；计算所述不同时长的发音单元各自对应的音频片段与所述不同时长的发音单元的标准音频之间的相似度；依据相似度计算结果，判断用户的错误发音单元。

【技术特征摘要】
1.一种发音检错方法，其特征在于，所述方法包括：基于预设拆分规则对目标词句进行拆分处理，得到所述目标词句的不同时长的发音单元；将用户朗读目标词句的音频数据和所述不同时长的发音单元进行对齐处理，确定所述不同时长的发音单元各自对应的音频片段；计算所述不同时长的发音单元各自对应的音频片段与所述不同时长的发音单元的标准音频之间的相似度；依据相似度计算结果，判断用户的错误发音单元。2.根据权利要求1所述的方法，其特征在于，基于预设拆分规则对目标词句进行拆分处理，得到所述目标词句的不同时长的发音单元，包括：保留目标词句，将目标词句作为所述发音单元；和/或依次遍历目标词句的音标，遇到元音则在所述元音后加入切分标记，遇到辅音且所述辅音后没有元音，则将前一个切分标记删除，并在所述辅音后加入切分标记，根据所述切分标记确定所述目标词句的不同时长的发音单元；和/或依次遍历目标词句的音标，遇到元音则在所述元音后加入切分标记，遇到辅音且所述辅音后没有元音，则在所述辅音后加入切分标记，根据所述切分标记确定所述目标词句的不同时长的发音单元；和/或将目标词句的每个音标后加入切分标记，根据所述切分标记确定所述目标词句的发音单元；相应的，所述不同时长的发音单元包括音素、音节和/或单词，所述音素为单个音标，所述音节包括至少两个相邻的音素。3.根据权利要求1所述的方法，其特征在于，所述计算所述不同时长的发音单元各自对应的音频片段与所述不同时长的发音单元的标准音频之间的相似度包括：对所述不同时长的发音单元各自对应的音频片段与所述不同时长的发音单元的标准音频进行似然计算，确定所述不同时长的发音单元各自的似然得分。4.根据权利要求3所述的方法，其特征在于，所述依据相似度计算结果，判断用户的错误发音单元，包括：依次遍历目标词句的每个音素，判定各音素的似然得分是否满足预设条件；将不满足所述预设条件的因素确定为错误发音的音素；其中，所述预设条件包括，音素的似然得分小于预设阈值，并且音素的最短音节的似然得分小于预设阈值。5.根据权利要求4所述的方法，其特征在于，在依次遍历目标词句的每个音素之前，所...

【专利技术属性】
技术研发人员：曾慧，徐燃，雷宇，
申请(专利权)人：北京儒博科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人