语音纠正方法及装置、计算机存储介质及终端制造方法及图纸

技术编号：38616476 阅读：11 留言：0更新日期：2023-08-26 23:44

本申请提供了一种语音纠正方法及装置、介质及终端，涉及语音识别技术领域。该方法包括：将待测语音输入至语音识别模型，根据语音识别模型的输出确定待测语音对应的待测音标以及待测音标对应的发音标签，发音标签为发音准确或所存在的第k发音问题；在待测音标对应的发音标签为所存在的第k发音问题的情况下，确定第k发音问题对应的解决策略；输出第k发音问题和第k发音问题对应的解决策略，第k发音问题对应的解决策略为解决第k发音问题的对策。本技术方案能够于错误数据收集，分析出常见的口语发音错误，通过语音识别模型自动识别出在学生练习口语的过程中发音错误的原因，并自动提示正确的发音口型，辅助口语的学习，提高准确率与学习效率。与学习效率。与学习效率。

全部详细技术资料下载

【技术实现步骤摘要】
语音纠正方法及装置、计算机存储介质及终端

[0001]本申请涉及语音识别
，尤其涉及一种语音纠正方法及装置、计算机可读存储介质及终端。

技术介绍

[0002]在外语的学习过程中，口语是最重要、也是最基础的部分。在口语的训练中，可能会存在难以把握正确发音的情况，又无专业人士进行指导，会导致口语学习的不便。而通过线上语音纠正的技术，使用移动设备便可进行口语的纠正与学习。
[0003]需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0004]本申请的目的在于提供一种语音纠正方法及装置、计算机可读存储介质及终端，至少一定程度上提高口语学习的效率。
[0005]本申请的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本申请的实践而习得。
[0006]根据本申请的第一个方面，提供一种语音纠正方法，上述方法包括：将待测语音输入至语音识别模型，根据上述语音识别模型的输出确定上述待测语音对应的待测音标以及上述待测音标对应的发音标签，上述发音标签为发音准确或所存在的第k发音问题，k为正整数；在上述待测音标对应的发音标签为所存在的第k发音问题的情况下，确定上述第k发音问题对应的解决策略；输出上述第k发音问题和上述第k发音问题对应的解决策略，上述第k发音问题对应的解决策略为解决上述第k发音问题的对策。
[0007]在本申请一个实施例中，上述确定M个特征对应的第一向量，包括：将上

【技术保护点】

【技术特征摘要】
1.一种语音纠正方法，其特征在于，包括：将待测语音输入至语音识别模型，根据所述语音识别模型的输出确定所述待测语音对应的待测音标以及所述待测音标对应的发音标签，所述发音标签为发音准确或所存在的第k发音问题，k为正整数；在所述待测音标对应的发音标签为所存在的第k发音问题的情况下，确定所述第k发音问题对应的解决策略；输出所述第k发音问题和所述第k发音问题对应的解决策略，所述第k发音问题对应的解决策略为解决所述第k发音问题的对策。2.根据权利要求1所述的语音纠正方法，其特征在于，所述方法还包括：对所述语音识别模型的训练；所述对所述语音识别模型的训练，包括：获取N个训练样本，其中，第i训练样本为根据第i语音确定的第i标注数据，N为正整数，i为小于等于N的正整数；对所述第i标注数据进行特征提取，得到M个语音特征向量，其中，M为正整数；将所述M个语音特征向量输入语音识别模型，以通过所述语音识别模型对每个语音特征向量进行语音识别处理，得到所述语音识别模型输出的M个音标向量；根据所述M个音标向量和所述M个语音特征向量，确定所述第i训练样本对应的损失函数；根据所述损失函数优化所述语音识别模型的参数。3.根据权利要求2所述的语音纠正方法，其特征在于，所述根据第i语音确定的第i标注数据，包括：根据所述第i语音，确定所述第i语音中每个音标的发音标签，得到所述第i语音对应的第i标注数据。4.根据权利要求2所述的语音纠正方法，其特征在于，所述根据所述M个音标向量和所述M个语音特征向量，确定所述第i训练样本对应的损失函数，包括：通过所述第m特征向量和所述第m音标向量确定第m概率；根据所述第m音标向量和所述第m概率确定第m损失函数。5.根据权利要求4所述的语音纠正方法，其特征在于，所述第m概率的计算方法为：P(X，Y)＝ln(∑p(y
m
|x
m
))其中，P(X，Y)为所述第m概率，X为所述M个特征向量，Y为所述M个音标向量，y
m
为所述第m音标向量，x
m
为所述第m特征向量，p(y
m
|x
m
)为在所述第m特征向量的条件下所述...

【专利技术属性】
技术研发人员：李波，
申请(专利权)人：广州视睿电子科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人