一种语音数据处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：35100004 阅读：46 留言：0更新日期：2022-10-01 17:06

本申请实施例公开了一种语音数据处理方法、装置、计算机设备及存储介质，该语音数据处理方法包括：对目标语音数据进行语音识别处理，得到目标语音数据的语音识别结果，语音识别结果包括文本信息和发音信息；对文本信息进行后验纠错处理，得到目标语音数据对应的参考文本；根据参考文本的参考发音信息和目标语音数据的发音信息，确定目标语音数据的发音标准度。采用本申请实施例，无需预先提供参考文本，可以通过后验纠错处理获取参考文本，从而能够准确识别任意语音数据的发音标准度，提高场景通用性。通用性。通用性。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音数据处理方法、装置、计算机设备及存储介质

[0001]本申请涉及计算机
，尤其涉及一种语音数据处理方法、一种语音数据处理装置、一种计算机设备以及一种计算机可读存储介质。

技术介绍

[0002]随着人工智能技术的发展，语音识别技术取得了显著的进步并且已经广泛地应用在各种语音交互的场景下，譬如口语考试、普通话评审、人机交流等场景，从而为人们带来了诸多便利。
[0003]在一些需要判断说话人的发音标准度的场景下，通常采用的处理方式是给定一段特定的测试文本，通过处理朗读该测试文本的语音判断说话人相应的发音水平和等级。然而，在此方式下，由于测试文本的局限性，对于说话人的任意一段语音可能会存在不能判断出发音水平的情况，想要获取发音人自然状态下的发音标准度是比较困难的，因此，有必要探究一种新的处理机制解决此类问题。

技术实现思路

[0004]本申请实施例提供一种语音数据处理方法、装置、计算机设备及存储介质，无需预先提供参考文本，可以通过后验纠错处理获取参考文本，从而能够准确识别任意语音数据的发音标准度...

【技术保护点】

【技术特征摘要】
1.一种语音数据处理方法，其特征在于，所述方法包括：对目标语音数据进行语音识别处理，得到所述目标语音数据的语音识别结果，所述语音识别结果包括文本信息和发音信息；对所述文本信息进行后验纠错处理，得到所述目标语音数据对应的参考文本；根据所述参考文本的参考发音信息和所述目标语音数据的发音信息，确定所述目标语音数据的发音标准度。2.如权利要求1所述的方法，其特征在于，所述文本信息包括至少一个文本片段，所述至少一个文本片段基于对所述文本信息进行文本断句得到；所述对所述文本信息进行后验纠错处理，得到所述目标语音数据对应的参考文本，包括：对所述目标语音数据的文本信息包括的每个文本片段进行语意识别处理，得到所述每个文本片段的语意完整度；根据所述每个文本片段的语意完整度确定所述目标语音数据的至少一个参考文本片段；根据所述至少一个参考文本片段生成所述目标语音数据对应的参考文本。3.如权利要求2所述的方法，其特征在于，所述根据所述每个文本片段的语意完整度确定所述目标语音数据的至少一个参考文本片段，包括：针对所述目标语音数据的文本信息包括的目标文本片段，若所述目标文本片段的语意完整度指示所述目标文本片段的语意完整，则将所述目标文本片段确定为参考文本片段，所述目标文本片段为所述文本信息包括的至少一个文本片段中的任意一个；若所述目标文本片段的语意完整度指示所述目标文本片段的语意不完整，则对所述目标文本片段进行调整，并基于调整后的目标文本片段确定所述目标文本片段对应的参考文本片段。4.如权利要求3所述的方法，其特征在于，所述对所述目标文本片段进行调整，包括：对所述目标文本片段中的任一个原始处理对象进行掩码处理，得到处理后的目标文本片段；调用语言表征模型对所述处理后的目标文本片段进行预测处理，得到所述目标文本片段中的掩码位置处的至少一个候选对象；根据所述至少一个候选对象调整所述目标文本片段。5.如权利要求4所述的方法，其特征在于，所述根据所述至少一个候选对象调整所述目标文本片段，包括：获取所述至少一个候选对象各自对应的预测概率，所述预测概率用于反映所述掩码位置处的内容为候选对象的可能性；将所述至少一个候选对象中预测概率最大的候选对象作为第一候选对象，判断所述第一候选对象是否为所述掩码位置处的原始处理对象；若所述第一候选对象不为所述掩码位置处的原始处理对象，则计算所述第一候选对象的发音信息与所述掩码位置处的发音信息之间的相似度；若所述相似度小于预设相似度阈值，则将所述至少一个候选对象中的第二候选对象作为所述第一候选对象，...

【专利技术属性】
技术研发人员：张欢韵，
申请(专利权)人：深圳华策辉弘科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人