语音识别模型处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：38153416 阅读：7 留言：0更新日期：2023-07-13 09:19

本申请实施例属于人工智能领域，涉及一种语音识别模型处理方法、装置、计算机设备及存储介质，方法包括：获取训练文本；将训练文本输入语音合成模型，并通过语音合成模型中的声码器获取训练文本的第一特征；通过变分自编码器对第一特征进行参数调整，得到第二特征；通过声码器对第二特征进行语音合成，得到第一合成语音；对第一合成语音进行语音增强处理，得到第二合成语音；根据第二合成语音和训练文本对初始语音识别模型进行训练，得到语音识别模型；获取待识别语音，并通过语音识别模型对待识别语音进行语音识别，得到语音识别结果。此外，本申请还涉及区块链技术，训练文本可存储于区块链中

全部详细技术资料下载

【技术实现步骤摘要】
语音识别模型处理方法、装置、计算机设备及存储介质

[0001]本申请涉及人工智能
，尤其涉及一种语音识别模型处理方法、装置、计算机设备及存储介质。

技术介绍

[0002]语音识别是人工智能领域中重要的研究方向，具有广泛的实际应用，例如，在智能家居、虚拟助手、智能客服等应用场景中，语音识别都发挥着重要作用，为人们的日常生活提供了极大便利。语音识别识别往往连接下游的应用，语音识别结果可以用于触发指令、意图识别等。因此，语音识别的准确性非常重要。
[0003]语音识别中的待识别语音通常繁杂多样，例如掺杂各种方言、口语、噪声等。为了提高语音识别模型的准确性，通常是准备大量的待识别语音，这需要录制大量的覆盖各种场景的语音并进行标注，耗费大量时间，使得语音识别模型的数据处理效率较低。

技术实现思路

[0004]本申请实施例的目的在于提出一种语音识别模型处理方法、装置、计算机设备及存储介质，以解决语音识别模型数据处理效率较低的问题。
[0005]为了解决上述技术问题，本申请实施例提供一种语音识别模型处理方法，采用了如下所述的技术方案：
[0006]获取训练文本；
[0007]将所述训练文本输入语音合成模型，并通过所述语音合成模型中的声码器获取所述训练文本的第一特征；
[0008]通过变分自编码器对所述第一特征进行参数调整，得到第二特征；
[0009]通过所述声码器对所述第二特征进行语音合成，得到第一合成语音；
[0010]对所述第一合成语音进行语音增强处...

【技术保护点】

【技术特征摘要】
1.一种语音识别模型处理方法，其特征在于，包括下述步骤：获取训练文本；将所述训练文本输入语音合成模型，并通过所述语音合成模型中的声码器获取所述训练文本的第一特征；通过变分自编码器对所述第一特征进行参数调整，得到第二特征；通过所述声码器对所述第二特征进行语音合成，得到第一合成语音；对所述第一合成语音进行语音增强处理，得到第二合成语音；根据所述第二合成语音和所述训练文本对初始语音识别模型进行训练，得到语音识别模型；获取待识别语音，并通过所述语音识别模型对所述待识别语音进行语音识别，得到语音识别结果。2.根据权利要求1所述的语音识别模型处理方法，其特征在于，所述获取训练文本的步骤包括：获取初始语音识别模型对第一语音的第一识别结果及其对应的识别反馈信息；根据所述第一识别结果和所述识别反馈信息生成训练文本。3.根据权利要求2所述的语音识别模型处理方法，其特征在于，所述根据所述第一识别结果和所述识别反馈信息生成训练文本的步骤包括：根据所述第一识别结果和所述识别反馈信息，在所述第一语音中确定训练语音；根据所述训练语音及其对应的识别反馈信息生成初始训练文本；生成所述初始训练文本的相似文本；将所述初始训练文本以及所述相似文本确定为训练文本。4.根据权利要求1所述的语音识别模型处理方法，其特征在于，所述将所述训练文本输入语音合成模型，并通过所述语音合成模型中的声码器获取所述训练文本的第一特征的步骤包括：将所述训练文本输入语音合成模型，以通过所述语音合成模型中的文本处理子模型对所述训练文本进行文本分析，得到文本语音特征；将所述文本语音特征输入所述语音合成模型中的声学子模型，得到文本声学特征；将所述文本声学特征输入所述语音合成模型中的声码器，以通过所述声码器获取所述训练文本的第一特征。5.根据权利要求1所述的语音识别模型处理方法，其特征在于，所述通过变分自编码器对所述第一特征进行参数调整，得到第二特征的步骤包括：将所述第一特征输入所述声码器中的变分自编码器，以计算所述第一特征的均值特征和方差特征；对所述均值特征进行微调，得到已调整均值特征；根据所述已调整均值特征和所述方差特征对所述第一特...

【专利技术属性】
技术研发人员：宫帅，魏韬，马骏，王少军，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人