语音识别方法、语音识别模型训练方法、设备和介质技术

技术编号：38543696 阅读：9 留言：0更新日期：2023-08-22 20:54

本申请公开了一种语音识别方法、语音识别模型训练方法、设备和介质，该方法包括：获取待识别语音并获取经训练的语音识别模型；语音识别模型包括编码网络和解码网络；在利用编码网络对待识别语音进行编码的各个阶段中，先在目标语音属性下分类得到待识别语音所属的预测属性类别，再基于目标语音属性下预测属性类别进行编码，得到第一编码特征；基于解码网络对第一编码特征进行解码，得到待识别语音的识别文本；其中，语音识别模型至少基于第一损失进行调整，第一损失表征在目标语音属性下，样本语音标注的预设属性类别与被语音识别模型进行识别所得到的样本属性类别之间的差异。通过上述方式，本申请能够在提升语音识别准确率的同时，减少成本。减少成本。减少成本。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、语音识别模型训练方法、设备和介质

[0001]本申请涉及人工智能
，特别是涉及语音识别方法、语音识别模型训练方法、设备和介质。

技术介绍

[0002]自动语音识别，简称语音识别，该技术是指计算机处理器接收到语音信号并经过计算后将其转换为符合人类理解的文字信息。这种技术被广泛应用于手机语音助手、输入法软件、车载导航和各种人工智能穿戴设备等，具有重要的应用价值；专家稀疏网络(Mixture
‑
Of
‑
Experts，MoE)目前是深度学习的一个热门领域，深度学习模型扩张模型参数量的同时，可以维持原始量级的计算量，使模型整体的效果得到大幅度地提升。
[0003]现有的基于专家稀疏网络的语音识别模型，在训练过程中，样本被随机分配给不同的专家进行处理，该过程采用无监督的方式训练，模型开发者无法明确每个专家被分配到的样本的特性，也无法明确需要设置的专家数量；因此，常需要大量的样本和专家进行训练，导致训练成本非常大。进一步地，由于采用无监督训练，样本被随机分配给各专家进行处理，相对于将样本按照属性分给对应属性的专家进行处理，将样本随机分配给各专家进行处理的得到的特征准确率较低，进而造成语音识别模型的语音识别准确率低。

技术实现思路

[0004]本申请主要解决的技术问题是提供一种语音识别方法、语音识别模型训练方法、设备和介质，能够在提升语音识别准确率的同时，减少成本。
[0005]为解决上述技术问题，本申请第一方面提供了一种语音识别方法，该方法包...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：获取待识别语音，并获取经训练的语音识别模型；其中，所述语音识别模型包括编码网络和解码网络；在利用所述编码网络对所述待识别语音进行编码的各个阶段中，先在目标语音属性下分类得到所述待识别语音所属的预测属性类别，再基于所述目标语音属性下所述预测属性类别进行编码，得到第一编码特征；基于所述解码网络对所述第一编码特征进行解码，得到所述待识别语音的识别文本；其中，所述语音识别模型至少基于第一损失进行调整，所述第一损失表征在所述目标语音属性下，样本语音标注的预设属性类别与被所述语音识别模型进行识别所得到的样本属性类别之间的差异。2.根据权利要求1所述的方法，其特征在于，所述编码网络包括顺序连接且与所述目标语音属性关联的若干第一网络块，分别用于执行编码的不同所述阶段，与所述目标语音属性关联的第一网络块包括用于在所述目标语音属性下进行分类的第一分类层，以及分别与所述目标语音属性下各个预设属性类别一一对应的第一专家层，所述第一专家层分别用于基于所述目标语音属性下所述预测属性类别进行编码。3.根据权利要求2所述的方法，其特征在于，在所述在目标语音属性下分类得到所述待识别语音所属的预测属性类别之前，所述方法还包括：选择当前所述阶段对应的第一网络块，作为第一目标网络块；所述在目标语音属性下分类得到所述待识别语音所属的预测属性类别，包括：利用所述第一目标网络块中的所述第一分类层进行分类，得到所述待识别语音在所述目标语音属性下属于各所述预设属性类别的第一概率；基于所述待识别语音分别属于各所述预设属性类别的第一概率，确定所述待识别语音所属的预测属性类别；所述基于所述目标语音属性下所述预测属性类别进行编码，得到第一编码特征，包括：选择所述第一目标网络块中与所述预测属性类别对应的第一专家层，作为第一目标专家层；利用所述第一目标专家层进行编码，得到所述第一编码特征。4.根据权利要求2或3所述的方法，其特征在于，所述方法还包括：响应于当前所述阶段对应的第一网络块并非所述编码网络中最后一个所述第一网络块，将当前所述阶段对应的第一网络块所输出的第一编码特征，输入至下一个第一网络块，直至当前所述阶段对应的第一网络块为所述编码网络中最后一个第一网络块为止；选择所述最后一个第一网络块所输出的所述第一编码特征，作为所述编码网络最终输出的第一编码特征。5.根据权利要求3所述的方法，其特征在于，所述第一网络块还包括共享专家层；在所述利用所述第一目标专家层进行编码，得到所述第一编码特征之后，还包括：利用所述共享专家层进行编码，得到第二编码特征；将所述第一编码特征和所述第二编码特征进行融合，得到所述第一目标网络块最终输出的第一编...

【专利技术属性】
技术研发人员：张文辉，万根顺，田定书，高建清，潘嘉，刘聪，胡国平，
申请(专利权)人：科大讯飞股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人