基于模型压缩的语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号：32547032 阅读：9 留言：0更新日期：2022-03-05 11:45

本申请涉及一种基于模型压缩的语音识别方法，所述方法包括：获取训练语音数据，将训练语音数据输入至由编码器、预测网络和联合网络构建的语音识别模型中，得到初始识别结果；将初始识别结果与预设的标准结果进行比对，并根据得到的比对结果对语音识别模型进行优化，得到标准语音识别模型；对标准语音识别模型进行模型压缩处理，得到标准压缩模型；获取待识别语音，将待识别语音输入至标准压缩模型中，得到语音识别结果。此外，本申请还涉及一种基于模型压缩的语音识别方法、装置、设备及存储介质。本申请可解决语音识别的准确度不高的问题。题。题。

全部详细技术资料下载

【技术实现步骤摘要】
基于模型压缩的语音识别方法、装置、设备及存储介质

[0001]本申请涉及语音处理领域，尤其涉及一种基于模型压缩的语音识别方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]近年来，随着机器学习技术的不断发展，越来越多的领域开始使用神经网络模型来解决想要解决的技术问题，例如语音识别和图像识别等。在语音识别场景下，用户通常会使用手机等移动终端进行离线的语音识别，以快速获取语音识别结果。因此需要将一个训练好的语音识别模型运行在芯片上，进而实现利用移动终端进行语音识别。
[0003]现有的利用移动终端进行语音识别的技术主要问题在于一方面训练的语音识别模型的语音识别的准确度不高，另一方面在于将训练好的语音识别模型直接运行在芯片上时，由于芯片运算能力优先，可能出现资源不足等问题，进而降低语音识别的准确性。因此亟待提出一种准确度更高的语音识别方法。

技术实现思路

[0004]本申请提供了一种基于模型压缩的语音识别方法、装置、电子设备及存储介质，以解决语音识别的准确度不高的问题。
[0005]第一方面，本申请提供了一种基于模型压缩的语音识别方法，所述方法包括：
[0006]获取训练语音数据，将所述训练语音数据输入至由编码器、预测网络和联合网络构建的语音识别模型中，得到初始识别结果；
[0007]将所述初始识别结果与预设的标准结果进行比对，并根据得到的比对结果对所述语音识别模型进行优化，得到标准语音识别模型；
[0008]对所述标准语音识别模型进行模型压缩处理，得到...

【技术保护点】

【技术特征摘要】
1.一种基于模型压缩的语音识别方法，其特征在于，所述方法包括：获取训练语音数据，将所述训练语音数据输入至由编码器、预测网络和联合网络构建的语音识别模型中，得到初始识别结果；将所述初始识别结果与预设的标准结果进行比对，并根据得到的比对结果对所述语音识别模型进行优化，得到标准语音识别模型；对所述标准语音识别模型进行模型压缩处理，得到标准压缩模型；获取待识别语音，将所述待识别语音输入至所述标准压缩模型中，得到语音识别结果。2.根据权利要求1所述的基于模型压缩的语音识别方法，其特征在于，所述将所述训练语音数据输入至由编码器、预测网络和联合网络构建的语音识别模型中，得到初始识别结果，包括：将所述训练语音数据输入至所述语音识别模型中的编码器中，得到训练声学表示；获取预设的非空白标签，将所述非空白标签输入所述语音识别模型中的预测网络中，得到上下文向量；将所述训练声学表示和所述上下文向量作为所述语音识别模型中的联合网络的输入，得到联合逻辑向量；利用所述全连接层中的激活函数对所述联合逻辑向量进行激活处理，得到初始识别结果。3.根据权利要求2所述的基于模型压缩的语音识别方法，其特征在于，所述将所述训练语音数据输入至所述语音识别模型中的编码器中，得到训练声学表示，包括：通过所述编码器中的输入门计算所述训练语音数据的状态值；通过所述编码器中的遗忘门计算所述训练语音数据的激活值；根据所述编码器中的状态值和所述激活值计算所述训练语音数据的状态更新值；利用所述编码器中的输出门计算所述状态更新值对应的训练声学表示。4.根据权利要求1所述的基于模型压缩的语音识别方法，其特征在于，所述对所述标准语音识别模型进行模型压缩处理，得到标准压缩模型，包括：对所述标准语音识别模型中结构相同的层进行参数共享，得到初始压缩模型；基于所述训练语音数据及所述训练语音数据对应的训练识别结果更新所述初始压缩模型中共享的参数，得到标准压缩模型。5.根据权利要求4所述的基于模型压缩的语音识别方法，其特征在于，所述对所述标准语音识别模型中结构相同的层进行参数共享，得到初始压缩模型，包括：将所述标准语音识别模型中结构相同的多个层中的任意一个层确定为参照层，将多个层中除...

【专利技术属性】
技术研发人员：黄石磊，陈诚，吕少岭，廖晨，
申请(专利权)人：深圳市北科瑞声科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人