一种语音识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：23151352 阅读：38 留言：0更新日期：2020-01-18 14:19

本发明专利技术实施例提供一种语音识别方法、装置、电子设备及存储介质，所述方法包括：获取待识别语音数据；根据预先训练得到的神经网络识别模型，对所述待识别语音数据进行语音识别，得到与所述待识别语音数据对应的识别文字，其中，所述神经网络识别模型对预设语音语料库中语音的说话人的识别率小于或等于预设阈值，所述预设语音语料库用于训练得到所述神经网络识别模型。本发明专利技术实施例提高了神经网络识别模型对待识别语音进行识别时的准确率。

A speech recognition method, device, electronic equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别方法、装置、电子设备及存储介质
本专利技术涉及语音识别
，尤其涉及一种语音识别方法、装置、电子设备及存储介质。
技术介绍
在现阶段的语音识别模型中，是将音频文件整体作为输入，然后经卷积神经网络(ConvolutionalNeuralNetwork，CNN)层提取音频特征，然后通过双向长短时记忆(bidirectionallongshort-termmemory，BLSTM)和前瞻CNN层进行学习，通过全连接层进行降维，最后用连接时间分类(Connectionisttemporalclassification，CTC)层解码，得到最终的识别文字。但是，现阶段的语音识别模型的泛化能力依赖于语音语料库中足够多的说话人，通常语音语料库时长在10000小时以上才能保证足够的泛化能力，否则会降低对语音进行文字识别时的准确率。综上所述，现有技术中在通过语音识别模型对语音进行文字识别时，存在语音识别准确率较低的问题。
技术实现思路
本专利技术实施例提供一种语音识别方法、装置、电子设备及存储介质，以解决现有技术中在通过语音识别模型对语音进行文字识别时，语音识别准确率较低的问题。针对上述问题，第一方面，本专利技术实施例提供一种语音识别方法，所述方法包括：获取待识别语音数据；根据预先训练得到的神经网络识别模型，对所述待识别语音数据进行语音识别，得到与所述待识别语音数据对应的识别文字，其中，所述神经网络识别模型对预设语音语料库中语音的说话人的识别率小于或等...

【技术保护点】
1.一种语音识别方法，其特征在于，所述方法包括：/n获取待识别语音数据；/n根据预先训练得到的神经网络识别模型，对所述待识别语音数据进行语音识别，得到与所述待识别语音数据对应的识别文字，其中，/n所述神经网络识别模型对预设语音语料库中语音的说话人的识别率小于或等于预设阈值，所述预设语音语料库用于训练得到所述神经网络识别模型。/n

【技术特征摘要】
1.一种语音识别方法，其特征在于，所述方法包括：
获取待识别语音数据；
根据预先训练得到的神经网络识别模型，对所述待识别语音数据进行语音识别，得到与所述待识别语音数据对应的识别文字，其中，
所述神经网络识别模型对预设语音语料库中语音的说话人的识别率小于或等于预设阈值，所述预设语音语料库用于训练得到所述神经网络识别模型。

2.根据权利要求1所述的方法，其特征在于，所述根据预先训练得到的神经网络识别模型，对所述待识别语音数据进行语音识别之前，所述方法还包括：
建立并训练得到所述神经网络识别模型；其中，
所述建立并训练得到所述神经网络识别模型，包括：
建立神经网络训练模型，其中所述神经网络训练模型包括特征学习单元以及分别与所述特征学习单元连接的语音识别单元和说话人识别单元；
将预设语音语料库中的语音作为训练数据输入至所述特征学习单元，分别由所述语音识别单元对所述语音进行识别，得到语音识别结果，由所述说话人识别单元对所述语音的说话人进行识别，得到说话人识别结果；
根据所述语音识别结果和所述说话人识别结果，得到所述神经网络训练模型的损失函数；
根据所述损失函数，对所述神经网络训练模型进行优化训练，得到优化训练后的神经网络训练模型，其中所述优化训练后的神经网络训练模型对所述预设语音语料库中语音的说话人的识别率小于或等于预设阈值；
将优化训练后的神经网络训练模型中的特征学习单元和语音识别单元建立为模型，并将所述模型确定为神经网络识别模型。

3.根据权利要求2所述的方法，其特征在于，所述特征学习单元包括相连接的第一卷积神经网络CNN层和双向长短时记忆BLSTM层；
所述语音识别单元包括依次相连接的前馈CNN层、全连接层和连接时间分类CTC层，其中所述BLSTM层连接所述前馈CNN层；
所述说话人识别单元包括依次相连接的第二CNN层、全连接层和Softmax层，其中所述BLSTM层连接所述第二...

【专利技术属性】
技术研发人员：张鹏，
申请(专利权)人：普天信息技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人