语音识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：30403930 阅读：88 留言：0更新日期：2021-10-20 10:58

本申请是关于一种语音识别方法、装置、计算机设备及存储介质，涉及语音识别技术领域。所述方法包括：通过语音识别模型对流式语音数据进行处理，获得语音识别文本；语音识别模型是基于网络搜索模型构建的；网络搜索模型是通过语音训练样本对初始网络进行神经网络结构搜索获得的；初始网络中包含的多个特征聚合节点之间的操作元中包括第一类型操作元，第一类型操作元对应的第一操作空间中包含不依赖未来数据的指定操作；输出语音识别文本。通过上述方案，能够在保证语音识别的准确性的情况下，降低在流式语音识别场景下的识别时延，提高流式语音识别的效果。高流式语音识别的效果。高流式语音识别的效果。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、计算机设备及存储介质

[0001]本申请涉及语音识别
，特别涉及一种语音识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]语音识别是一种将语音识别为文本的技术，其在各种人工智能(Artificial Intelligence，AI)场景中具有广泛的应用。
[0003]在相关技术中，为了保证语音识别的准确性，语音识别模型对输入的语音进行识别的过程中，需要参考语音的上下文信息，也就是说，在对语音数据进行识别时，需要同时结合该语音数据的历史信息和未来信息进行识别。
[0004]在上述技术方案中，由于语音识别模型在语音识别过程中引入了未来信息，会导致一定的延时，从而限制来语音识别模型在流式语音识别中的应用。

技术实现思路

[0005]本申请实施例提供了一种语音识别方法、装置、计算机设备及存储介质，可以降低在流式语音识别场景下的识别时延，提高流式语音识别的效果，该技术方案如下：
[0006]一方面，提供了一种语音识别方法，所述方法包括：
[0007]...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，其特征在于，所述方法包括：接收流式语音数据；通过语音识别模型对所述流式语音数据进行处理，获得所述流式语音数据对应的语音识别文本；所述语音识别模型是基于网络搜索模型构建的；所述网络搜索模型是通过语音训练样本对初始网络进行神经网络结构搜索获得的；所述初始网络中包含通过操作元相连的多个特征聚合节点，所述多个特征聚合节点之间的操作元中包括第一类型操作元，所述第一类型操作元对应的第一操作空间中包含不依赖未来数据的指定操作；所述第一操作空间中的一种或者多种操作的组合用于实现所述第一类型操作元；所述指定操作为依赖上下文信息的神经网络操作；所述语音训练样本中包含语音样本，以及所述语音样本对应的语音识别标签；输出所述语音识别文本。2.根据权利要求1所述的方法，其特征在于，所述初始网络包含n个单元网络，所述n个单元网络中包含至少一个第一单元网络，所述第一单元网络中包含输入节点、输出节点、以及由所述第一类型操作元相连的至少一个所述特征聚合节点。3.根据权利要求2所述的方法，其特征在于，所述n个单元网络之间通过以下连接方式中的至少一种相连：双链接方式、单链接方式、以及密集链接方式。4.根据权利要求2所述的方法，其特征在于，所述n个单元网络中包含至少一个第二单元网络，所述第二单元网络中包含输入节点、输出节点、以及由第二类型操作元相连的至少一个所述特征聚合节点；所述第二类型操作元对应的第二操作空间中包含依赖未来数据的所述指定操作；所述第二操作空间中的一种或者多种操作的组合用于实现所述第二类型操作元。5.根据权利要求4所述的方法，其特征在于，至少一个所述第一单元网络之间共享拓扑结构，或者，至少一个所述第一单元网络之间共享拓扑结构和网络参数；至少一个所述第二单元网络之间共享拓扑结构，或者，至少一个所述第二单元网络之间共享拓扑结构和网络参数。6.根据权利要求1所述的方法，其特征在于，所述不依赖未来数据的指定操作是基于因果的所述指定操作；或者，所述不依赖未来数据的指定操作是基于掩膜的所述指定操作。7.根据权利要求1所述的方法，其特征在于，所述特征聚合节点用于对输入数据执行求和操作、拼接操作以及乘积操作中的至少一种。8.根据权利要求1至7任一所述的方法，其特征在于，所述指定操作包括卷及操作、池化操作、基于长短期记忆人工神经网LSTM络的操作、以及基于门控循环单元GRU的操作。9.根据权利要求1至7任一所述的方法，其特征在于，所述语音识别模型中包含声学模型以及解码图，所述声学模型是基于所述网络搜索模型构建的；所述通过语音识别模型对所述流式语音数据进行处理，获得所述流式语音数据对应的语音识别文本，包括：
通过所述声学模型对所述流式语音数据进行处理，获得所述流式语音数据的声学识别信息；所述声学识别信息包括音素、音节或者半音节；通过所述解码图对所述流式语音数据的声学识别信息进行处理，获得所述语音识别文本。10.一种语音识别方法，其特征在于，所述方法包括：获取语音训练样本，所述语音训练样本中包含语音样本，以及所述语音样本对应的语音识别标签；基于所述语音训练样本，在...

【专利技术属性】
技术研发人员：苏丹，贺利强，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人