语音识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：29679420 阅读：12 留言：0更新日期：2021-08-13 22:02

本申请涉及人工智能技术领域，揭露了一种语音识别方法，所述方法包括：获取待处理语音数据流，所述待处理语音数据流包含多个语音单元数据；通过集成神经网络依次将多个所述语音单元数据进行编码，并在得到任意一所述语音单元数据的编码数据之后，实时将所述编码数据输入至与所述集成神经网络分开部署的解码器进行解码，以得到多个所述语音单元数据的语音识别结果。此外，本申请还涉及一种语音识别装置、电子设备及存储介质。本申请可以提高语音识别的速度。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、电子设备及存储介质
本申请涉及人工智能
，尤其涉及一种语音识别方法、装置、电子设备及存储介质。
技术介绍
随着互联网的普及，在客户端和服务器端产生的数据越来越多，这些数据包括文本类型的数据和非文本类型的数据，如语音数据。实际应用中常需要对这些非文本类型的数据进行识别，例如，语音识别。通过语音识别可以将语音中的信息转换为文本信息，进而进行自然语言处理或者是人机交互等操作。当需要识别的语音数据比较多时，若无法快速获取到语音识别结果，将影响语音识别的后续操作，如影响自然语音处理的结果（如无法快速识别用户意图）或者影响人机交互的效率（如无法快速根据用户发出的语音信息执行相应控制操作）。因此，亟需一种提高语音识别的速度的技术方案。
技术实现思路
为了解决上述技术问题或者至少部分地解决上述技术问题，本申请提供了一种语音识别方法、装置、电子设备及存储介质。第一方面，本申请提供了一种语音识别方法，所述方法包括：获取待处理语音数据流，所述待处理语音数据流包含多个语音单元数据；通过集成神经网络依次将多个所述语音单元数据进行编码，并在得到任意一所述语音单元数据的编码数据之后，实时将所述编码数据输入至与所述集成神经网络分开部署的解码器进行解码，以得到多个所述语音单元数据的语音识别结果。可选地，所述通过集成神经网络依次将多个所述语音单元数据进行编码，包括：提取多个所述语音单元数据的语音标识信息和位置信息；将所述语音标识信息和所述位置信息进行组合，得到...

【技术保护点】
1.一种语音识别方法，其特征在于，所述方法包括：/n获取待处理语音数据流，所述待处理语音数据流包含多个语音单元数据；/n通过集成神经网络依次将多个所述语音单元数据进行编码，并在得到任意一所述语音单元数据的编码数据之后，实时将所述编码数据输入至与所述集成神经网络分开部署的解码器进行解码，以得到多个所述语音单元数据的语音识别结果。/n

【技术特征摘要】
1.一种语音识别方法，其特征在于，所述方法包括：
获取待处理语音数据流，所述待处理语音数据流包含多个语音单元数据；
通过集成神经网络依次将多个所述语音单元数据进行编码，并在得到任意一所述语音单元数据的编码数据之后，实时将所述编码数据输入至与所述集成神经网络分开部署的解码器进行解码，以得到多个所述语音单元数据的语音识别结果。

2.如权利要求1所述的方法，其特征在于，所述通过集成神经网络依次将多个所述语音单元数据进行编码，包括：
提取多个所述语音单元数据的语音标识信息和位置信息；
将所述语音标识信息和所述位置信息进行组合，得到多个所述语音单元数据的语音单元特征；
通过集成神经网络依次将多个所述语音单元特征进行编码。

3.如权利要求2所述的方法，其特征在于，所述通过集成神经网络依次将多个所述语音单元特征进行编码，包括：
将第i个所述语音单元特征输入至所述集成神经网络进行编码，其中i的初始值为1，i为正整数；
当得到所述集成神经网络输出的第i个所述语音单元特征的编码数据时，令i=i+1，再次执行所述将第i个所述语音单元特征输入至所述集成神经网络进行编码的操作。

4.如权利要求1所述的方法，其特征在于，当所述集成神经网络部署于客户端，则所述解码器部署于服务器，或者当所述集成神经网络部署于CPU，则所述解码器部署于GPU。

5.如权利要求1所述的方法，其特征在于，所述解码器的数量为多个，所述将所述编码数据输入至与所述集成神经网络分开部署的解码器进行解码包括：
根据分配算法从多个所述解码器中确定目标解码器；
将所述编码数据输入至所述...

【专利技术属性】
技术研发人员：陈诚，黄石磊，程刚，
申请(专利权)人：深圳市北科瑞声科技股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人