语音识别方法和装置、计算机可读存储介质、电子设备制造方法及图纸

技术编号：29217923 阅读：20 留言：0更新日期：2021-07-10 00:56

本公开实施例公开了一种语音识别方法和装置、计算机可读存储介质、电子设备，其中，方法包括：将在应用场景中获取到的语音信号处理为多组语音特征；通过一个预测库分别对所述多组语音特征进行处理，得到多个预测结果；基于所述多个预测结果，确定所述应用场景中的语音识别结果；本实施例通过使用一个预测库对多组语音特征进行预测，降低了内存的占用空间，使本实施例提供方法可以应用在内存较小的系统上，提高语音识别方法的适用范围。提高语音识别方法的适用范围。提高语音识别方法的适用范围。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法和装置、计算机可读存储介质、电子设备

[0001]本公开涉及语音识别
，尤其是一种语音识别方法和装置、计算机可读存储介质、电子设备。

技术介绍

[0002]在关键词唤醒的场景中，由于不同场景下降噪效果侧重点不同，为了达到较好的识别效果，经常会开启多路解码器来进行解码，因此增加了系统的内存占用。而在系统资源有限的平台上，内存是比较有限的资源，因此无法实现解码。

技术实现思路

[0003]为了解决上述技术问题，提出了本公开。本公开的实施例提供了一种语音识别方法和装置、计算机可读存储介质、电子设备。
[0004]根据本公开实施例的一个方面，提供了一种语音识别方法，包括：
[0005]将在应用场景中获取到的语音信号处理为多组语音特征；
[0006]通过一个预测库分别对所述多组语音特征进行处理，得到多个预测结果；
[0007]基于所述多个预测结果，确定所述应用场景中的语音识别结果。
[0008]根据本公开实施例的另一方面，提供了一种语音识别装置，包括：
[0009]信号处理模块，用于将在应用场景中获取到的语音信号处理为多组语音特征；
[0010]特征预测模块，用于通过一个预测库分别对所述信号处理模块得到的多组语音特征进行处理，得到多个预测结果；
[0011]语音识别模块，用于基于所述特征预测模块得到的多个预测结果，确定所述应用场景中的语音识别结果。
[0012]根据本公开实施例的又一方面，提供了一种计算机可读存储介质，所述...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，包括：将在应用场景中获取到的语音信号处理为多组语音特征；通过一个预测库分别对所述多组语音特征进行处理，得到多个预测结果；基于所述多个预测结果，确定所述应用场景中的语音识别结果。2.根据权利要求1所述的方法，在将在应用场景中获取到的语音信号处理为多组语音特征之前，还包括：根据所述应用场景确定应用于解码的多个相同的解码器；其中，每个所述解码器对应一组所述语音特征；基于所述解码器中包括的预测模型对所述预测库进行初始化。3.根据权利要求2所述的方法，其中，所述基于所述解码器中包括的预测模型对所述预测库进行初始化，包括：根据所述解码器中包括的预测模型确定所述预测模型对应的运算逻辑；根据所述运算逻辑对所述预测库进行初始化，使所述预测库在运行时按照所述预测模型的运算逻辑进行预测处理。4.根据权利要求2所述的方法，在基于所述解码器中包括的预测模型对所述预测库进行初始化之前，还包括：将所述解码器包括的预测模型和所述预测库加载到内存中。5.根据权利要求1
‑
4一所述的方法，其中，所述通过一个预测库分别对所述多组语音特征进行处理，得到多个预测结果，包括：运行所述预测库依次对所述多组语音特征进行概率值预测；针对所述多组语音特征中的每组语音特征，确定所述语音信号中包括的多帧信号中每帧信号为至少一个音素中每个音素的音素概率值。6.根据权利要求5所述的方法，所述运行所述预测库依次对所述多...

【专利技术属性】
技术研发人员：黄明运，
申请(专利权)人：南京地平线机器人技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人