语音识别方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号：34328365 阅读：20 留言：0更新日期：2022-07-31 01:35

本申请公开了一种语音识别方法、装置、电子设备和可读存储介质，属于人工智能技术领域。其中，所述方法包括：对目标音频进行分频处理，得到目标帧；获取目标帧的采样点的最大值；在连续a1个目标帧的采样点的最大值均小于第一阈值的情况下，将连续a1个目标帧确定为一个间隙帧子序列，连续的N1个间隙帧子序列为一个间隙帧序列，a1、N1均为正整数；在连续a2个目标帧中，至少有一个目标帧的采样点的最大值大于或者等于第一阈值的情况下，将连续a2个目标帧确定为一个语音帧子序列，a2、N2均为正整数，连续的N2个语音帧子序列为一个语音帧序列；根据静音段、间隙帧序列和语音帧序列，确定截断位置；识别与截断位置相关联的目标帧。识别与截断位置相关联的目标帧。识别与截断位置相关联的目标帧。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、电子设备和可读存储介质

[0001]本申请属于人工智能
，具体涉及一种语音识别方法、装置、电子设备和可读存储介质。

技术介绍

[0002]目前，语音识别分为流式识别和非流式识别，流式识别是指：在用户说话的时候便进行语音识别；非流式识别是指：用户说完一句话或者一段话之后再进行识别。流式识别因为其延迟低的特点，能够给用户带来更好的体验，应用也更为广泛。
[0003]流式识别过程为：对于一条音频“某国崛起”，用户在说“某国”的时候，音频段达到预设值(如500ms)，识别到的结果是“某国”；重新计时，当用户继续说“崛”的时候，音频段再次达到500ms，识别到的结果是“崛”；以此类推，直至完成整段音频的识别。在流式识别的过程中，是以固定时长作为识别单位来依次完成多次识别的，因此，很有可能出现的现象为：用户所说的某个字刚好出现在两个固定时长的边界处，如第一个500ms的结束处，以及第二个500ms的开始处，从而使得这个字的音频被拆分，进而导致无法准确识别这个字。
[0004]可见，现有技术中的流式语音识别的准确率较低。

技术实现思路

[0005]本申请实施例的目的是提供一种语音识别方法，能够解决现有技术中的流式语音识别的准确率较低的问题。
[0006]第一方面，本申请实施例提供了一种语音识别方法，该方法包括：对目标音频进行分频处理，得到目标帧；获取所述目标帧的采样点的最大值；在连续a1个目标帧的采样点的最大值均小于第一阈值的情况下，将所述连续a1个目标帧确定为一个...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，其特征在于，所述方法包括：对目标音频进行分频处理，得到目标帧；获取所述目标帧的采样点的最大值；在连续a1个目标帧的采样点的最大值均小于第一阈值的情况下，将所述连续a1个目标帧确定为一个间隙帧子序列，连续的N1个间隙帧子序列为一个间隙帧序列，a1、N1均为正整数；在连续a2个目标帧中，至少有一个目标帧的采样点的最大值大于或者等于所述第一阈值的情况下，将所述连续a2个目标帧确定为一个语音帧子序列，a2、N2均为正整数，连续的N2个语音帧子序列为一个语音帧序列；根据所述目标音频的静音段、所述目标音频的间隙帧序列和所述目标音频的语音帧序列，确定截断位置；识别与所述截断位置相关联的目标帧。2.根据权利要求1所述的方法，其特征在于，所述根据所述目标音频的静音段、所述目标音频的间隙帧序列和所述目标音频的语音帧序列，确定截断位置，包括：在检测到的语音帧序列的个数满足第二阈值的情况下，在最后一个语音帧序列相邻的下一个间隙帧序列所在区间确定截断位置；其中，与所述截断位置相关联的目标帧包括：所述检测到连续的语音帧序列中的目标帧，以及，所述检测到连续的语音帧序列之间间隔的间隙帧序列中的目标帧。3.根据权利要求1所述的方法，其特征在于，所述根据所述目标音频的静音段、所述目标音频的间隙帧序列和所述目标音频的语音帧序列，确定截断位置，包括：在依次检测到第一语音帧序列、第一静音段的情况下，在所述第一静音段所在区间确定截断位置；其中，与所述截断位置相关联的目标帧包括：第一语音段中的目标帧，所述第一语音段包括所述第一语音帧序列。4.根据权利要求1所述的方法，其特征在于，所述根据所述目标音频的静音段、所述目标音频的间隙帧序列和所述目标音频的语音帧序列，确定截断位置，包括：在第二语音帧序列的下一时刻检测到目标输入的情况下，在所述第二语音帧序列的下一时刻对应区间确定截断位置，所述目标输入用于停止接收所述目标音频；其中，与所述截断位置相关联的目标帧包括：所述第二语音段中的目标帧，所述第二语音段包括所述第二语音帧序列。5.一种语音识别装置，其特征在于，所述装置包括：分频模块，用于对目标音频进行分频处理，得到目标帧；获取模块，用于获取所述目标帧的采样点的最...

【专利技术属性】
技术研发人员：李祥鹏，
申请(专利权)人：维沃移动通信有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人