当前位置: 首页 > 专利查询>广东粤港澳大湾区国家纳米科技创新研究院专利>正文

VAD识别方法、装置、存储介质及计算机设备制造方法及图纸

技术编号：40593783 阅读：23 留言：0更新日期：2024-03-12 21:55

本申请提供了一种VAD识别方法、装置、存储介质及计算机设备。该方法包括：获取音频信号；将音频信号输入至识别模型得到音频信号的VAD识别结果；基于VAD识别结果确定的非语音音频帧和语音音频帧分别提取非语音特征、语音特征；根据非语音特征和语音特征更新识别模型；将音频信号输入至更新后的识别模型得到新的VAD识别结果；若根据新的VAD识别结果与历史识别结果判断未满足收敛条件，则基于当前的VAD识别结果确定的非语音音频帧和语音音频帧分别提取非语音特征、语音特征，并基于当前提取的非语音特征和语音特征更新当前使用的识别模型，重新对音频信号进行识别，直至重新识别的VAD识别结果满足收敛条件时输出满足收敛条件的VAD识别结果。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音识别，尤其涉及一种vad识别方法、装置、存储介质及计算机设备。

技术介绍

1、随着人机交互技术的不断发展，对于语音识别准确性的要求也越来越高，在语音识别技术中，需要利用语音端点检测技术在连续声音信号中找出语音部分的起始点和终止点，语音端点检测技术通常也称为语音活动性检测技术(voice activity detection，vad)。因此vad识别的准确性对语音识别的准确性会产生直接影响，但目前的vad识别方法仍然存在识别不准的问题。

技术实现思路

1、本申请实施例提供了一种vad识别方法、装置、存储介质及计算机设备，能够提高vad识别的准确性。

2、第一方面，本申请提供了一种vad识别方法，所述方法包括：

3、获取音频信号；

4、将所述音频信号输入至预设的识别模型得到所述音频信号的vad识别结果；所述vad识别结果用于标识所述音频信号中的非语音音频帧和语音音频帧；

5、基于所述vad识别结果确定的非语音音频帧和语音音频帧分别提...

【技术保护点】

1.一种VAD识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的VAD识别方法，其特征在于，所述收敛条件为当前的VAD识别结果与历史识别结果的相似度达到预设阈值。

3.根据权利要求2所述的VAD识别方法，其特征在于，识别模型包括非语音识别模型和语音识别模型，所述VAD识别结果包括非语音音频帧识别结果和语音音频帧识别结果；执行将所述音频信号输入至识别模型得到所述音频信号的VAD识别结果，包括：

4.根据权利要求3所述的VAD识别方法，其特征在于，判断VAD识别结果是否满足收敛条件，包括：

5.根据权利要求3所述的VAD识别方法，其...

【技术特征摘要】

1.一种vad识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的vad识别方法，其特征在于，所述收敛条件为当前的vad识别结果与历史识别结果的相似度达到预设阈值。

3.根据权利要求2所述的vad识别方法，其特征在于，识别模型包括非语音识别模型和语音识别模型，所述vad识别结果包括非语音音频帧识别结果和语音音频帧识别结果；执行将所述音频信号输入至识别模型得到所述音频信号的vad识别结果，包括：

4.根据权利要求3所述的vad识别方法，其特征在于，判断vad识别结果是否满足收敛条件，包括：

5.根据权利要求3所述的vad识别方法，其特征在于，所述根据所述非语音特征和所述语音特征更新所述识别模型，包括：

6.根据权利...

【专利技术属性】
技术研发人员：冯霁，周耀杰，
申请(专利权)人：广东粤港澳大湾区国家纳米科技创新研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人