【技术实现步骤摘要】
本申请涉及语音识别,尤其涉及一种vad识别方法、装置、存储介质及计算机设备。
技术介绍
1、随着人机交互技术的不断发展,对于语音识别准确性的要求也越来越高,在语音识别技术中,需要利用语音端点检测技术在连续声音信号中找出语音部分的起始点和终止点,语音端点检测技术通常也称为语音活动性检测技术(voice activity detection,vad)。因此vad识别的准确性对语音识别的准确性会产生直接影响,但目前的vad识别方法仍然存在识别不准的问题。
技术实现思路
1、本申请实施例提供了一种vad识别方法、装置、存储介质及计算机设备,能够提高vad识别的准确性。
2、第一方面,本申请提供了一种vad识别方法,所述方法包括:
3、获取音频信号;
4、将所述音频信号输入至预设的识别模型得到所述音频信号的vad识别结果;所述vad识别结果用于标识所述音频信号中的非语音音频帧和语音音频帧;
5、基于所述vad识别结果确定的非语音音频帧和语音音频帧分别提
...【技术保护点】
1.一种VAD识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的VAD识别方法,其特征在于,所述收敛条件为当前的VAD识别结果与历史识别结果的相似度达到预设阈值。
3.根据权利要求2所述的VAD识别方法,其特征在于,识别模型包括非语音识别模型和语音识别模型,所述VAD识别结果包括非语音音频帧识别结果和语音音频帧识别结果;执行将所述音频信号输入至识别模型得到所述音频信号的VAD识别结果,包括:
4.根据权利要求3所述的VAD识别方法,其特征在于,判断VAD识别结果是否满足收敛条件,包括:
5.根据权利要求3所述
...【技术特征摘要】
1.一种vad识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的vad识别方法,其特征在于,所述收敛条件为当前的vad识别结果与历史识别结果的相似度达到预设阈值。
3.根据权利要求2所述的vad识别方法,其特征在于,识别模型包括非语音识别模型和语音识别模型,所述vad识别结果包括非语音音频帧识别结果和语音音频帧识别结果;执行将所述音频信号输入至识别模型得到所述音频信号的vad识别结果,包括:
4.根据权利要求3所述的vad识别方法,其特征在于,判断vad识别结果是否满足收敛条件,包括:
5.根据权利要求3所述的vad识别方法,其特征在于,所述根据所述非语音特征和所述语音特征更新所述识别模型,包括:
6.根据权利...
【专利技术属性】
技术研发人员:冯霁,周耀杰,
申请(专利权)人:广东粤港澳大湾区国家纳米科技创新研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。