【技术实现步骤摘要】
一种应用于智能语音鼠标的VAD检测方法
本专利技术属于语音识别
,涉及一种VAD检测方法,具体是一种应用于智能语音鼠标的VAD检测方法。
技术介绍
采用智能语音鼠标进行人机交互时,当智能语音鼠标采集到音频的音量过小时,上传到服务器上不能正确识别出结果,需要智能语音鼠标给予正确的提示,提醒说话者增大说话的声音。VAD检测技术是对采集的音频进行检测,通过对音频进行处理,判断音频是否符合识别要求。目前已有的VAD检测主要通过计算采集到一段音频的能量值和短时过零率,并判断能量值和过零率是否大于阈值来判断是否是语音的端点,其只能判断出一段音频的端点,而不能判断这段音频音量的大小,无法起到提示用户正确运用语音与机器进行交互。
技术实现思路
本专利技术提供了一种应用于智能语音鼠标的VAD检测方法,通过对语音的音量以及声音的连续性进行检测,判断用户与机器交互的方式是否正确,提升正确的人机交互方式。本专利技术的目的可以通过以下技术方案实现:一种应用于智能语音鼠标的VAD检测方法,包括以下步骤:步骤S1,智能语音鼠标通过其内置的高性能麦克风采集到用户说话的音频数据,并将其划分为若干 ...
【技术保护点】
一种应用于智能语音鼠标的VAD检测方法,其特征在于,包括以下步骤:步骤S1,智能语音鼠标通过其内置的高性能麦克风采集到用户说话的音频数据,并将其划分为若干音频块;步骤S2,对智能语音鼠标采集到一段音频数据中的任一音频块进行分帧处理;步骤S3,计算分帧处理后音频块每一帧的短时能量值。步骤S4,计算分帧处理后音频块所有帧的能量和;步骤S5,计算分帧处理后音频块一帧的平均能量值;步骤S6,将步骤S5中计算出的平均能量值与预设阀值进行比较,判断平均能量值是否大于预设阈值,若平均能量值大于或等于预设阈值,VAD检测的结果置1,若平均能量值小于预设阈值,VAD检测的结果置0;步骤S7, ...
【技术特征摘要】
1.一种应用于智能语音鼠标的VAD检测方法,其特征在于,包括以下步骤:步骤S1,智能语音鼠标通过其内置的高性能麦克风采集到用户说话的音频数据,并将其划分为若干音频块;步骤S2,对智能语音鼠标采集到一段音频数据中的任一音频块进行分帧处理;步骤S3,计算分帧处理后音频块每一帧的短时能量值。步骤S4,计算分帧处理后音频块所有帧的能量和;步骤S5,计算分帧处理后音频块一帧的平均能量值;步骤S6,将步骤S5中计算出的平均能量值与预设阀值进行比较,判断平均能量值是否...
【专利技术属性】
技术研发人员:冯海洪,朱国冉,许成亮,
申请(专利权)人:安徽咪鼠科技有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。