【技术实现步骤摘要】
声音活动检测方法及装置和计算机可读存储介质
本专利技术属于声音活动检测领域,具体涉及一种声音活动检测方法及装置以及计算机可读存储介质,用于目标声音活动的检测,例如用于语音活动检测。
技术介绍
随着智能电子设备的普及和开发,很多智能电子设备集成了声音活动检测功能,例如语音活动检测功能,以检测人声活动,进一步提高人机交互的趣味性、便捷性和实用性。另外,为了降低电子设备的运行功耗,尤其是便携式电子设备的功耗(考虑到便携式电子设备上有限的电池电量),也采用声音活动检测技术来唤醒和启动设备中功耗更大的模块,这样,在该功耗更大的模块不需要运行时就可以处于休眠或停止运行状态,仅在通过声音活动检测装置检测到触发条件时再唤醒和启动该功耗更大的模块,从而降低电子设备的整体功耗。另外,在现有的声音活动检测技术中,往往会采用频域处理技术来实现声音活动检测装置内部的计算,使得计算复杂、装置的软/硬件实现复杂且成本高,而且功耗大。因此,需要实现更加简单、功耗更低的声音活动检测方法和装置。
技术实现思路
针对上面提到的声音活动检测装置本身的内部计算复杂、其软/硬件实现复杂且成本高、功耗大的问题,提 ...
【技术保护点】
1.一种声音活动检测方法,其特征在于,包括:获取声音输入信号;对所述声音输入信号进行滤波,得到滤波后声音信号;计算所述滤波后声音信号的能量与所述声音输入信号的能量的比值;以及将所述比值与预定阈值进行比较,根据比较结果判断是否存在目标声音活动。
【技术特征摘要】
1.一种声音活动检测方法,其特征在于,包括:获取声音输入信号;对所述声音输入信号进行滤波,得到滤波后声音信号;计算所述滤波后声音信号的能量与所述声音输入信号的能量的比值;以及将所述比值与预定阈值进行比较,根据比较结果判断是否存在目标声音活动。2.根据权利要求1所述的声音活动检测方法,其特征在于,所述计算所述滤波后声音信号的能量与所述声音输入信号的能量的比值包括:在时域中计算所述滤波后声音信号的能量以及所述声音输入信号的能量,以计算所述滤波后声音信号的能量与所述声音输入信号的能量的比值。3.根据权利要求1或2所述的声音活动检测方法,其特征在于,所述根据比较结果判断是否存在目标声音活动包括:如果比较结果是所述比值大于所述预定阈值或者所述比值大于或等于所述预定阈值,则判断存在目标声音活动,否则判断不存在目标声音活动。4.根据权利要求1所述的声音活动检测方法,其特征在于,对所述声音输入信号进行滤波是利用具有预定通带的滤波模块进行。5.根据权利要求4所述的声音活动检测方法,其特征在于,所述预定通带包括人声频率范围,或者所述滤波模块为带通滤波器,所述预定通带的频率范围为20Hz~20kHz,或者为60Hz~2kHz,或者为150Hz~2kHz。6.根据权利要求4或5所述的声音活动检测方法,其特征在于,所述滤波模块为复合带通滤波器,由依次连接的第一滤波器、降采样器和第二滤波器构成,其中所述第一滤波器的通带与所述第二滤波器的通带至少部分交叠,并且在计算所述声音输入信号的能量之前以与所述降采样器一样的降采样率对所述声音输入信号进行降采样。7.根据权利要求6所述的声音活动检测方法,其特征在于,所述第一滤波器为低通滤波器,所述第二滤波器为高通滤波器或带通滤波器,且所述低通滤波器的截止频率高于所述高通滤波器的截止频率,或所述低通滤波器的截止频率高于所述带通滤波器的下限截止频率且低于所述带通滤波器的上限截止频率;或者所述第一滤波器为带阻滤波器,所述第二滤波器为带通滤波器,所述带阻滤波器的下限截止频率在所述带通滤波器的下限截止频率与上限截止频率之间,且所述带阻滤波器的上限截止频率高于所述带通滤波器的上限截止频率。8.根据权利要求1至7中任一项所述的声音活动检测方法,其特征在于,所述具有预定通带的滤波模块的预定通带的频率范围是可调节的。9.一种声音活动检测装置,其特征在于,包括:声音采集模块,其用于采集并输出声音输入信号;滤波模块,其与所述声音采集模块...
【专利技术属性】
技术研发人员:高威特,叶振昀,张楠赓,
申请(专利权)人:杭州嘉楠耘智信息科技有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。