语音活动侦测方法及装置制造方法及图纸

技术编号:17009801 阅读:37 留言:0更新日期:2018-01-11 06:03
语音活动侦测方法及装置,所述方法包括:将获取的含噪语音信号进行J层小波分解,得到J+1个子带,其中,J为预设的数值且J≥1;采用离散沃尔什变换,计算各个子带的小波系数集;根据各个子带的小波系数集,对各个子带进行Teager能量算子处理,得到各个子带的Teager能量;根据各个子带的Teager能量,计算得到各个子带的子带域自相关函数值;根据各个子带的子带域自相关函数值,采用平均增量法计算得到各个子带的平均增量值;将各个子带的平均增量值进行相加得到所述含噪语音信号的语音活动侦测分值;当确定所述含噪语音信号的语音活动侦测分值大于预设的阈值时,确定所述含噪语音信号中包括语音信息。上述的方案,可以提高语音活动侦测的准确性。

【技术实现步骤摘要】
语音活动侦测方法及装置
本专利技术涉及语音检测
,特别是涉及一种语音活动侦测方法及装置。
技术介绍
移动终端,是指可以在移动中使用的计算机设备,广义地讲包括手机、笔记本、平板电脑、POS机、车载电脑等。随着集成电路技术的飞速发展,移动终端已经拥有了强大的处理能力,移动终端正在从简单的通话工具变为一个综合信息处理平台,这也给移动终端增加了更加宽广的发展空间。移动终端的使用,通常需要用户集中一定的注意力。如今的移动终端设备都配备有触摸屏,用户需要触摸所述触摸屏,以执行相应的操作。但是,用户无法触碰到移动终端设备时,操作移动终端便会变得极其不方便。例如,当用户驾驶车辆或者手中提有物品的时候。语音活动侦测方法和总听系统(AlwaysListeningSystem)的使用,使得可以对移动终端进行非手动激活和操作。当所述总听系统检测到声音信号时,语音检测系统便会激活,并对检测到的声音信号进行识别,之后,移动终端便会根据所识别出的声音信号执行相应的操作,例如,当用户输入“拨打XX的手机”的语音时,移动终端便可以对用户输入的“拨打XX的手机”的语音信息进行识别,并在正确识别后,从移动终端中获取XX的手机号码的信息,并拨打。现有技术,基于能量估计的语音活动侦测方法,对噪音较为敏感,当噪音类型发生变化时,存在着检测准确性差的问题。
技术实现思路
本专利技术实施例解决的问题是如何提高语音活动侦测的准确性。为解决上述问题,本专利技术实施例提供了一种语音活动侦测方法,所述语音活动侦测方法包括:将获取的含噪语音信号进行J层小波分解,得到J+1个子带,其中,J为预设的数值且J≥1;采用离散沃尔什变换,计算各个子带的小波系数集;根据各个子带的小波系数集,对各个子带进行Teager能量算子处理,得到各个子带的Teager能量;根据各个子带的Teager能量,计算得到各个子带的子带域自相关函数值;根据各个子带的子带域自相关函数值,采用平均增量法计算得到各个子带的平均增量值;将各个子带的平均增量值进行相加得到所述含噪语音信号的语音活动侦测分值;当确定所述含噪语音信号的语音活动侦测分值大于预设的阈值时,确定所述含噪语音信号中包括语音信息。可选地,J=3。可选地,所述采用离散沃尔什变换,计算各个子带的小波系数集,包括:其中,表示第K个子带的第n个小波系数,DWT(.)表示离散沃尔什运算,且K=1…4,n=1…N,N为预设的数值。可选地,所述根据各个子带的小波系数集,对各个子带进行Teager能量算子处理,得到各个子带的Teager能量,包括:其中,表示第K个子带的Teager能量,T[.]表示TEO运算。可选地,所述根据各个子带的Teager能量,计算各个子带的子带域自相关函数值,包括:且:其中,表示第K个子带的子带域自相关函数值,k=0….p,p表示所述子带域自相关函数的自相关长度,k表示样本偏移量,s(n)表示第K个子带的第n个采样点的频谱能量,s(n+k)表示第K个子带中与第n个采样点之间的偏移量为k的采样点的频谱能量。可选地,所述根据各个子带的子带域自相关函数值,采用平均增量法计算得到各个子带的平均增量值,包括:其中,表示第K个子带的平均增量值,Δ[.]表示平均增量运算。本专利技术实施例还提供了一种语音活动侦测装置,包括:小波分解单元,适于将获取的含噪语音信号进行J层小波分解,得到J+1个子带,其中,J为预设的数值且J≥1;小波变换计算单元,适于采用离散沃尔什变换,计算各个子带的小波系数集;Teager能量算子计算单元,适于根据各个子带的小波系数集,对各个子带进行Teager能量算子处理,得到各个子带的Teager能量;自相关函数计算单元,适于根据各个子带的Teager能量,计算得到各个子带的子带域自相关函数值;平均增量计算单元,适于根据各个子带的子带域自相关函数值,采用平均增量法计算得到各个子带的平均增量值;语音活动侦测计算单元,适于将各个子带的平均增量值进行相加得到所述含噪语音信号的语音活动侦测分值;当确定所述含噪语音信号的语音活动侦测分值大于预设的阈值时,确定所述含噪语音信号中包括语音信息。可选地,J=3。可选地,所述小波变换计算单元适于采用如下的公式计算各个子带的小波系数集:其中,表示第K个子带的第n个小波系数,DWT(.)表示离散沃尔什运算,且K=1…4,n=1…N,N为预设的数值。可选地,所述Teager能量算子计算单元,适于采用如下的公式极端得到各个子带的Teager能量:其中,表示第K个子带的Teager能量,T[.]表示TEO运算。可选地,所述自相关函数计算单元适于采用如下的公式计算各个子带的子带域自相关函数值:且:其中,表示第K个子带的子带域自相关函数值,k=0….p,p表示所述子带域自相关函数的自相关长度,k表示样本偏移量,s(n)表示第K个子带的第n个采样点的频谱能量,s(n+k)表示第K个子带中与第n个采样点之间的偏移量为k的采样点的频谱能量。可选地,所述平均增量计算单元适于采用如下的公式计算得到各个子带的平均增量值:其中,表示第K个子带的平均增量值,Δ[.]表示平均增量运算。与现有技术相比,本专利技术的技术方案具有以下的优点:上述的方案,将小波变换和Teager能量算子、自相关函数相结合计算得到含噪语音信号的VAD值,以确定是否对输入的声音信号进行检测,由于小波变换和Teager能量算子、自相关函数相结合计算得到的含噪语音信号的VAD值不受噪音类型的影响,因此,可以提高语音活动侦测的准确性。附图说明图1是本专利技术实施例中的一种语音活动侦测方法的流程图;图2是本专利技术实施例中的执行三层小波分解的过程示意图;图3是本专利技术实施例中的一种语音活动侦测装置的结构示意图。具体实施方式正如
技术介绍
而言,现有技术中的语音活动侦测(VoiceActivityDetection,VAD)方法,通常基于待分析的声音片段的能量来进行语音活动侦测。采用这种VAD法进行语音活动侦测较为简单,且不需要进行任何的噪音属性的估计。然而,基于能量的VAD法对于噪音较为敏感,当噪音类型发生变化时,会造成检测性能的降低,影响了检测的准确性。特别是语音片段中的静音片段,可能会因能量较低而被标识为噪音片段。因此,现有技术中基于能量的VAD法存在着语音识别准确性低的问题。为解决现有技术中存在的上述问题,本专利技术实施例采用的技术方案将小波变换和Teager能量算子、自相关函数相结合计算得到含噪语音信号的VAD值,以确定是否对输入的声音信号进行检测,使得计算得到的含噪语音信号的VAD值不受噪音类型的影响,因而可以提高语音活动侦测的准确性。为使本专利技术的上述目的、特征和优点能够更为明显易懂,下面结合附图对本专利技术的具体实施例做详细的说明。图1示出了本专利技术实施例中的一种语音活动侦测方法的流程图。如图1所示的语音活动侦测方法,可以包括:步骤S101:将获取的含噪语音信号进行J层小波分解,得到J+1个子带。在具体实施中,小波变换(WaveletTransform,WT)是基于时频信号的分析方法。小波变换是一种窗口大小不变但形状可变的窗技术。当需要较为准确的低频信息时,可以使用较长时间的时间间隔;当需要较为准确的高频信息时,可以使用较短的区域。语音信号中通常包括较多的瞬时元素和非本文档来自技高网
...
语音活动侦测方法及装置

【技术保护点】
一种语音活动侦测方法,其特征在于,包括:将获取的含噪语音信号进行J层小波分解,得到J+1个子带,其中,J为预设的数值且J≥1;采用离散沃尔什变换,计算各个子带的小波系数集;根据各个子带的小波系数集,对各个子带进行Teager能量算子处理,得到各个子带的Teager能量;根据各个子带的Teager能量,计算得到各个子带的子带域自相关函数值;根据各个子带的子带域自相关函数值,采用平均增量法计算得到各个子带的平均增量值;将各个子带的平均增量值进行相加得到所述含噪语音信号的语音活动侦测分值;当确定所述含噪语音信号的语音活动侦测分值大于预设的阈值时,确定所述含噪语音信号中包括语音信息。

【技术特征摘要】
1.一种语音活动侦测方法,其特征在于,包括:将获取的含噪语音信号进行J层小波分解,得到J+1个子带,其中,J为预设的数值且J≥1;采用离散沃尔什变换,计算各个子带的小波系数集;根据各个子带的小波系数集,对各个子带进行Teager能量算子处理,得到各个子带的Teager能量;根据各个子带的Teager能量,计算得到各个子带的子带域自相关函数值;根据各个子带的子带域自相关函数值,采用平均增量法计算得到各个子带的平均增量值;将各个子带的平均增量值进行相加得到所述含噪语音信号的语音活动侦测分值;当确定所述含噪语音信号的语音活动侦测分值大于预设的阈值时,确定所述含噪语音信号中包括语音信息。2.根据权利要求1所述的语音活动侦测方法,其特征在于,J=3。3.根据权利要求2所述的语音活动侦测方法,其特征在于,所述采用离散沃尔什变换,计算各个子带的小波系数集,包括:其中,表示第K个子带的第n个小波系数,DWT(.)表示离散沃尔什运算,且K=1...4,n=1...N,N为预设的数值。4.根据权利要求3所述的语音活动侦测方法,其特征在于,所述根据各个子带的小波系数集,对各个子带进行Teager能量算子处理,得到各个子带的Teager能量,包括:其中,表示第K个子带的Teager能量,T[.]表示TEO运算。5.根据权利要求4所述的语音活动侦测方法,其特征在于,所述根据各个子带的Teager能量,计算各个子带的子带域自相关函数值,包括:且:其中,表示第K个子带的子带域自相关函数值,k=0....p,p表示所述子带域自相关函数的自相关长度,k表示样本偏移量,s(n)表示第K个子带的第n个采样点的频谱能量,s(n+k)表示第K个子带中与第n个采样点之间的偏移量为k的采样点的频谱能量。6.根据权利要求5所述的语音活动侦测方法,其特征在于,所述根据各个子带的子带域自相关函数值,采用平均增量法计算得到各个子带的平均增量值,包括:其中,表示第K个子带的平均增量值,Δ[.]表示平均增量运算。7.一种语音活动侦测装置,其特征在于,包括:小波分解单元,适...

【专利技术属性】
技术研发人员:孙廷玮柯逸倩
申请(专利权)人:展讯通信上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1