语音活动侦测方法及装置制造方法及图纸

技术编号：17009801 阅读：37 留言：0更新日期：2018-01-11 06:03

语音活动侦测方法及装置，所述方法包括：将获取的含噪语音信号进行J层小波分解，得到J+1个子带，其中，J为预设的数值且J≥1；采用离散沃尔什变换，计算各个子带的小波系数集；根据各个子带的小波系数集，对各个子带进行Teager能量算子处理，得到各个子带的Teager能量；根据各个子带的Teager能量，计算得到各个子带的子带域自相关函数值；根据各个子带的子带域自相关函数值，采用平均增量法计算得到各个子带的平均增量值；将各个子带的平均增量值进行相加得到所述含噪语音信号的语音活动侦测分值；当确定所述含噪语音信号的语音活动侦测分值大于预设的阈值时，确定所述含噪语音信号中包括语音信息。上述的方案，可以提高语音活动侦测的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
语音活动侦测方法及装置
本专利技术涉及语音检测
，特别是涉及一种语音活动侦测方法及装置。
技术介绍
移动终端，是指可以在移动中使用的计算机设备，广义地讲包括手机、笔记本、平板电脑、POS机、车载电脑等。随着集成电路技术的飞速发展，移动终端已经拥有了强大的处理能力，移动终端正在从简单的通话工具变为一个综合信息处理平台，这也给移动终端增加了更加宽广的发展空间。移动终端的使用，通常需要用户集中一定的注意力。如今的移动终端设备都配备有触摸屏，用户需要触摸所述触摸屏，以执行相应的操作。但是，用户无法触碰到移动终端设备时，操作移动终端便会变得极其不方便。例如，当用户驾驶车辆或者手中提有物品的时候。语音活动侦测方法和总听系统(AlwaysListeningSystem)的使用，使得可以对移动终端进行非手动激活和操作。当所述总听系统检测到声音信号时，语音检测系统便会激活，并对检测到的声音信号进行识别，之后，移动终端便会根据所识别出的声音信号执行相应的操作，例如，当用户输入“拨打XX的手机”的语音时，移动终端便可以对用户输入的“拨打XX的手机”的语音信息进行识别，并在正确识别后，从移动终端中获取XX的手机号码的信息，并拨打。现有技术，基于能量估计的语音活动侦测方法，对噪音较为敏感，当噪音类型发生变化时，存在着检测准确性差的问题。
技术实现思路
本专利技术实施例解决的问题是如何提高语音活动侦测的准确性。为解决上述问题，本专利技术实施例提供了一种语音活动侦测方法，所述语音活动侦测方法包括：将获取的含噪语音信号进行J层小波分解，得到J+1个子带，其中，J为预设的数值且J≥1；采...
语音活动侦测方法及装置

【技术保护点】
一种语音活动侦测方法，其特征在于，包括：将获取的含噪语音信号进行J层小波分解，得到J+1个子带，其中，J为预设的数值且J≥1；采用离散沃尔什变换，计算各个子带的小波系数集；根据各个子带的小波系数集，对各个子带进行Teager能量算子处理，得到各个子带的Teager能量；根据各个子带的Teager能量，计算得到各个子带的子带域自相关函数值；根据各个子带的子带域自相关函数值，采用平均增量法计算得到各个子带的平均增量值；将各个子带的平均增量值进行相加得到所述含噪语音信号的语音活动侦测分值；当确定所述含噪语音信号的语音活动侦测分值大于预设的阈值时，确定所述含噪语音信号中包括语音信息。

【技术特征摘要】
1.一种语音活动侦测方法，其特征在于，包括：将获取的含噪语音信号进行J层小波分解，得到J+1个子带，其中，J为预设的数值且J≥1；采用离散沃尔什变换，计算各个子带的小波系数集；根据各个子带的小波系数集，对各个子带进行Teager能量算子处理，得到各个子带的Teager能量；根据各个子带的Teager能量，计算得到各个子带的子带域自相关函数值；根据各个子带的子带域自相关函数值，采用平均增量法计算得到各个子带的平均增量值；将各个子带的平均增量值进行相加得到所述含噪语音信号的语音活动侦测分值；当确定所述含噪语音信号的语音活动侦测分值大于预设的阈值时，确定所述含噪语音信号中包括语音信息。2.根据权利要求1所述的语音活动侦测方法，其特征在于，J＝3。3.根据权利要求2所述的语音活动侦测方法，其特征在于，所述采用离散沃尔什变换，计算各个子带的小波系数集，包括：其中,表示第K个子带的第n个小波系数，DWT(.)表示离散沃尔什运算，且K＝1...4，n＝1...N，N为预设的数值。4.根据权利要求3所述的语音活动侦测方法，其特征在于，所述根据各个子带的小波系数集，对各个子带进行Teager能量算子处理，得到各个子带的Teager能量，包括：其中，表示第K个子带的Teager能量,T[.]表示TEO运算。5.根据权利要求4所述的语音活动侦测方法，其特征在于，所述根据各个子带的Teager能量，计算各个子带的子带域自相关函数值，包括：且：其中，表示第K个子带的子带域自相关函数值，k＝0....p，p表示所述子带域自相关函数的自相关长度，k表示样本偏移量，s(n)表示第K个子带的第n个采样点的频谱能量，s(n+k)表示第K个子带中与第n个采样点之间的偏移量为k的采样点的频谱能量。6.根据权利要求5所述的语音活动侦测方法，其特征在于，所述根据各个子带的子带域自相关函数值，采用平均增量法计算得到各个子带的平均增量值，包括：其中，表示第K个子带的平均增量值，Δ[.]表示平均增量运算。7.一种语音活动侦测装置，其特征在于，包括：小波分解单元，适...

【专利技术属性】
技术研发人员：孙廷玮，柯逸倩，
申请(专利权)人：展讯通信上海有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人