一种麦克风语音增强方法及装置制造方法及图纸

技术编号：12713038 阅读：85 留言：0更新日期：2016-01-14 19:34

本发明专利技术提供一种麦克风语音增强方法及相应的装置。所述方法包括如下步骤：获取通过多路数字语音采集设备采集输入的第一阵列语音信号；根据所述第一阵列语音信号的最小方差自适应波束优化模型，采用第一阵列语音信号计算第一阵列语音信号所合成的最优波束输出信号；采用所述最优波束输出信号的功率谱估计值进行单通道语音增强处理；所述第一阵列语音信号的最小方差自适应波束优化模型包括目标声源到所述多路数字语音采集设备的空间导向矢量。本发明专利技术提供的麦克风语音增强方法及装置能够处理阵元较多、间距较大的语音采集设备阵列的原始语音。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音处理，特别涉及一种麦克风语音增强方法及装置。
技术介绍
随着免提通话、会议系统、智能家居和智能家电的发展，高质量的远距离语音拾音成为影响语音采集处理系统性能的关键因素之一。为了适应复杂的声音环境，单麦克风技术已经很难胜任，具有多路语音采集设备的麦克风阵列则日益成为主流，其中最常用的就是各种波束形成技术、语音增强技术等。语音增强技术需要从语音采集设备所采集的原始语音信号中提取尽可能纯净的目标语音。波束形成技术通过调整参数提高传声器阵列对某个方向声音的灵敏度，提高语音增强的效果。然而现有技术中大多数语音增强技术只能处理阵元少、间距小的语音采集设备阵列所采集的原始语音，因此传统阵列语音增强技术往往性能非常有限。
技术实现思路
针对于此，本专利技术提供一种麦克风语音增强方法及装置。所述方法及装置能够处理阵元较多、间距较大的语音采集设备阵列的原始语音。基于上述目的本专利技术提供的一种麦克风语音增强方法，包括如下步骤：获取通过多路数字语音采集设备采集输入的第一阵列语音信号；根据所述第一阵列语音信号的最小方差自适应波束优化模型，采用第一阵列语音信号计算第一阵列语音信号所合成的最优波束输出信号；采用所述最优波束输出信号的功率谱估计值进行单通道语音增强处理；所述第一阵列语音信号的最小方差自适应波束优化模型包括目标声源到所述多路数字语音采集设备的空间导向矢量。可选的，获取通过多路数字语音...

【技术保护点】
一种麦克风语音增强方法，其特征在于，包括如下步骤：获取通过多路数字语音采集设备采集输入的第一阵列语音信号；根据所述第一阵列语音信号的最小方差自适应波束优化模型，采用第一阵列语音信号计算第一阵列语音信号所合成的最优波束输出信号；采用所述最优波束输出信号的功率谱估计值进行单通道语音增强处理；所述第一阵列语音信号的最小方差自适应波束优化模型包括目标声源到所述多路数字语音采集设备的空间导向矢量。

【技术特征摘要】
1.一种麦克风语音增强方法，其特征在于，包括如下步骤：
获取通过多路数字语音采集设备采集输入的第一阵列语音信号；
根据所述第一阵列语音信号的最小方差自适应波束优化模型，采用第一阵
列语音信号计算第一阵列语音信号所合成的最优波束输出信号；
采用所述最优波束输出信号的功率谱估计值进行单通道语音增强处理；
所述第一阵列语音信号的最小方差自适应波束优化模型包括目标声源到
所述多路数字语音采集设备的空间导向矢量。
2.根据权利要求1所述的方法，其特征在于，获取通过多路数字语音采
集设备采集输入的第一阵列语音信号之前，还包括：
通过多路数字语音采集设备采集原始语音阵列信号y1(n)，……yN(n)；
对所述原始语音信号进行短时傅里叶变换得到所述原始语音阵列信号的
时频表示信号y1(k,λ)……yN(k,λ)；
采用最优超指向波束系数A(k)＝[a1(k)，......，aN(k)]T对所述时频表示信号进
行频域最优超指向波束处理，得到第一阵列语音信号i＝1……N；
所述n为离散时间变量；N为阵元个数；k为频点编号；λ为短时帧编号。
3.根据权利要求2所述的方法，其特征在于，所述最优超指向波束系数
根据所述多路数字语音采集设备的设置方式进行设定。
4.根据权利要求1所述的方法，其特征在于，根据所述第一阵列语音信
号的最小方差自适应波束优化模型，采用第一阵列语音信号计算第一阵列语音
信号所合成的最优波束输出信号时，采用下述公式：
y‾(k,λ)=Σi=1Nwi*ai*yi(k,λ);]]>为根据噪声信号列矢量和最优超指向
波束系数和目标声源到各个数字语音采集设备的空间导向矢量计算的自适应
滤波器参数；为最优超指向波束系数A(k)＝[a1(k)，......，aN(k)]T中阵元ai的共轭
复数；yi(k,λ)为所述第一阵列语音信号。
5.根据权利要求3所述的方法，其特征在于，所述第一阵列语音信号的

\t最小方差自适应波束优化模型为：
w(k)=argminw(k)wH(k)Rv~(k)w(k),]]>且满足wH(k)d~(k)=1;]]>其中，w(k)中的阵元与互为共轭复数；wH(k)为w(k)的共轭转制矩阵；
为根据所述第一阵列语音信号估计的噪声相干矩阵；为目标声源到
所述数字语音采集设备的空间导向矢量。
6.权利要求5所述的方法，其特征在于，所述目标声源到数字语音采集
设备的空间导向矢量根据下述公式计算：
d~(k)=[a1*exp(jkd1cos(θ)cfs),......,aN*exp(jkdNcos(θ)cfs)]T;]]>其中，d1……dN是第1到N个数字语音采集设备到数字语音采集设备阵列
中心的距离，c是声速；fs是采样频率；θ为目标声源到数字语音采集设备的
方位角；为最优超指向波束系数A(k)＝[a1(k)，......，aN(k)]T中阵元ai的共轭复数。
7.根据权利要求1所述的方法，其特征在于，所述方法还包括：
对所述多个通道的阵列语音输入信号中的噪声信号阵列进行语音活动检
测VAD；
根据所述语音活动检测VAD的结果对噪声信号阵列进行噪声功率谱估计；
根据所述最优波束输出信号的最优功率谱估计值和所述噪声功率谱估计
值对所述最优波束输出信号进行第二次增强。
8.根据权利要求7所述的方法，其特征在于，根据所述语音活动检测VAD
的结果对噪声信号阵列进行噪声功率谱估计的步骤包括：
计算有语音状态、无语音状态、语音开始状态、语音结束状态时的噪声功
率谱；
对所述有语音状态时的噪声功率谱和无语音状态时的噪声功率谱进行折
中处理，得到噪声功率谱估计值。
9.根据权利要求8所述的方法，其特征在于，计算有语音状态、无语音
状态、语音开始状态、语音结束状态时的噪声功率谱的步骤具体包括：
当处于无语音状态时，采用下述公式对噪声信号阵列功率谱估计：
φv‾(k,λ)=a1φv‾(k,λ-1)+(1-a1)φy‾(k,λ);]]>当处于语音开始状态和有语音状态时，采用下述公式对噪声信号阵列功率

\t谱进行估计：
φv‾(k,λ)=min(φ^v‾1(k,λ),2θv‾(k,λ));]]>处于语音结束状态时，采用下述公式对噪声信号阵列功率谱进行双极点回
归平滑估计：
φv‾(k,λ)=a0φv‾2(k,λ-1)+(1-a0)max(φ^v‾(k,λ),θv‾(k,λ));]]>上述公式中，θv‾(k,λ)=12L1+1Σm=k-L1k+L1φv‾(k,λ);]]>φ^v‾1(k,λ)=aaφ^v‾1(k,λ-1)+(1-aa)φy‾(k,λ),ifφy‾(k,λ)≥φ^v‾1(k,λ)φ^v‾1(k,λ)=adφ^v‾1(k,λ-1)+(1-ad)φy‾(k,λ),ifφy‾(k,λ)<φ^v‾1(k,λ);]]>其中，a1为噪声谱更新参数；aa、ad分别为平滑系数。
10.根据权利要求1所述的方法，其特征在于，所述最优波束输出信号的
功率谱估计值采用下述公式进行计算：
φy‾(k,λ)=a0φy‾(k,λ-1)+(1-a0)|y‾(k,λ)|2;]]>其中，为所述最优波束输出信号的功率谱估计值；为所述最
优波束输出信号；a0为噪声谱更新参数。
11.一种麦克风语音增强装置，其特征在于，包括：
第一获取模块：用于获取通过多路数字语音采集设备采集输入的第一阵列
语音信号；
最优波束输出信号计算模块：用于根据所述第一阵列语音信号的最小方差
自适应波束优化模型，采用第一阵列语音信号计算第一阵列语音信号所合成的
最优波束输出信号；
第一增强模块：用于采用所述最优波束输出信号的功率谱估计值进行单通
道语音增强处理；
所述第一...

【专利技术属性】
技术研发人员：范泛，付中华，黎家力，
申请(专利权)人：中兴通讯股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人