一种基于分布式传感器的多音区语音算法制造技术

技术编号：35855802 阅读：15 留言：0更新日期：2022-12-07 10:42

本发明专利技术涉及语音信号处理，具体涉及一种基于分布式传感器的多音区语音算法，对麦克风阵列采集的多路语音信号进行预处理；通过能量探测器探测到的语音能量获取声源方位信息，同时根据声源方位信息对麦克风阵列中各信号通道进行时延补偿；将时延补偿后的多路语音信号输入降噪通道进行波束成形，得到波束成形信号，同时将时延补偿后的多路语音信号输入噪声提取通道进行噪声提取，得到噪声信号；对波束成形信号和噪声信号进行自适应滤波，并对自适应滤波后的语音信号进行去噪，得到多音区增强语音信号；本发明专利技术提供的技术方案能够有效克服现有技术所存在的抗干扰能力差、混响过大、语音信号信噪比较低的缺陷。信号信噪比较低的缺陷。信号信噪比较低的缺陷。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于分布式传感器的多音区语音算法

[0001]本专利技术涉及语音信号处理，具体涉及一种基于分布式传感器的多音区语音算法。

技术介绍

[0002]随着人工智能地不断发展，越来越多的生活场景需要更多地体现智能化，如车载场景、家居场景、教室场景、会议场景等，这些场景中通常会应用多种智能化设备，如在家中使用智能交互式设备，或者在教室、会议室使用语音增强设备等。不论是交互式设备还是语音增强设备，其最重要的就是要准确识别出声源方位信息。
[0003]现有的拾音算法非常多，采用较多的一种是球形麦克风阵列拾音算法，球形麦克风阵列拾音算法是基于波束成形的原理，在复杂环境中对期望语音信号进行拾取，即只拾取期望方向(声源方位)传播来的语音信号，而对其他方向的噪声、干扰信号进行抑制，从而达到目标语音增强的效果。
[0004]然而，在拾取语音信号的过程中会存在一定问题，例如在复杂环境中抗干扰能力差、混响过大；另外，当声源与语音增强设备的距离较远时，得到语音信号的信噪比会大幅下降，导致语音信号不易被理解，严重影响语音增强设备的使用效果。

技术实现思路

[0005](一)解决的技术问题
[0006]针对现有技术所存在的上述缺点，本专利技术提供了一种基于分布式传感器的多音区语音算法，能够有效克服现有技术所存在的抗干扰能力差、混响过大、语音信号信噪比较低的缺陷。
[0007](二)技术方案
[0008]为实现以上目的，本专利技术通过以下技术方案予以实现：
[0009]一种基于分布式传...

【技术保护点】

【技术特征摘要】
1.一种基于分布式传感器的多音区语音算法，其特征在于：包括以下步骤：S1、对麦克风阵列采集的多路语音信号进行预处理；S2、通过能量探测器探测到的语音能量获取声源方位信息，同时根据声源方位信息对麦克风阵列中各信号通道进行时延补偿；S3、将时延补偿后的多路语音信号输入降噪通道进行波束成形，得到波束成形信号，同时将时延补偿后的多路语音信号输入噪声提取通道进行噪声提取，得到噪声信号；S4、对波束成形信号和噪声信号进行自适应滤波，并对自适应滤波后的语音信号进行去噪，得到多音区增强语音信号。2.根据权利要求1所述的基于分布式传感器的多音区语音算法，其特征在于：S2中通过能量探测器探测到的语音能量获取声源方位信息，包括：采用下式计算声源方位信息：β＝Δθ
·
argmax[E(n)]其中，Δθ为能量探测器中相邻探测通道之间的角度，E(n)为能量探测器中各探测通道探测到的语音能量，n为探测通道编号。3.根据权利要求2所述的基于分布式传感器的多音区语音算法，其特征在于：S2中根据声源方位信息对麦克风阵列中各信号通道进行时延补偿，包括：采用下式对麦克风阵列中各信号通道进行时延补偿：s
N
(k)＝s
N
(k')其中，s
N
(k)为时延补偿后的语音信号，N为麦克风阵列中麦克风子阵编号，d为麦克风子阵之间的间距，f
s
为麦克风阵列的采样频率，β为声源方位信息，v为声速。4.根据权利要求2所述的基于分布式传感器的多音区语音算法，其特征在于：所述能量探测器中的探测通道包括圆锥形反射器件，多个所述圆锥形反射器件位于同一平面内且形成的收声范围覆盖声源区域，所述圆锥形反射器的顶部设置有第二麦克风且顶部相交于一点。5.根据权利要求4所述的基于分布式传感器的多音区语音算法，其特征在于：S1中对麦克风阵列采集的多路语音信号进行预处理，包括：利用麦克风阵列进行多通道语音信号的采集，并对采集的多路...

【专利技术属性】
技术研发人员：胡程远，
申请(专利权)人：南京声象信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人