一种基于固定波束形成的声源定位和语音增强方法及系统技术方案

技术编号：22724266 阅读：40 留言：0更新日期：2019-12-04 06:20

本发明专利技术公开了一种基于固定波束形成的声源定位和语音增强方法及系统。所述系统包括：数据采集模块、基于最大可控响应功率的声源定位模块和语音增强模块；数据采集模块包括音频文件解析模块和麦克风驱动模块；基于最大可控响应功率的声源定位模块包括子带时延的波束形成器、最大可控响应功率计算模块和最大可控响应功率搜索模块；数据采集模块采集的音频信息流传送给基于最大可控响应功率的声源定位模块，基于最大可控响应功率的声源定位模块输出声源位置估计方向给语音增强模块，语音增强模块以声源位置估计方向为核心，通过波束形成实现语音增强，得到声源位置信息；本发明专利技术解决了为智能终端提供支持的声源定位和语音增强的关键技术问题。

A method and system of source localization and speech enhancement based on fixed beamforming

The invention discloses a sound source positioning and speech enhancement method and system based on fixed beam forming. The system includes: data acquisition module, sound source location module and voice enhancement module based on the maximum controllable response power; data acquisition module includes audio file analysis module and microphone driver module; sound source location module based on the maximum controllable response power includes beamformer with sub-band delay, calculation module of the maximum controllable response power and search module of the maximum controllable response power The audio information collected by the data acquisition module is transmitted to the source location module based on the maximum controllable response power, and the source location module based on the maximum controllable response power outputs the source position estimation direction to the voice enhancement module. The voice enhancement module takes the source position estimation direction as the core, realizes the voice enhancement through beam forming, and obtains the source position information The invention solves the key technical problems of sound source location and voice enhancement which provide support for intelligent terminal.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于固定波束形成的声源定位和语音增强方法及系统
本专利技术涉及多媒体
，具体涉及一种基于固定波束形成的声源定位和语音增强方法及系统。
技术介绍
从上世纪80年代起，人们就开始了将麦克风阵列应用于语音增强技术的研究，这在90年代逐渐成为了研究热点。基于麦克风阵列的语音增强算法中，Flanagan提出的延迟求和波束形成方法(DelayandSumBeamformer,DSB)对不同传感器接收数据进行时延补偿，使得各传感器的接收信号在时间域上达到同步，再对其进行加权和求平均，得到增强信号。该方法在原理上简单，易于实现，但是麦克风数量及麦克风分布方式决定了算法性能，且算法中滤波系数固定不变，因此该算法也被称为固定波束形成。为了使基于波束形成的语音增强算法适应更加复杂的噪声环境，人们提出了自适应波束形成方法。其中广义旁瓣消除(GeneralizedSidelobeVariance,GSC)算法和线性约束最小方差波束形成(LinearlyConstrainedMinimumVariance,LCMV)算法最具代表性。广...

【技术保护点】
1.一种基于固定波束形成的声源定位和语音增强系统，其特征在于，包括：数据采集模块、基于最大可控响应功率的声源定位模块和语音增强模块；所述数据采集模块包括音频文件解析模块和麦克风驱动模块；所述基于最大可控响应功率的声源定位模块，包括子带时延的波束形成器、最大可控响应功率计算模块和最大可控响应功率搜索模块；/n所述音频文件解析模块用于把从M个音频文件中解析出的音频信息流传送给子带时延的波束形成器，麦克风驱动模块用于把含有M个麦克风的麦克风阵列实时采集的音频信息流传送给子带时延的波束形成器；/n所述子带时延的波束形成器接收数据采集模块产生的音频信息流，根据特定波束方向，对音频信息流中的每一帧音频数据...

【技术特征摘要】
1.一种基于固定波束形成的声源定位和语音增强系统，其特征在于，包括：数据采集模块、基于最大可控响应功率的声源定位模块和语音增强模块；所述数据采集模块包括音频文件解析模块和麦克风驱动模块；所述基于最大可控响应功率的声源定位模块，包括子带时延的波束形成器、最大可控响应功率计算模块和最大可控响应功率搜索模块；
所述音频文件解析模块用于把从M个音频文件中解析出的音频信息流传送给子带时延的波束形成器，麦克风驱动模块用于把含有M个麦克风的麦克风阵列实时采集的音频信息流传送给子带时延的波束形成器；
所述子带时延的波束形成器接收数据采集模块产生的音频信息流，根据特定波束方向，对音频信息流中的每一帧音频数据进行延迟-求和波束形成，在特定波束方向形成波束并将其传送给最大可控响应功率计算模块，输出该特定波束方向的可控响应功率；最大可控响应功率搜索模块从最大可控响应功率计算模块输出的不同波束方向的可控响应功率中寻找全局最大值，并输出其对应波束方向作为声源位置估计方向，其中声源定位在寻找可控响应功率全局最大值步骤中得到实现；
所述语音增强模块为波束形成器，最大可控响应功率搜索模块生成的声源位置估计方向发送到语音增强模块，语音增强模块通过延迟-求和波束形成，在声源位置估计方向形成波束，输出增强的语音信号，实现语音增强。

2.根据权利要求1所述的一种基于固定波束形成的声源定位和语音增强系统，其特征在于，所述音频信息流包括M个等长的离散信号序列。

3.根据权利要求1所述的一种基于固定波束形成的声源定位和语音增强系统，其特征在于，子带时延的波束形成器对数据采集模块产生的音频信息流其中的每一帧音频数据进行延迟-求和波束形成，通过以下步骤完成：
S1.1、对数据采集模块产生的音频信息流进行加汉明窗的傅里叶变换，得到离散频域信号；
S1.2、对离散频域信号中450Hz～3000Hz内的频率点施加特定波束方向对应的相位补偿，得到特定波束方向补偿后的离散频域信号；
S1.3、接着对特定波束方向补偿后的离散频域信号进行加权平均，得到特定波束方向补偿后的平均离散频域信号；
S1.4、最后对特定波束方向补偿后的平均离散频域信号施加傅里叶逆变换，得到该特定波束方向的波束。

4.根据权利要求3所述的一种基于固定波束形成的声源定位和语音增强系统，其特征在于，步骤S1.2中，所述相位补偿由波束方向决定，与波束方向对应的相位补偿为：

其中，τOmic1为声波到达O点与到达mic1的时间差，ωτOmic1表示相位补偿即相位差，F()表示傅里叶变换，s(t)表示时域信号，O为坐标系原点，mic1是编号为1的麦克风；r为麦克风阵列半径，θ为方位角即波束方向与mic1在O点处的夹角，β为波束方向俯仰角，c为声速。

5.根据权利要求4所述的一种基于固定波束形成的声源定位和语音增强系统，其特征在于，所述波束方向俯仰角β固定为90°，所述方位角θ在0～359°之间选取整数度数。

6.根据权利要求3所述的一种基于固定波束形成的声源定位和语音增强系统，其特征在于，步骤S1.4中，形成的波束为至少包括512个数据点长度的离散信号序列，对应采样频率为16kHz。

7.根据权利要求1所述的一种基于固定波束形成的声源定位和语音增强系统，其特征在于，最大可控响应功率计算模块接收子带时延的波束形成器输出的离散信号序列即特定波束方向的波束并对其逐点求平方和，得到该波束方向的可控响应功率，可控响应功率计算公式如下：

y(n)为子带时延的波束形成器的离散时域输出，n为离散序列的点序号，为整数集合。

8.根据权利要求1所述的一种基于固定波束形成的声源定...

【专利技术属性】
技术研发人员：刘富春，杨洋，林其光，
申请(专利权)人：广州智伴人工智能科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人