当前位置: 首页 > 专利查询>浙江大学专利>正文

基于矩形麦克风阵列的语音信号增强系统技术方案

技术编号:16103552 阅读:70 留言:0更新日期:2017-08-29 23:17
本发明专利技术公开了一种基于矩形麦克风阵列的语音信号增强系统,该系统主要包括N通道麦克风面阵、主控电路、信号调理电路、A/D采集电路、音频放大电路;信号调理电路,用于将麦克风面阵获得的电信号进行放大和滤波,并传输给A/D采集电路,将信号调理电路输出的模拟信号转化为数字信号并进行串并转换后输入到主控电路,主控电路用于将输入信号传输至网络传输模块,同时对输入信号求取数据均值,发送至音频放大电路;此外,主控电路还用于配置系统的工作参数以控制A/D采集电路的工作模式与同步模式;该系统可以提高接收语音信号的信噪比,以实现微弱语音信号的增强,从而提高可识别度。

【技术实现步骤摘要】
基于矩形麦克风阵列的语音信号增强系统
本专利技术涉及信号增强和噪声消除,具体涉及一种基于矩形麦克风阵列的语音信号增强系统,属于语音技术、信号处理

技术介绍
随着智能语音识别技术的发展,语音信号需要进行实时、准确的采集,对麦克风的语音还原度要求越来越高。由于语音环境的复杂性,单麦克风采集到的语音往往会衰减较大,并伴随着很多干扰。基于麦克风阵列的语音采集方法可以实现准确的信号采集,并增强语音信号的信噪比。麦克风阵列用于语音采集,就是将多个麦克风按照一定的几何结构布放,利用不同麦克风的空间信息,对各个麦克风采集到的信号联合处理,从而增强特定方向的信号,并抑制其他方向的干扰,即波束形成处理。将麦克风阵列用于实际的语音信号增强系统中,需要综合考虑以下几个方面的问题。第一,多阵元信号流向问题。阵列系统代表着多阵元,对应的硬件资源需求较大,必须平衡好体积和性能之间的关系。第二,AD采集同步问题。麦克风输出的是模拟信号,需要通过AD转换成数字信号处理,那么多个麦克风同时转换时必须保证各个阵元间的时间同步,否则会引起信号失配,降低语音可懂度。第三,语音输出方式。经过处理后的语音固然可以以数字形式保存,但并不直观,进一步的音频处理可以直接播放处理后的语音信号,实现实时的微弱语音采集和放大,在工程上具有更强的实用性。目前,国内的麦克风阵列处理尚处于发展阶段,主要的工作集中在各种阵列处理算法和语音处理的结合上,研究重点放在室内和近距离场景,信噪比相对而言比较高。实际的采集一般是用其他采集设备连接麦克风阵列,将数据采回后再做其他处理。这种方式受采集设备的限制较大,因此使用场景十分有限。近年来,也出现了一些比较成熟的基于麦克风阵列的采集处理系统,这些系统由于阵元数和阵型的限制,往往只能作用于比较近的距离,对衰减较大的语音信号没有还原能力,无法满足多方面的需求。
技术实现思路
本专利技术的目的在于针对现有技术的不足,提供一种基于矩形麦克风阵列的语音信号增强系统,是一种多通道阵列语音增强的解决方案,该系统可以提高接收语音信号的信噪比,以实现微弱语音信号的增强,从而提高可识别度。本专利技术的基于矩形麦克风阵列的语音信号增强系统,该系统包括N通道麦克风面阵、主控电路、信号调理电路、A/D采集电路、音频放大电路;所述的N通道麦克风面阵采用矩形阵列,各麦克风之间同向布放,用于接收外界信号,实现将声信号转换为电信号;信号调理电路,用于将麦克风面阵获得的电信号进行放大和滤波,并传输给A/D采集电路,将信号调理电路输出的模拟信号转化为数字信号并进行串并转换后输入到主控电路,主控电路用于将输入信号传输至网络传输模块,同时对输入信号求取数据均值,发送至音频放大电路;此外,主控电路还用于配置系统的工作参数以控制A/D采集电路的工作模式与同步模式,所述的主控电路采用ZYNQ7系列芯片实现。上述技术方案中,所述的N通道麦克风面阵通常选用8行8列等间距布放的矩形阵列,各麦克风之间间距0.05m。所述的信号调理电路采用AD8667运放芯片实现,具有放大、滤波和差分输出的功能,其中通过电阻的调节可以实现10倍放大;通过两块AD8667运放芯片实现285Hz-3687Hz的滤波,其通带衰减为-3dB,阻带衰减为-30dB;输出运放将模拟信号差分输出,提高输出的稳定性。所述的A/D采集电路采用两块ADS1601芯片实现80通道的AD采集。其中每块ADS1601芯片将信号串并转换后变为并行的40路16bit数据,需要拆分为16+16+8的形式,依次进行数字滤波处理,先处理完的会存入寄存器,等待所有的40通道处理完再输出。对所述的40路16bit数据进行数字滤波处理后,将2个16bit的数据拼接为一个32bit数据,并将其转化为无符号数分时发送。本专利技术的有益效果为:(1)本专利技术提供了一种多通道阵列语音增强的解决方案。麦克风阵列的阵型可以选用8行8列等间距布放的矩形阵列,各麦克风之间同向布放,保证波束指向一致性。通过多阵元接收数据的联合处理,抑制其他方向的干扰,增强语音信号的信噪比,最终实现语音信号的还原。64阵元提供了较大的阵增益,大大拓展了该系统的适用性,可作用于室外远距离微弱信号的增强。(2)本专利技术给出了一种软核加硬核的系统开发方式,主控电路采用ZYNQ7系列芯片,即ARM+FPGA的架构,在麦克风处理系统中具有很强大的灵活性。FPGA负责实现数据的同步和传输,而ARM核本身是一个操作系统平台,可以进行发出各种指令并植入算法。在本专利技术中,可以采用ARM核来发送命令,协调整个系统工作;主要的数据传输和波束形成处理都在FPGA中完成。(3)本专利技术的输出有两种形式。一是各通道麦克风采集的信号以数字形式通过千兆以太网传输出去,二是直接输出处理后的音频信号。前者可以用于进一步的研究工作,而处理后的音频信号可连接音频设备获取直观的语音增强效果。附图说明图1是本专利技术的语音信号增强系统处理流程图;图2是主控电路的硬件资源图;图3是主控程序的任务流程图;图4是主控电路发送写命令的过程示意图;图5是写命令时序图;图6是主控电路通过千兆以太网通信的处理流程图;图7是主控电路对信号求取数据均值后输出的处理流程图;图8是图7相应的硬件框图;图9是A/D采集电路的硬件资源图;图10是A/D采集电路的硬件流程图;图11是A/D采集电路中同步和串并转换过程;图12是A/D采集电路中分时发送过程;图13是音频放大电路与主控电路DDC模块信号匹配过程。具体实施方式下面结合具体实例对本专利技术技术方案进行详细阐述。本专利技术系统的主要目的是实现多通道数据的采集和处理,并整合为音频输出。该系统主要包括N通道麦克风面阵、主控电路、信号调理电路、A/D采集电路、音频放大电路;N通道麦克风面阵和信号调理采集电路实现声电信号转换、信号放大滤波和模数转换功能,通过这一系列的前置处理,可以将声信号转化为数字信号输入到主控电路处理。主控电路除了对输入信号进行处理外,还负责控制配置系统的工作参数,控制采集电路的工作模式与同步模式。后续的音频放大和千兆以太网则分别输出直接可听的语音信号和各通道采集的数字原始信号。该系统可以提高接收语音信号的信噪比,以实现微弱语音信号的增强,从而提高可识别度。主控电路主控电路是整个系统的核心,它控制着整个电路的工作参数和运行流程。电路以一块Xilinx的ZYNQ7系列芯片为核心,,拥有由两颗CortexTM-A9核组成的处理核心部分(ProcessSystem,PS),以及一颗Xilinx7系列FPGA核心所构成的可编程逻辑部分(ProgrammableLogic,PL)。该系列芯片中,ARM拥有相对于市面上其他处理器更强大的计算速度,FPGA拥有完全可编程能力。FPGA的可编程能力,配合开发板上引出的I/O口,能够适合多种应用场景。图2是主控电路的硬件资源图。其中ARM的片上内存是256KB,FPGA的内存是560KB。主控电路软件设计主控模块负责控制与协调系统其它各功能模块的运作,这些控制与协调任务即由主控程序实现。由于各功能模块都是同时工作的,主控程序采用多任务模式,每个任务同一个或多个模块相关联,实现相应的控制的功能,再通过不同任务间的交互与同步实现整个系统的协调工作。主控电路设计成本文档来自技高网
...
基于矩形麦克风阵列的语音信号增强系统

【技术保护点】
一种基于矩形麦克风阵列的语音信号增强系统,其特征在于,该系统包括N通道麦克风面阵、主控电路、信号调理电路、A/D采集电路、音频放大电路;所述的N通道麦克风面阵采用矩形阵列,各麦克风之间同向布放,用于接收外界信号,实现将声信号转换为电信号;信号调理电路,用于将麦克风面阵获得的电信号进行放大和滤波,并传输给A/D采集电路,将信号调理电路输出的模拟信号转化为数字信号并进行串并转换后输入到主控电路,主控电路用于将输入信号传输至网络传输模块,同时对输入信号求取数据均值,发送至音频放大电路;此外,主控电路还用于配置系统的工作参数以控制A/D采集电路的工作模式与同步模式,所述的主控电路采用ZYNQ7系列芯片实现。

【技术特征摘要】
1.一种基于矩形麦克风阵列的语音信号增强系统,其特征在于,该系统包括N通道麦克风面阵、主控电路、信号调理电路、A/D采集电路、音频放大电路;所述的N通道麦克风面阵采用矩形阵列,各麦克风之间同向布放,用于接收外界信号,实现将声信号转换为电信号;信号调理电路,用于将麦克风面阵获得的电信号进行放大和滤波,并传输给A/D采集电路,将信号调理电路输出的模拟信号转化为数字信号并进行串并转换后输入到主控电路,主控电路用于将输入信号传输至网络传输模块,同时对输入信号求取数据均值,发送至音频放大电路;此外,主控电路还用于配置系统的工作参数以控制A/D采集电路的工作模式与同步模式,所述的主控电路采用ZYNQ7系列芯片实现。2.根据权利要求1所述的基于矩形麦克风阵列的语音信号增强系统,其特征在于,所述的N通道麦克风面阵选用8行8列等间距布放的矩形阵列,各麦克风之间间距0.05m。3.根据权利要求1所述的基于矩形麦克风阵列的语音信号增强系统,其特征在于,所述的信号调理电路采用A...

【专利技术属性】
技术研发人员:胡玥潘翔
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1