一种使用多维化技术进行回声降噪的方法技术

技术编号:13955729 阅读:71 留言:0更新日期:2016-11-02 12:24
本发明专利技术公开了一种使用多维化技术进行回声降噪的方法,其实现过程为:根据音频采集设备的多少来定向音源方位,这里的音频采集设备是指至少两个采集器;根据多维空间的几何特征来模拟声波的传导过程,使用多维化技术处理延时传送的回声数据;通过几何特征来智能过滤杂波信号,精确控制音频信号的合成处理;导出合成后的音频数据。该一种使用多维化技术进行回声降噪的方法与现有技术相比,整个降噪过程中并不需要对采集设备做特别的要求,因此相对于专业的向音频采集设备来,具有成本低、部署简便,以及对用户的专业水平要求较低等优势;实用性强,适用范围广泛,该技术可被广泛的应用于各种平台上的VoIP产品之中,对提升通话质量,提高服务品质都具有重要的作用,易于推广。

【技术实现步骤摘要】

本专利技术涉及噪声处理
,具体地说是一种实用性强、使用多维化技术进行回声降噪的方法
技术介绍
在传统的音频降噪技术中,通常都要通过程序算法来对比并剔除音频中的杂音数据,然而类似的方法都存在一个较为明显的缺陷,那就是对杂音的去除往往不彻底,又或是会降低会话音频的质量。这主要是由音频降噪处理的基本原理所造成的,如附图1所示,由于传统音频文件的固有特性,并不能很好的分辨出声音的来源与发声者的音纹特征,只能通过同时采集并记录远端/本地发声者的音频数据来对采集的声音进行对比,从而在回传的音频数据中剔除远端发声者自己的音频数据,如此以来就可以让远端的发声者听不到自己说话的声音。但是在这样的一种过程中,由于实际环境的复杂性,时常会导致音频数据在处理上的不同步,从而使得视频数据的处理产生延迟,使得回传的音频信号带有一定程度的回声拖尾现象。而且,由于音频波形数据无法做到精确的分离,只能对波形进行简单的裁剪处理,这就使得音频数据的完整性造到了一定程度的破坏,从而不可避免的会造成声音的缺失或是通话质量的下降。为解决上述存在的问题,以便更加精准的分离音频数据,并在通讯数据不做大幅增加的基础上尽可能的提升音频传输的质量,现根据多维化技术的相关几何原理,设计出了一种使用多维化技术对声波传导过程进行几何化模拟的方法。
技术实现思路
本专利技术的技术任务是针对以上不足之处,提供一种实用性强、使用多维化技术进行回声降噪的方法。一种使用多维化技术进行回声降噪的方法,其实现过程为:根据音频采集设备的多少来定向音源方位,这里的音频采集设备是指至少两个采集器;根据多维空间的几何特征来模拟声波的传导过程,使用多维化技术处理延时传送的回声数据;通过几何特征来智能过滤杂波信号,精确控制音频信号的合成处理;导出合成后的音频数据。定向音源方向的具体过程为:设置采集器位置,并制定主采集器,采集器用于接收音频数据;监听并侦测不同采集器上所接收的音频数据;对比相同频率音频信号在不同采集器上的时间间隔;根据时间差和采集器方位设定,在数据空间中模拟定位音频源;在数据空间中设定音源位置。使用多维空间模拟技术找到并定位出可能存在的音源方位,具体为:当主发声源的位置为X,噪音源的位置为Y,主采集器的位置为O,辅助采集器的位置分别为A和B,同时音速为V时,通过对比主发音源到达主采集器0、辅助采集器A、B的时间X0、XA、XB,根据音波传播的物理规律,计算出主发音源X的大致方位,再结合音频传输时间的比例值,最终确定主发音源X在数据空间中的相对方位;采用相同方式,即可计算出噪音源Y的相对方位。根据多维空间的几何特征来模拟声波的传导过程是指在数据空间中模拟音波信号的传递和叠加过程,其中音频信号在空间中的传播以相同速度向四周空间均匀传递,因此,其到达不同采集器的时间比例与其间距比例应当相同。使用多维化技术处理延时传送的回声数据是指使用多维化技术控制不同音源中的音频传递时间差,即为不同的音源信号设定同步时间差,由于音源信号传递到每个采集器上的时间不同,以及回声在设备间传输延迟问题的存在,在消除回声的时候对不同音频源的时间维度做出调整,即对不同的音频源信号进行时间差矫正。合成的音频信号中包括音频源信号、噪音信号,在不同的空间维度上记录不同音源的独立音频数据,即将不同频率或强度范围的音频数据存储在不同的数据空间之中。与上述合成的音频信号相对应的,最后导出的音频数据为用户所指定频率或强度的音频数据,该数据同样为距离主采集器最近的音源数据。本专利技术的一种使用多维化技术进行回声降噪的方法,具有以下优点:该专利技术的一种使用多维化技术进行回声降噪的方法本方法是一种通过多维化几何特征识别技术来对音频通讯进行管理并编码的技术,经过多维化编码的音频数据既可以保持体积较小的优势,又能够相对完整的保留多声道音频信息,在进行回声降噪处理时便可以非常容易的找到并剔除那些无用数据,从而达到无损化降噪的目的;整个降噪过程中并不需要对采集设备做特别的要求,因此相对于专业的向音频采集设备来,具有成本低、部署简便,以及对用户的专业水平要求较低等优势;实用性强,适用范围广泛,该技术可被广泛的应用于各种平台上的VoIP产品之中,对提升通话质量,提高服务品质都具有重要的作用,易于推广。附图说明附图1为回声消除前波形图。附图2为回声消除后波形图。附图3为实施例中三个采集器的布局图。附图4为实施例中主发声源、噪音源的相对空间方位图。附图5为实施例中不同的空间维度上记录不同音源示意图。具体实施方式下面结合具体实施例对本专利技术作进一步说明。本专利技术提供一种使用多维化技术进行回声降噪的方法,通过多维化几何特征识别技术来对音频通讯进行管理并编码的技术,经过多维化编码的音频数据既可以保持体积较小的优势,又能够相对完整的保留多声道音频信息,在进行回声降噪处理时便可以非常容易的找到并剔除那些无用数据,从而达到无损化降噪的目的。该方法的实现过程为:根据音频采集设备的多少来定向音源方位,这里的音频采集设备是指至少两个采集器;根据多维空间的几何特征来模拟声波的传导过程,使用多维化技术处理延时传送的回声数据;通过几何特征来智能过滤杂波信号,精确控制音频信号的合成处理;导出合成后的音频数据。其具体实施步骤为:步骤1:调用函数MDV_SetRecoder(),设置采集器位置,并制定主采集器。步骤2:调用函数MDV_LisenVoice(),监听音频信号输入。步骤3:调用函数MDV_VoiceCompare(),对比相同频率音频信号在不同采集器上的时间间隔。步骤4:调用函数MDV_FindVoice(),根据时间差和采集器方位设定,在数据空间中模拟定位音频源(默认取最小值)。步骤5:调用函数MDV_ResetVoice(),在数据空间中设定音源位置。步骤6:调用函数MDV_TimeDimension(),为不同的音源信号设定同步时间差。步骤7:调用函数MDV_RecordVoice(),在不同的数据空间中记录不同频率/强度范围的音频数据。步骤8:调用函数MDV_OutputVoice(),输出指定频率/强度的音频数据。本专利技术的实施例采用三个采集器,其中一个为主采集器,两个辅助采集器,根据上述步骤,本专利技术的具体实施过程为:1)首先使用数据空间技术定位音频采集器的空间方位:采集器数量应>=2,默认为3,典型的布局(在数据空间中需要根据实际布局的比例关系设置采集器的空间坐标)如附图3所示。2)监听并侦测不同采集器上所接收到的音频数据。计算不同音频采集器上所接收到的相同音频信号的时间间隔。使用多维空间模拟技术找到并定位出可能存在的音源方位。假设主发声源的位置为X,噪音源的位置为Y,主采集器的位置为O,辅助采集器的位置分别为A和B,同时设音速为V,则根据音波传播的物理规律,便可以通过计算音频信号到达每个采集器之间的时间间隔来估算定位音频源的相对空间方位,如附图4所示。因为主发声源X的音频信号到达辅助采集器A和B的时间相同(XA和XB),而到达主采集器的时间最短(XO),便可以根据几何定律计算出主发声源X的大致方位应处于XO轴的延长线上,再结合音频传输时间的比例值,最终便可以确定主发声源X在数据空间中的相对方位。同理,便可以计算出噪音源Y的方位。3)本文档来自技高网...

【技术保护点】
一种使用多维化技术进行回声降噪的方法,其特征在于,其实现过程为:根据音频采集设备的多少来定向音源方位,这里的音频采集设备是指至少两个采集器;根据多维空间的几何特征来模拟声波的传导过程,使用多维化技术处理延时传送的回声数据;通过几何特征来智能过滤杂波信号,精确控制音频信号的合成处理;导出合成后的音频数据。

【技术特征摘要】
1.一种使用多维化技术进行回声降噪的方法,其特征在于,其实现过程为:根据音频采集设备的多少来定向音源方位,这里的音频采集设备是指至少两个采集器;根据多维空间的几何特征来模拟声波的传导过程,使用多维化技术处理延时传送的回声数据;通过几何特征来智能过滤杂波信号,精确控制音频信号的合成处理;导出合成后的音频数据。2.根据权利要求1所述的一种使用多维化技术进行回声降噪的方法,其特征在于,定向音源方向的具体过程为:设置采集器位置,并制定主采集器,采集器用于接收音频数据;监听并侦测不同采集器上所接收的音频数据;对比相同频率音频信号在不同采集器上的时间间隔;根据时间差和采集器方位设定,在数据空间中模拟定位音频源;在数据空间中设定音源位置。3.根据权利要求2所述的一种使用多维化技术进行回声降噪的方法,其特征在于,使用多维空间模拟技术找到并定位出可能存在的音源方位,具体为:当主发声源的位置为X,噪音源的位置为Y,主采集器的位置为O,辅助采集器的位置分别为A和B,同时音速为V时,通过对比主发音源到达主采集器0、辅助采集器A、B的时间X0、XA、XB,根据音波传播的物理规律,计算出主发音源X的大致方位,再结合音频传输时间的比例值,最终确定主发音源X在数据空间中的相对方位;采用相同方...

【专利技术属性】
技术研发人员:张家重董毅李光瑞牛玉峰
申请(专利权)人:浪潮苏州金融技术服务有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1