语音去混响的方法、设备和系统技术方案

技术编号：12420261 阅读：101 留言：0更新日期：2015-12-02 15:21

提供了改进的音频数据处理方法和系统。一些实现方式涉及把频域音频数据划分成多个子带并且为多个子带中每一个确定振幅调制信号值。带通滤波器可以应用到每个子带中的振幅调制信号值，以便为每个子带产生带通滤波后的振幅调制信号值。带通滤波器可以具有超过人类语音的平均节奏的中心频率。可以至少部分地基于振幅调制信号值和带通滤波后的振幅调制信号值的函数为每个子带确定增益。所确定的增益可以应用到每个子带。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】相关申请的交叉引用本申请要求于2013年4月10日提交的美国临时专利申请No. 61/810, 437和于 2013年6月28日提交的美国临时专利申请No. 61/840, 744的优先权，这两个申请当中每一个的全部内容都通过引用被结合于此。
本公开涉及音频信号的处理。特别地，本公开涉及处理用于远程通信的音频信号，包括但不限于处理用于电话会议或视频会议的音频信号。
技术介绍
在远程通信中，常常有必要捕获不在麦克风附近的参与者的语音。在这种情况下，直接的声学反射和后续的房间混响的效果（reverberation)会不利地影响可理解性。在空间捕获系统的情况下，这种混响可以被人类听觉处理系统与直接的声音（至少在某种程度上）感知分离。在实践当中，当经多声道渲染试听时，这种空间混响可以改善用户体验，并且存在一些证据暗示混响会帮助表演空间中声音源的分离和锚定。但是，当信号重叠、作为单声道或单个声道导出和/或带宽减小时，混响的效果一般更难以让人类听觉处理系统管理。相应地，改善的音频处理系统将是期望的。
技术实现思路
根据本文所述的一些实现方式，一种方法可以涉及接收包括频域音频数据的信号并且对频域音频数据应用滤波器组（filterbank)，以便产生在多个子带内的频域音频数据。该方法可以涉及为每个子带中的频域音频数据确定振幅调制信号值，并且对每个子带中的振幅调制信号值应用带通滤波器以便为每个子带产生带通滤波后的振幅调制信号值。带通滤波器可以具有超过人类语音的平均节奏（cadence)的中心频率。该方法可以涉及至少部分地基...

【技术保护点】
一种方法，包括：接收包括频域音频数据的信号；对频域音频数据应用滤波器组，以便产生在多个子带内的频域音频数据；为每个子带中的频域音频数据确定振幅调制信号值；对每个子带中的振幅调制信号值应用带通滤波器，以便为每个子带产生带通滤波后的振幅调制信号值，该带通滤波器具有超过人类语音的平均节奏的中心频率；至少部分地基于振幅调制信号值和带通滤波后的振幅调制信号值的函数为每个子带确定增益；以及对每个子带应用所确定的增益。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：E·格斯那，G·N·迪金斯，D·古那万，
申请(专利权)人：杜比实验室特许公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人