在不活动阶段期间利用噪声合成的音频编解码器制造技术

技术编号:9601223 阅读:106 留言:0更新日期:2014-01-23 05:48
在活动阶段或非无声阶段期间参数背景噪声估计被连续地更新,使得当在活动阶段后进入不活动阶段时即刻开始噪声生成。根据另一方面,非常有效地使用频谱域以参数化该背景噪声,由此获得更为真实的背景噪声合成,并且由此导致更加透明的活动阶段至不活动阶段切换。

【技术实现步骤摘要】
【国外来华专利技术】在不活动阶段期间利用噪声合成的音频编解码器
本专利技术涉及在不活动阶段期间支持噪声合成的音频编解码器。
技术介绍
利用语音或其它噪声源的不活动时段来缩小传输带宽的可能是本领域已知的。这种方案一般使用某个检测形式来区别不活动(或无声)阶段与活动(或非无声)阶段。在不活动阶段期间,通过中止精准地编码该记录信号的普通数据流的传输,而只发送无声插入描述(SID)更新,而达成较低比特率。SID更新可以常规间隔传输,或当检测到背景噪声特性改变时传输。然后SID帧可用在解码侧来产生背景噪声,该背景噪声的特性类似于活动阶段期间的背景噪声,使得中止编码该记录信号的普通数据流的传输在接收者侧不会导致从活动阶段至不活动阶段令人不愉悦的过渡。但仍然需要进一步减低传输率。比特率耗用者数目的增加诸如移动电话数目的增力口,及或多或少比特率密集应用数目的增加诸如无线传输广播,要求稳定地减少耗用的比特率。另一方面,合成噪声须接近地模拟真实噪声,使得该合成对使用者而言是透明的。
技术实现思路
据此,本专利技术的一个目的是提出一种在不活动阶段期间支持噪声合成的音频编解码器方案,其使得能够减低传输比特率同时维持可达成的噪声产生质量。此目的是通过独立权利要求的部分主题而达成的。本专利技术的基本构想为若在活动阶段期间连续地更新参数背景噪声估计使得接在活动阶段后方的不活动阶段进入时立即开始噪声生成,则可节省有价值的比特率同时维持在不活动阶段内的噪声产生质量。举例言之,可在解码侧进行连续地更新,无需紧接在检测到不活动阶段后的预热阶段期间对该解码侧初步提供背景噪声的编码表示,该提供将耗用有价值的比特率,由于解码侧已经在活动阶段期间连续地更新该参数背景噪声估计,因此随时地准备以适当噪声生成而立即进入不活动阶段。同理,若参数背景噪声估计是在编码侧完成的,可避开此种预热阶段。当检测到进入不活动阶段时,替代在解码侧初步连续地提供常规编码的背景噪声表示以便学习背景噪声,及在学习阶段后据此而通知解码侧,在检测到进入不活动阶段时,编码器能够立即对解码器提供需要的参数背景噪声估计,采用的方式是降回到过去活动阶段期间连续更新的参数背景噪声估计,由此避免比特率耗用在初步进一步执行额外编码背景噪声。依据本专利技术的具体实施例,例如就比特率及运算复杂度而言,达成在中等开销下的更为真实的噪声生成。具体地,依据这些实施例,频谱域被用来参数化背景噪声,由此获得背景噪声合成,该背景噪声合成更为真实,因此导致更加透明的活动阶段至不活动阶段切换。此外,发现在频谱域参数化背景噪声,允许从有用信号分离噪声,因此,在频谱域参数化背景噪声当组合前述在活动阶段期间参数背景噪声估计的连续地更新时具有优点,原因在于频谱域可达成噪声与有用信号间的更佳分离,使得组合本申请的两个有益方面时无需从一个域至另一域的额外过渡。本专利技术的实施例的额外有益细节为权利要求中的附属项的主题。【附图说明】下面参考【附图说明】本申请的优选实施例,附图中:图1示出依据实施例的音频编码器的框图;图2示出编码引擎14的可能实现;图3示出依据实施例音频解码器的框图;图4示出依据实施例的图3的解码引擎的可能实现;图5示出依据实施例的又一更详细描述的音频编码器的框图;图6示出依据实施例可与图5的编码器一起使用的解码器的框图;图7示出依据实施例的又一更详细描述的音频解码器的框图;图8示出依据实施例的音频编码器的频谱带宽扩展部分的框图;图9示出依据实施例的图8的CNG频谱带宽扩展编码器的实现;图10示出依据实施例的使用频谱带宽扩展的音频解码器的框图;图11示出使用频谱带宽复制的音频解码器的实施例的可能的更详细描述的框图;图12示出依据又一实施例使用频谱带宽扩展的音频编码器的框图;以及图13示出音频编码器的又一实施例的框图。【具体实施方式】图1示出依据本专利技术的实施例的音频编码器。图1的音频编码器包括背景噪声估计器12、编码引擎14、检测器16、音频信号输入端18及数据流输出端20。提供器12、编码引擎14及检测器16分别具有连接至音频信号输入端18的输入端。估计器12及编码引擎14的输出端分别经由开关22而连接至数据流输出端20。开关22、估计器12及编码引擎14的控制输入端分别连接至检测器16的输出端。背景噪声估计器12被配置为在活动阶段24期间,基于在输入端18进入音频编码器10的输入音频信号而连续地更新参数背景噪声估计。虽然图1提示背景噪声估计器12可基于在输入端18输入的音频信号而得出参数背景噪声估计的连续更新,但不一定为此种情况。背景噪声估计器12可替换地或附加地从编码引擎14获得音频信号版本,如虚线26例示说明的。在这种情况下,背景噪声估计器12可替换地或附加地分别经由连接线26及编码引擎14而间接地连接至输入端18。具体地,针对背景噪声估计器12连续地更新背景噪声估计,存在不同的可能,后面将进一步描述若干这种可能。编码引擎14被配置为在活动阶段24期间将到达输入端18的输入音频信号编码为数据流。活动阶段应涵盖该音频信号内包含有用信息的全部时间,诸如语音或噪声源的其它有用声音。另一方面,具有几乎不随时间变化的特性的声音诸如于扬声器背景中由雨声或交通声所引起的不随时间变化的频谱须归类为背景噪声,每当只存在此种背景噪声时,相应时段应归类为不活动阶段28。检测器16是负责基于在输入端18输入的音频信号而检测在活动阶段24后进入不活动阶段28。换言之,检测器16区分两个阶段,即活动阶段及不活动阶段,其中检测器16确定目前存在哪个阶段。检测器16将目前存在的阶段通知给编码引擎14,及如前文已述,编码引擎14在活动阶段24期间将该输入音频信号编码成为数据流。检测器16据此控制开关22,使得由编码引擎14输出的数据流在输出端20输出。在不活动阶段期间,编码引擎14可停止编码输入音频信号。至少在输出端20处输出的数据流不再由可能通过编码引擎14输出的任何数据流馈送。此外,编码引擎14可只执行最少处理来支持估计器12而只有若干状态变量更新。此种动作将大大降低运算功率。例如开关22被设置为使得估计器12的输出端连接至输出端20,而非连接至编码引擎的输出端。由此减少用以传输在输出端20输出的比特流的有用的传输比特率。背景噪声估计器12被配置为在活动阶段24期间,基于如前文已述的输入音频信号18而连续地更新参数背景噪声估计,以及因此,在从活动阶段24过渡至不活动阶段28后,即在进入不活动阶段28时,估计器12能够立即将在活动阶段24期间连续地更新的该参数背景噪声估计插入在输出端20输出的数据流30。紧接在活动阶段24结束后,及紧接在检测器16检测到进入不活动阶段28的时间瞬间34后,背景噪声估计器12例如可将无声插入描述符(SID)帧32插入数据流30内。换言之,由于在活动阶段24期间背景噪声估计器对参数背景噪声估计的连续更新,在检测器16检测到进入不活动阶段28与SID32的插入间无需时间间隙。如此,总结如上说明,图1的音频编码器10可如下操作。用于例示说明目的,假设目前存在活动阶段24。于此种情况下,编码引擎14当前将在输入端18的输入音频信号编码成数据流20。开关22将编码引擎14的输出端连接至输出端20。编码引擎14可使用参数编码及变换编码本文档来自技高网...

【技术保护点】
一种音频编码器,包括:背景噪声估计器(12),被配置为在活动阶段(24)期间,基于输入音频信号来连续地更新参数背景噪声估计;编码器(14),用于在该活动阶段期间将所述输入音频信号编码成数据流;以及检测器(16),被配置为基于所述输入音频信号来检测在所述活动阶段(24)后进入不活动阶段(28),其中所述音频编码器被配置为:当检测到进入所述不活动阶段时,将所检测到的不活动阶段跟随的所述活动阶段期间连续地更新的所述参数背景噪声估计编码到所述数据流。

【技术特征摘要】
【国外来华专利技术】2011.02.14 US 61/442,6321.一种音频编码器,包括: 背景噪声估计器(12),被配置为在活动阶段(24)期间,基于输入音频信号来连续地更新参数背景噪声估计; 编码器(14),用于在该活动阶段期间将所述输入音频信号编码成数据流;以及 检测器(16),被配置为基于所述输入音频信号来检测在所述活动阶段(24)后进入不活动阶段(28), 其中所述音频编码器被配置为:当检测到进入所述不活动阶段时,将所检测到的不活动阶段跟随的所述活动阶段期间连续地更新的所述参数背景噪声估计编码到所述数据流。2.如权利要求1所述的音频编码器,其中所述背景噪声估计器(12)被配置为:在连续地更新所述参数背景噪声估计的过程中,区分所述输入音频信号内的噪声成分及有用信号成分,并且只根据所述噪声成分来确定所述参数背景噪声估计。3.如权利要求1或2所述的音频编码器,其中所述编码器(14)被配置为:在编码所述输入音频信号的过程中,将所述输入音频信号预测地编码成线性预测系数及激励信号,并且变换编码所述激励信号,并且将所述线性预测系数编码成所述数据流(30)。4.如权利要求3所述的音频编码器,其中所述背景噪声估计器(12)被配置为:在所述活动阶段期间使用所述激励信号来更新所述参数背景噪声估计。5.如权利要求3或4所述的音频编码器,其中所述背景噪声估计器被配置为:在更新所述参数背景噪声估计的过程中,识别所述激励信号中的局部最小值,并且执行所述局部最小值处的所述激励信号的统计分析,以得出所述参数背景噪声估计。6.如前述权利要求中任一项所述的音频编码器,其中所述编码器被配置为:在编码所述输入信号的过程中,使用预测编码和/或变换编码来编码所述输入音频信号的较低频部分,以及使用参数编码来编码所述输入音频信号的较高频部分的频谱包络。7.如前述权利要求中任一项所述的音频编码器,其中所述编码器被配置为:在编码所述输入信号的过程中,使用预测编码和/或变换编码来编码所述输入音频信号的较低频部分,以及在使用参数编码来编码所述输入音频信号的较高频部分的频谱包络和使所述输入音频信号的所述较高频部分不经编码之间做出选择。8.如权利要求6或7所述的音频编码器,其中所述编码器被配置为:在不活动阶段中,中断所述预测编码和/或变换编码以及所述参数编码;或者在活动阶段中,中断所述预测编码和/或变换编码,并以与使用所述参数编码相比更低的时间/频率分辨率来对所述输入音频信号的所述较高频部分的所述频谱包络执行所述参数编码。9.如权利要求6、7或8所述的音频编码器,其中所述编码器使用滤波器组来在频谱上将所述输入音频信号分解为形成所述较低频部分的子带集合,和形成所述较高频部分的子带集合。10.如权利要求9所述的音频编码器,其中所述背景噪声估计器被配置为:在活动阶段中,基于所述输入音频信号的所述较低频部分和较高频部分来更新所述参数背景噪声估计。11.如权利要求10所述的音频编码器,其中所述背景噪声估计器被配置为:在更新所述参数背景噪声估计的过程中,识别所述输入音频信号的所述较低频部分和较高频部分中的局部最小值,以及执行所述局部最小值处的所述输入音频信号的所述较低频部分和较高频部分的统计分析,以得出所述参数背景噪声估计。12.如前述权利要求中任一项所述的音频编码器,其中所述噪声估计器被配置为即便在不活动阶段期间仍继续连续地更新所述背景噪声估计,其中所述音频编码器被配置为间歇地编码在不活动阶段期间连续地更新的所述参数背景噪声估计的更新。13.如权利要求12所述的音频编码器,其中所述音频编码器被配置为:在固定的或可变的时间区间内,间歇地编码所述参数背景噪声估计的所述更新。14.一种用于解码数据流以根据其重建音频信号的音频解码器,所述数据流至少包括活动阶段(86)和接在其后的不活动阶段(88),所述音频解码器包括: 背景噪声估计器(90),被配置为在所述活动阶段(86)期间连续地根据所述数据流(104)更新参数背景噪声估计; 解码器(92),被配置为在所述活动阶段期间根据所述数据流重建所述音频信号; 参数随机生成器(94);以及 背景噪声生成器(96),被配置为:通过根据所述参数背景噪声估计在所述不活动阶段(88)期间控制所述参数随机生成器(94...

【专利技术属性】
技术研发人员:帕尼·塞蒂亚万康斯坦丁·施密特斯特凡·维尔登
申请(专利权)人:弗兰霍菲尔运输应用研究公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1