音频信号编码装置和方法、传输系统和方法以及解码装置制造方法及图纸

技术编号:10121778 阅读:149 留言:0更新日期:2014-06-12 11:05
音频信号编码装置和方法、传输系统和方法以及解码装置。关于对音频信号进行编码、解码和传输的技术,一种装置用于实现更低的比特率。混响掩蔽特性获得单元(302)获得由通过再现音频信号表示的声音而在再现环境中生成的该声音的混响施加在该声音上的混响掩蔽的特性(307)。基于混响掩蔽的特性(307)来控制量化器(301)的量化步长(308)。控制单元(303)还基于由听觉掩蔽特性获得单元(304)获得的听觉掩蔽的特性来控制量化器(301)的量化步长(308)。进行编码使得在混响掩蔽的特性(307)大于听觉掩蔽的特性(310)的情况下尽可能地不对掩盖在混响中的频率进行编码。

【技术实现步骤摘要】
音频信号编码装置和方法、传输系统和方法以及解码装置
在本说明书中论述的实施方式涉及对音频信号进行编码、解码和传输的技术。
技术介绍
在移动应用的多媒体广播中,存在对低比特率传输的需求。对于音频信号如声音的音频信号,采用这样的编码:其中仅对例如可感知的声音,在考虑到人类的听觉特性的情况下进行编码和传输。作为编码的常规技术,已知如下技术(例如,日本特许公开第9-321628号)。一种音频编码装置包括:输入数据存储器,用于暂时存储被分成多个帧的输入音频信号数据;分频滤波器组,用于为每个帧生成分频后的数据;心理声学分析单元,用于接收i个帧,其中要针对其计算量化步长的帧被夹在i个帧之间,并且用于通过使用相关帧和包括掩蔽效应的人类听觉特性的频谱分析的结果来计算量化步长;量化器,用于使用由心理声学分析单元指示的量化步长对分频滤波器组的输出进行量化;以及多路复用器,用于对由量化器量化的数据进行多路复用。心理声学分析单元包括:频谱计数器,用于对帧进行频率分析;掩蔽曲线预测器,用于计算掩蔽曲线;以及量化步长预测器,用于计算量化步长。此外,作为另一常规技术,已知如下技术(例如,日本特许公开第2007-271686号)。在音频信号如音乐的音频信号的情况下,通过压缩去除的许多信号成分(被掩蔽声)是经衰减的成分,其以前是掩蔽声。这样,通过对解压缩的音频信号给予混响,将以前是掩蔽声但现在是被掩蔽声的信号成分以伪方式合并到当前信号以恢复原声的音频信号。由于人类听觉掩蔽特性依赖于频率而变化,因此将音频信号分成多个频带中的子带信号,将与每个频带的掩蔽特性一致的特性的混响给予子带信号。另外,已知如下技术(例如,国际专利申请第2008-503793号的国家公布)。在编码器中,将音频信号分成不带有回声的信号部分和关于涉及音频信号的混响场的信息,优选地通过使用非常轻微的参数如混响时间和混响幅度的表达来划分音频信号。然后,使用音频编解码器对不带有回声的信号进行编码。在解码器中,使用音频编解码器对不带有回声的信号部分进行恢复。[专利文献1]日本特许公开第09-321628号[专利文献2]日本特许公开第2007-271686号[专利文献3]国际专利申请第2008-503793号的日本国家公开
技术实现思路
因此,实施方式的一个方面的目的是提供用于音频信号编码或音频信号解码的技术,其中实现更低的比特率。根据实施方式的方面,音频信号编码装置包括:量化器,用于对音频信号进行量化;混响掩蔽特性获得单元,用于获得由通过再现该音频信号表示的声音而在再现环境中生成的该声音的混响施加在该声音上的混响掩蔽的特性;以及控制单元,用于基于混响掩蔽的特性来控制量化器的量化步长。根据实施方式的方面,提供了能够获得更低的比特率的优点。附图说明图1是示出用于在输入音频信号的编码中改进输入音频信号的音质的常用编码装置的配置示例的图;图2是示出根据图1的配置的编码装置的操作和效果的示意图;图3是第一实施方式的编码装置的框图;图4是示出具有图3的配置的第一实施方式的编码装置中的混响特性309的说明图;图5A和图5B是示出不存在混响和存在混响的情况下图3的编码装置的编码操作的说明图;图6是第二实施方式的音频信号编码装置的框图;图7是示出存储在混响特性存储单元612中的数据的配置示例的图;图8是图6的混响掩蔽计算单元602的框图;图9A、图9B和图9C是示出在使用混响对声音施加的频率掩蔽作为混响掩蔽的特性的情况下掩蔽计算的示例的说明图;图10A和图10B是示出在使用混响对声音施加的时间掩蔽作为混响掩蔽的特性的情况下掩蔽计算的示例的说明图;图11是图6的掩蔽合成单元603的框图;图12A和图12B是最大值计算单元1101的操作说明图;图13是示出借助于软件过程来实现具有图6的配置的第二实施方式的音频信号编码装置的功能的设备的控制操作的流程图;图14是第三实施方式的音频信号传输系统的框图;图15是图14的混响特性估计单元1407的框图;图16是示出借助于软件过程来实现如图15的配置示出的混响特性估计单元的功能的设备的控制操作的流程图;图17是示出进行其中预先传输再现环境的混响特性1408的过程的情况下编码装置1401以及解码和再现装置1402的控制过程的流程图;以及图18是示出进行其中周期性地传输再现环境的混响特性1408的过程的情况下编码装置1401以及解码和再现装置1402的控制过程的流程图。具体实施方式下面将参照附图详细地描述本专利技术的实施方式。在描述实施方式前,将描述常用技术。图1是示出用于在输入音频信号的编码中改进输入音频信号的音质的常用编码装置的配置示例的图。改进的离散余弦变换(MDCT)单元101将作为离散信号输入的输入声音转换成频率域中的信号。量化单元102对频率域中的频率信号成分进行量化。多路复用单元103将针对各个频率信号成分量化的多段量化数据多路复用成作为输出数据输出的编码比特流。听觉掩蔽计算单元104针对输入声音中的给定时间长度的每个帧进行频率分析。听觉掩蔽计算单元104在考虑到该频率分析和作为人类听觉特性的掩蔽效应的计算结果的情况下计算掩蔽曲线,基于掩蔽曲线针对每段量化数据计算量化步长,并将量化步长通知给量化单元102。量化单元102根据从听觉掩蔽计算单元104通知的量化步长对从MDCT单元101输出的频率域中的频率信号成分进行量化。图2是示出根据图1的配置的编码装置的功能效果的示意图。例如,假定图1的输入声音示意性地包括如图2的作为S1、S2、S3和S4示出的音频源频率信号成分。在这种情况下,人例如针对音频源S2的功率值具有由附图标记201指示的掩蔽曲线(频率特性)。就是说,输入声音中的音频源S2的存在使得人在功率值小于图2的掩蔽曲线201的功率值的掩蔽范围202内难以听到频率功率成分的声音。换言之,该频率功率成分被掩蔽。因此,由于这部分本性上难以被听到,因此,在图2中,通过对功率值处于掩蔽范围202内的音频源S1和音频源S3的每个频率信号成分分配精细的量化步长来进行量化是浪费的。另一方面,优选地,在图2中,因为人类能够良好地识别功率值超过掩蔽范围202的音频源S2和S4,所以针对音频源S2和S4分配精细的量化步长。鉴于此,在图2的编码装置中,听觉掩蔽计算单元104对输入声音进行频率分析以计算图2的掩蔽曲线201。然后,听觉掩蔽计算单元104使得功率值被估计为处于比掩蔽曲线201小的范围内的频率信号成分的量化步长较粗。另一方面,听觉掩蔽计算单元104使得功率值被估计处于比掩蔽曲线201大的范围内的频率信号成分的量化步长精细。以这种方式,具有图1的配置的编码装置使得不必要被精细听到的频率信号成分的量化步长较粗,以降低编码比特率,改进其编码效率。考虑一种情况,在这种编码装置中,输入声音的采样频率是48kHz,输入声音是立体声音频,并且其编码方案是AAC(高级音频编码)方案。在这种情况下,比特率例如具有CD(压缩盘)音质的128kbps被认为通过使用具有图1的配置的编码装置能够提供提高的编码效率。但是,在低比特率,如具有流式音频质量的96kbps或更低,或者达到移动电话的电话通信质量的情况下,编码声音的音质劣化。因此,要求即使在这种低比特率条件下,也在不使音质劣化本文档来自技高网
...
音频信号编码装置和方法、传输系统和方法以及解码装置

【技术保护点】
一种音频信号编码装置,包括:量化器,其对音频信号进行量化;混响掩蔽特性获得单元,用于获得由通过再现所述音频信号表示的声音而在再现环境中生成的所述声音的混响施加在所述声音上的混响掩蔽的特性;以及控制单元,其基于所述混响掩蔽的特性来控制所述量化器的量化步长。

【技术特征摘要】
2012.12.06 JP 2012-2671421.一种音频信号编码装置,包括:量化器,其对音频信号进行量化,所述音频信号编码装置的特征在于还包括:混响掩蔽特性获得单元,用于获得由通过再现所述音频信号表示的声音而在再现环境中生成的所述声音的混响施加在所述声音上的混响掩蔽的特性;以及控制单元,其基于所述混响掩蔽的特性来控制所述量化器的量化步长。2.根据权利要求1所述的音频信号编码装置,其中,所述控制单元基于所述混响掩蔽的特性进行这样的控制:与由所述音频信号表示的声音的幅度使得所述声音未被所述混响掩蔽的情况相比,在所述幅度使得所述声音被所述混响掩蔽的情况下,使所述量化步长更大。3.根据权利要求1所述的音频信号编码装置,其中,所述混响掩蔽特性获得单元获得所述混响对所述声音施加的频率掩蔽的特性作为所述混响掩蔽的特性。4.根据权利要求1所述的音频信号编码装置,其中,所述混响掩蔽特性获得单元获得所述混响对所述声音施加的时间掩蔽的特性作为所述混响掩蔽的特性。5.根据权利要求1所述的音频信号编码装置,还包括:听觉掩蔽特性获得单元,用于获得人类听觉特性对由所述音频信号表示的声音施加的听觉掩蔽的特性,其中,所述控制单元还基于所述听觉掩蔽的特性来控制所述量化器的所述量化步长。6.根据权利要求5所述的音频信号编码装置,其中,所述混响掩蔽特性获得单元获得被所述混响掩蔽的声音的幅度的频率特性作为所述混响掩蔽的特性,所述听觉掩蔽特性获得单元获得被所述人类听觉特性掩蔽的声音的幅度的频率特性作为所述听觉掩蔽的特性,并且所述控制单元基于通过针对每个频率在作为所述混响掩蔽的特性的频率特性和作为所述听觉掩蔽的特性的频率特性中选择较大的特性而获得的合成掩蔽特性,来控制所述量化器的所述量化步长。7.一种音频信号传输系统,包括:编码装置,用于对音频信号进行编码;以及解码和再现装置,用于对由所述编码装置编码的所述音频信号进行解码,并且在再现环境中再现由所述音频信号表示的声音,其中,所述编码装置包括:量化器,用于对音频信号进行量化;音频信号传输单元,用于将所量化音频信号传输给所述解码和再现装置;混响掩蔽特性获得单元,用于通过使用所述音频信号、所述再现环境的混响特性和预先准备的人类听觉心理模型来计算并获得由通过再现所述音频信号表示的声音而在所述再现环境中生成的所述声音的混响施加在所述声音上的混响掩蔽的特性;混响特性接收单...

【专利技术属性】
技术研发人员:外川太郎盐田千里岸洋平大谷猛铃木政直
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1