编码设备、编码方法和包括该方法的计算机程序产品技术

技术编号:3772620 阅读:243 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了编码设备、编码方法和包括该方法的计算机程序产品。 该编码设备将音频信号转换为频谱,确定针对按照预定宽度划分音频信 号的频谱而获得的频带的容许误差功率,从频谱中检测音调频谱,并且 检测包含该音调频谱的频带。使用该检测结果和容许误差功率,编码设 备执行校正,使得功率确定单元针对与检测单元检测出的频带相邻的频 带而确定的容许误差功率小于针对该相邻的频带的频谱的功率,并且对 功率大于经校正的容许误差功率的每个频谱进行量化。

【技术实现步骤摘要】

本专利技术涉及编码设备、编码方法和包括编码方法的程序产品。
技术介绍
传统上,已对用于压缩/解压縮作为语音、音乐等的声音源的音频信 号的音频编码技术进行了各种研究。例如,针对用于通过转换为频域来 编码音频信号的方案进行了各种研究。例如,这些音频编码技术将在高级音频编码(ACC)方法、高效高 级音频编码(HE-ACC)方法中出现。ACC和HE-ACC方法是ISO/IEC MPEG-2/4音频标准中的方法,并且广泛用于数字广播(例如数字地面、 BS数字和通信卫星,以及日本的一段式广播)中。在这些音频编码技术中,用于实现音频编码技术的常规编码设备通 过修正离散余弦变换(MDCT)转换将音频信号转换为频谱,对频谱进 行量化,然后执行编码。常规编码设备利用听觉遮蔽属性(auditory masking property)来对频 谱进行量化。具体地说,常规编码设备仅对可由人类听觉感受所听到的 声音进行量化。在量化中,使用作为阈值的遮蔽阈值,即,用于是否可 听到声音的阈值,来确定在听觉上不能被听到的声音分量。例如,常规编码设备执行音质分析,这是用于针对音频信号(要编 码的声音源)分析是否可在听觉上听到声音的方案。然后对于每个频率 确定遮蔽阈值。其后,对于具有预定频率宽度的每个频带,常规编码设 备确定误差界限。误差界限是基于确定的遮蔽阈值而在量化期间所允许 的容许误差功率。然后,使用该容许误差功率,常规编码设备仅对作为 在听觉上可听到的声音源的频谱进行量化。日本特开第2006-18023号的第5到11页和图1公开了用于调整遮蔽阈值的方案,日本特开第2001-7704号的第5到9页和图1公开了用于 改进编码期间的效率以减少编码期间使用的比特使用量的方案。另外, 日本特开第7-202823号的第3到5页和图1以及日本特开第7-295594号 的第2到3页和图1公开了用于指定比特分布量的方案。同时,上述常规技术具有在编码音调高的音频信号期间声音质量劣 化的问题。更详细地说,因为常规编码设备在编码音调音频信号期间不能可靠 地对与峰值相邻的频谱进行量化,所以该设备不能令人满意地执行编码 同时维持足够的声音质量。上述的日本特开未公开用于可靠地量化与峰值相邻的频谱的方案并 且不能在编码音调音频信号期间充分地改善声音质量。
技术实现思路
本专利技术的一个目的是提供能够以令人满意的状态操作的编码设备。 根据本专利技术的一个方面,提供了现在的编码设备,其用于将音频信 号转换为频谱并且对该频谱进行量化和编码,该编码设备包括功率校正 单元和量化单元,该功率校正单元用于当从频谱检测到音调频谱(tonal fr叫uency spectrum)时校正根据音频信号确定的容许误差功率,该量化 单元用于对具有比由功率校正单元校正的容许误差功率大的功率的每个 频谱进行量化。根据本专利技术的另一方面,提供了一种用于对音频信号进行编码的编 码设备,其包括用于将音频信号转换为频谱的频率转换单元、用于根据 音频信号确定容许误差功率的功率确定单元、用于从由频率转换单元转 换的频谱中检测音调频谱的检测单元、用于利用检测单元执行的检测的 结果和功率确定单元确定的容许误差功率来校正容许误差功率的功率校 正单元,以及用于对具有比由功率校正单元校正的容许误差功率大的功 率的每个频谱进行量化的量化单元。附图说明图1例示了示出根据第一实施方式的编码设备的基础技术的图2例示了示出根据第一实施方式的编码设备的基础技术的图3A到3C例示了示出根据第一实施方式的编码设备的基础技术的图4例示了示出根据第一实施方式的编码设备的基础技术的图; 图5例示了示出根据第一实施方式的编码设备的概况和结构的图; 图6例示了示出根据第一实施方式的编码设备的结构的框图; 图7A到7D例示了示出根据第一实施方式的编码设备的音调检测单 元的图8A和8B例示了示出根据第一实施方式的编码设备中的音质分析 单元的图9例示了示出根据第一实施方式的编码设备中的容许误差功率校 正单元的图IOA到IOD例示了示出根据第一实施方式的编码单元中的容许误 差功率校正单元的图11A和11B例示了示出根据第一实施方式的编码单元中的縮放因 子校正单元的图12例示了示出根据第一实施方式的编码设备的处理流程的流程图13例示了示出根据第一实施方式的编码设备的縮放因子校正单 元执行的处理流程的流程图14A例示了音频信号的波形,图14B例示了经编码的信号,并且 图14C例示了经编码的信号的频率特性;图15例示了与音调频谱相邻的频谱;图16A例示了原始声音,图16B例示了在使用已知方案进行量化期 间生成的异常声音的生成,并且图16C例示了异常声音的减少; 图17例示了示出根据第二实施方式的编码设备的图; 图18A到18C例示了示出根据第二实施方式的编码设备的图; 图19例示了根据第二实施方式的编码设备中的縮放因子校正处理的流程图20例示了示出根据第三实施方式的编码设备的图; 图21例示了示出根据第三实施方式的编码设备的图; 图22例示了用于根据第一实施方式的编码设备的程序的图;以及图23A到23C例示了对于基础技术的考虑。具体实施方式 参考图23A到23B,描述了对编码音频信号的常规技术的考虑,以 弄清在对与音调音频信号的峰值相邻的频谱进行量化时造成的缺点。当 编码音调音频信号,例如正弦波、扫描波等时,以dB为单位的强度或功 率集中在相比于其它频带展示出相对大的峰值的特定频带中。即,特定 频带具有如图23A中所示具有高强度的频谱,图23A例示了通过对音调 音频信号执行MDCT转换而获得的频谱。而且,如图23B中所示,在常规编码设备中,针对与包括峰值的频 带相邻的频带而确定的容许误差功率也增大了。具体地说,因为包括峰 值的频带中的频谱在功率上大于其它频谱,所以常规编码设备也具有为 相邻频带和包括峰值的频带确定的较大遮蔽阈值。结果,容许误差功率 也增大了。传统上,如图23C中所示,与峰值相邻的频带中的频谱为小 于或等于容许误差功率的频谱。因为相邻频带中的频谱被认为是不要量化的频谱,所以不量化该频谱。当通过MDCT转换音频信号时,合成频谱由都包含音频信号的振幅 和相位信息的各个MDCT系数组成,虽然图23A、 23B和23C中的每一 个仅仅示出了单独的振幅。例如,当与峰值相邻的频谱未被量化时,频 谱中包含的信息丢失了。因此,相位和振幅的减少影响了声音源中与峰 值关联的分量,并且造成声音质量劣化,例如抖音的感觉。特别是,对 于音调音频信号,相比于低音调音频信号,在具有峰值的频带中与特定 频率相邻的声音源有效地贡献于主声音源,并且由于与峰值相邻的频谱 中包含的信息的丢失而造成的影响对于经编码的声音源的声音质量有强烈的影响。下面将参考附图详细描述编码设备、编码方法和包括该方法的程序 产品的实施方式。在下面,按顺序描述根据第一实施方式的编码设备的 基础技术、概况、特征以及处理流程,然后描述其它实施方式。首先,利用图1到4来描述用于描述根据第一实施方式的编码设备 的基础技术。术语"频谱"对应于系数,例如,通过例如由MDCT将音频信号(声 音源)转换为频域而获得的每个频率的MDCT系数。术语"频谱功率" 对应于频谱的平方的值。术语"音调频谱"是当频谱功率的峰值集中于本文档来自技高网
...

【技术保护点】
一种编码设备,其用于将音频信号转换为多个频谱并且用于对每个频谱进行量化和编码,该编码设备包括: 功率校正单元,其用于当从所述频谱中检测到音调频谱时多次校正根据所述音频信号确定的容许误差功率,各容许误差功率对应于各相应频谱的量化误差;和  量化单元,其用于对具有比由所述功率校正单元校正的容许误差功率大的功率的每个频谱进行量化。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:白川美由纪铃木政直土永义照
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1