音频处理方法和音频处理装置制造方法及图纸

技术编号:3065538 阅读:165 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及音频处理方法和音频处理装置。音量调整单元减小音频数据的音量。通过对预先减小音量的音频数据的编码,减小了在重现侧装置以超过最大比特数的方式进行解码的概率。于是,音量调整单元需要根据压缩比在数据输入单元至量化编码单元的处理过程中(即在量化结束之前)减小音频数据的音量。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及处理音频数据的方法和装置,尤其涉及在重现音频数据时能减小音频数据的噪声的技术。
技术介绍
近年来,高压缩比的数字音频数据的编码已经历了认真的研究和开发,并且它的应用领域正在拓宽。特别是随着便携式音频重现设备的广泛使用,现在一般记录在诸如CD(压缩磁盘)盘上的线性PCM信号都被压缩并记录在诸如小型半导体存储器或小型磁盘之类的记录媒质上。同样,在充满信息的现代社会,数据压缩技术是绝对不可缺少的,并且希望通过压缩需要记录的数据来节省记录的容量,即使是采用大容量的记录媒介,诸如,HD(硬盘),CD-R,或DVD。这种压缩编码可以采用目前的多种技术来完成,这些技术包括根据人耳听觉的特性放映不必要的信号、量化位分配的优化以及赫夫曼(Huffman)编码。在该领域中,具有较高音频质量和较高压缩比的音频数据压缩技术每天都被作为重要的项目进行着研究。在对所压缩数据的重现过程中,压缩比越高,量化误差就越大,其结果是,出现重现的音频数据超过音频数据的原始动态范围。例如,当以高压缩比对16比特PCM信号进行压缩并随后解压缩或展开时,在计算中会出现展开数据超过16比特的情况。在这种情况下,通常采用称之为剪辑的技术,由此将超过16比特的数据替换成以16比特表示的最大值。以通常实践中所需的压缩比,很少会出现剪辑效果可在听觉上感觉到的情况。但是,以现在所需的高压缩比,由远大于以前的量化误差所引起的剪辑导致经常出现耳朵所讨厌的噪声。随着未来压缩比的进一步提高,这类噪声问题也会进一步增加。因此,我们认为仅仅在重现一边依靠设备来剪辑是不能充分满足对于这类问题的解决。以下是在分析剪辑和噪声之间关系中的实验数据。图1示出了在剪辑数量和噪声存在或不存在之间的关系,这时音频数据在固定的压缩条件进行压缩并随后由重现装置展开并重现。这些是实验的结果,在实验中准备500,000采样×2通道作为声源。如图1所示,采样1至采样3是对来自大容量声源的音频数据进行压缩的实验数据,而采样4和采样5是对来自小容量声源的音频数据进行压缩的实验数据。关于剪辑的数量,可将九次连续的剪辑看成一次。在表中可以很明显地看到在重现采样1至采样3时会发生剪辑和噪声,而在重现采样4和采样5时就不会发生剪辑和噪声。该实验的结果表明,在同样的压缩条件下,声源的容量越大,剪辑和噪声就发生得越多。图2显示了在剪辑的数量和有无噪声之间的关系,在试验中准备500,000采样×2通道作为声源,使之产生图1中使用采样1至采样3时所出现的剪辑,并且在不同的压缩条件下压缩音频数据,随后通过一再现装置进行展开并重现。关于剪辑的次数,九次连续的剪辑计为一次。压缩时的频带与压缩结束后的频带相比更窄,这表明数值越小,压缩比越高。采用这样的方式完成压缩可除去进行时间—频率转换的数据的高频分量。例如,可以将采样6的8KHz的频带理解成在除去了8KHz以上的高频分量之后0至8KHz的频带。该表显示了,使用采样6至采样10都会产生剪辑,而且使用采样6至采样8会产生噪声,使用采样9和采样10不会产生噪声。因此,该实验结果表明,噪声的产生取决于压缩时的频带而不是剪辑的次数。图3显示了当采用5KHz正弦波的声源时进行重现的频谱。该实验的结果表明,存在发生在1KHz至9KHz的噪声分量。这里要注意的是,在15KHz和大于15KHz处的噪声分量人耳基本上是听不到的。因此,可以认为在重现音频数据时9KHz附近不会出现音频,由5KHz正弦波引起的在9KHz处的噪声分量,作为人耳所讨厌的噪声被检测到。例如,在0到8KHz的频带上完成压缩的图2中使用采样6,在其它声音之后可以隐藏掉1KHz的噪声分量,但是9KHz的噪声分量却可以被人耳听到。本专利技术的专利技术者考虑到了,发生图2试验结果所示噪声的一个原因是无法通过除去音频数据的高频分量并在压缩时使频带变窄来隐藏其它声音的噪声分量。
技术实现思路
基于以上通过实验所获得的知识,专利技术者构思了一种新颖的压缩音频数据的方法,以这种方式可减少重现信号的噪声。因此,本专利技术的一个目的是提供能够解决上述讨论问题的处理音频数据的方法和装置。根据本专利技术的较佳实施例,为解决上述问题并实现目的,提供了一种音频处理的方法,该方法包括输入音频数据,其中音量的幅值由数据值的幅值来表示;以及量化所输入的音频数据,其中在音量被减小到所述输入音频数据的预定等级之后或量化输入的音频数据之后,继续进行随后的处理。根据本较佳实施例的音频处理方法,通过在所述量化结束之前的阶段前降低音量的等级,可以减小所量化的音频数据在展开时以超过最大比特数的方式来解码的概率。可通过使数据值变小来完成对降低音量等级的处理。音频数据是指诸如乐声和声音之类的声音数据。根据本专利技术的另一实施例,提供了一种音频处理装置,它包括输入音频数据的输入单元,其中音量的幅值由数据值的幅值来表示;对所输入的音频数据进行时间—频率转换的转换单元;量化由频率表示的音频数据并对所量化的音频数据进行编码的量化编码单元;以及音量调整单元,它将音量降低到输入单元、变换单元或量化编码单元所处理的预定等级。根据本较佳实施例的音频处理装置,通过在量化结束之前的步骤前降低音量的等级,可以减小所量化的音频数据在展开时采用超过最大比特数目的方式来解码的概率。可通过使数据值变小来完成对降低音量等级的处理。较佳的是音量调整单元根据音频处理装置所要实现的音频数据压缩的条件来降低音量。此外,音量调整单元可以根据压缩的频带来降低音量。该音频处理装置还可包括音量检测器,该检测器预先检测出超过音频数据预定部分的音频数据的音量,并且音量调整单元可以根据音量检测器所检测到的音量来确定音量降低的程度。要注意的是,上述结构部件的任何任意的组合,以及在方法、装置、系统、记录媒介等之间变化的表示都是有效的且被本实施例所包含。此外,本专利技术的上述内容并不需要描述所有必需的特征,从而本专利技术也可以是这些所讨论特征的子组合。附图说明图1显示了音频数据在固定压缩条件下进行压缩并随后被解压缩和重现时剪辑数和噪声存在与否之间的关系。图2显示了音频数据在各种压缩条件下进行压缩且随后被解压缩和重现时剪辑数和噪声存在与否之间的关系。图3显示了当声源为5KHz正弦波时重现的频谱。图4显示了根据本专利技术实施例的音频处理装置的结构。具体实施例方式将基于较佳实施例来讨论本专利技术,但这并不旨在限制本专利技术的范围而只是用于解释本专利技术。在实施例中所讨论的所有特征和组合并不一定是本专利技术所必需的。图4显示了根据本专利技术较佳实施例的音频处理装置100的结构。该音频处理装置100包括数据输入单元110、时间—频率转换单元112、缩放比例单元114、音质分析单元116、比特分配单元118、量化编码单元120、比特流发生器122、音量调整单元130、音量检测器132以及输出单元134。就硬件部件而言,音频处理装置100由CPU、存储器、存储器所下载的程序等任意音频装置的部分来实现。这里较佳实施例的描述涉及与这种部件一起实现的功能块。音频处理装置100的功能可以整体或部分地集成于LSI。因此,业内的专业人士应该理解到,可以采用只使用硬件、只使用软件、或两者的组合等多种形式来实现这些功能块。首先在这里,将讨论根据本实施例的音频处理装置100的基本操作。首先将本文档来自技高网
...

【技术保护点】
一种音频处理方法,包括:输入音频数据,其中音量的幅值由数据值的幅值来表示;以及量化所输入的音频数据,其中,在音量减小到所述输入音频数据的预定等级或量化所述输入音频数据之后,继续随后的处理。

【技术特征摘要】
JP 2002-3-19 2002-0772091.一种音频处理方法,包括输入音频数据,其中音量的幅值由数据值的幅值来表示;以及量化所输入的音频数据,其中,在音量减小到所述输入音频数据的预定等级或量化所述输入音频数据之后,继续随后的处理。2.一种音频处理装置,包括输入音频数据的输入单元,其中,音量的幅值由数据值的幅值表示;转换单元,用于对所输入的音频数据进行时间—频率转换;量化编码单元,用于量化频率表示的音频数据并对量化的音频数据进行编码;以及,音量调整单元,用于减小在所述输入单元、所述变换单元或所述量化编码单元处理的预定级的音量。3.根据权利要求2所述的音频处理装置,其特征在于,所述音量调整单元根据音频处理装置所实现的音频数据的压缩条件来减小音量。4.根据权利要求2所述的音频处理装置,其特征在于,所述音量调整单元根据压缩的频带来减小音量。5.根据权利要求4所述的音频处理装置,其特征在于,如果压缩...

【专利技术属性】
技术研发人员:大山達史山内英樹
申请(专利权)人:三洋电机株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1