音频编码装置、音频解码装置、音频编码方法、音频解码方法和信息记录介质制造方法及图纸

技术编号:5450350 阅读:167 留言:0更新日期:2012-04-11 18:40
在编码过程中,CPU(9121)将音频信号从实时域变换为频域,并将该信号变换为由多个MDCT系数组成的频谱。CPU(9121)将音频信号划分为几个频带,在每一个频带内执行比特移位,以便可以用预先配置的比特数表示MDCT系数。CPU(9121)针对各个频带以不同的精度重新量化MDCT系数,将由此获得的数值和移位比特数作为编码数据发送。同时,在解码过程中,CPU(9121)接收编码数据,逆重新量化和逆比特移位该数据,从而恢复MDCT系数。而且,CPU(9121)通过使用逆MDCT,将数据从频域变换为实时域,恢复并输出音频信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种音频编码装置、音频解码装置、音频编码方法、音频解码方法和信息记录介质,其能够以高质量和高速度编码和解码音频信号。
技术介绍
在通信量受限制的条件下进行的音频通信中,必须创新性地使用音频信号编码和解码处理,以便在数据最少的情况下以可实现的最大音频质量进行通信o一个这种创新的方向包括有效的利用人听觉的特性。作为考虑了听觉的特性的一种音频编码方法,例如在日本未审日本专利申请KOKAI (特开平)公幵No,H7-46137和JIS Std. No.JISX4323中所述的,已知了多种方法,在这些方法中,在将音频信号转换为频谱后,将频谱分为多个子带,同时考虑由听觉特性得到的关键区域。作为结果,考虑了用于每一个上述子带的信号值、掩蔽电平、噪声等,在计算了编码所必需的比特数之后,进行编码。然而,在这种方法中,用于计算编码所必需的比特数的过程是复杂的,并且需要许多计算步骤。另外,还存在问题是,计算例如掩蔽电平是重要的。因此,在执行计算处理的编码装置上的负载变大,存在处理速度变慢的风险。例如,在如移动电话的装置中,有可能实时双向通信会变得困难。为了避免这种情况,不可避免地招致了成本提高,因为必须将特别高性能的计算设备包含在编码装置中等。因此,需要这样的音频编码装置和解码装置其能够在考虑听觉特性的同时进行实时通信,而不存在任何实际音频质量问题,其使用了通常性能足够的计算设备。
技术实现思路
考虑到上述情况而设计的本专利技术的目的是提供一种音频编码装置、音 频解码装置、音频编码方法、音频解码方法和信息记录介质,其能够以高 质量和高速度编码和解码音频信号。为了实现上述目的,根据本专利技术的第一方面的音频编码装置包括以下存储单元(9123),其存储表示由多个第一频带组成的音频数据的每一 个频带的频率宽度的信息,所述多个第一频带分别与预定比特数相关联;离散变换单元(9121),其获得所述音频数据,将所述音频数据从实时 域离散变换到频域,并且计算表示每一个频率的音频强度的量化值;最大值计算单元(9121),其将离散变换得到的频域音频数据划分为具 有所述频率宽度的所述多个第一频带,并且计算每一个所划分的第一频带 的所计算的量化值之中的最大值;确定单元(9121),其针对每一个所述第一频带,确定用于表示由所述 最大值计算单元计算的最大值所必需的比特数是否超过存储在所述存储单 元(9123)中的所述预定比特数;调整单元(9121),其针对每一个所述第一频带,在由所述确定单元确 定所述必需的比特数超过了所述预定比特数的情况下,获得一个除数,并 且分别将在该第一频带内的量化值除以这个除数,从而调整所述音频强度, 其中这个除数(表示为2的幂的值)是这样的值中的最小值当用所述最 大值除以该值时,所述必需的比特数不超过所述预定比特数;重新量化单元(9121),其针对具有预定带宽的多个第二频带中的每一 个,以预先确定的精度重新量化由所述离散变换单元计算的量化值,或者 可替换地,重新量化由所述调整单元调整后的量化值;以及编码单元(9121),其编码、关联并输出由所述调整单元计算的所述除 数和由所述重新量化单元计算的所述量化值。为了实现上述目的,根据本专利技术的第二方面的音频解码装置包括以下-接收器(9161),其接收编码数据,该数据由预定编码方法编码,并由 量化的音频数据和数值参数组成,该量化的音频数据的信号强度由针对多 个第一频带中的每一个而被调整后的量化值表示,该数值参数表示为2的幂,并且与为音频数据配置的多个设定的第二频带中的每一个频带相关联;解码单元(9121),其通过使用对应于所述预定编码方法的解码方法, 将所述编码数据解码为所述量化的音频数据和所述数值参数;强度恢复单元(9121),其针对所述多个第二频带中的每一个,将该频 带内的已解码的所述量化值乘以与该频带相关联的已解码的所述数值参数,从而恢复所述音频数据的音频强度;以及离散逆变换单元(9121),其针对所述多个第一频带中的每一个,将恢 复强度后的所述音频数据从频域变换到时域。作为本专利技术的结果,可以快速反应灵敏的编码/解码音频信号,同时保 持高音质。附图说明在阅读了以下详细说明和附图后,本专利技术的这些目的及其它目的和优点会变得更显而易见,其中图1显示了根据本专利技术实施例的音频编码/解码装置的结构;图2A显示了在MDCT系数和频率之间的关系;图2B是图2A —部分的放大视图;图2C是用于解释中间段(medium-segment)频带的图示;图2D是图2C —部分的放大视图3是显示MDCT系数的比特移位计算过程的流程图4A显示了划分到中间段频带中的音频信号;图4B是用于解释分配给每一个中间段频带的比特数的图示;图4C显示了比特移位的MDCT系数;图5A显示了划分为三大段频带的整个频域;图5B显示了在重新量化 前的比特移位的MDCT系数的对数;图5C显示了重新量化后的比特移位 的MDCT系数的对数;图6A显示了第一实施例中的音频信号编码过程;图6B显示了音频信 号解码过程;图7A显示了第二实施例中的实时域音频信号;图7B显示了动态范围 调整前的音频信号;图7C显示了动态范围调整后的音频信号; 图8是显示第二实施例中的动态范围调整过程的流程图;图9A显示了第二实施例中的编码频带和优先级;图9B和9C显示了 基于优先级而编码的MDCT系数熵;图IO是显示第二实施例中的优先级决定过程的流程图; 图11是显示第二实施例中熵编码过程的流程图; 图12A显示了第二实施例中的音频信号处理。图12B显示了音频信号 解码过程;图13是显示第二实施例中音频信号解码过程的流程图;及图14是显示第二实施例中解码过程的流程图(继续的)。具体实施例方式(实施例1)图l显示了根据本专利技术的音频编码/解码装置9111。例如,移动电话可 以用于该装置。音频编码/解码装置9111起到音频数据编码装置的作用,并 还起到编码音频数据解码装置的作用。音频编码装置9111包括CPU (中央处理单元)9121、 ROM (只读存 储器)9123、存储单元9125、音频处理单元9141、无线通信单元9161和 输入接收单元9171。由系统总线9181相互连接它们。系统总线9181是用 于发送指令和数据的发送通路。在ROM 9123中存储了用于音频编码/解码的程序,其使用了下文所述 的处理。存储单元9125包括RAM(随机存取存储器)9131和硬盘驱动器9133。 存储单元9125存储数字音频信号、MDCT系数、移位比特数、代码,以及 下文中将会说明的小段各自的特性、中间段和大段。音频编码/解码装置9111还包括麦克风9151、扬声器9153、天线9163 以及操作键9173。麦克风9151拾取发送方用户的音频(语声等),并将其输入音频处理 单元9141。扬声器9153输出由音频处理单元9141解码的音频。天线9163 将从无线通信单元9161输入的无线信号发送到通信中的另一方的装置,并 且还接收从另一方终端发送的无线信号,并将其输入到无线通信单元9161。 例如使用了操作键9173来从用户接收用于改变音频信号频带的边界频率的12初始配置值的指令输入以及用于指定另一方的指令输入。作为来自CPU 9121的控制的结果,音频处理单元91本文档来自技高网...

【技术保护点】
一种音频编码装置,包括: 存储单元(9123),其存储表示由多个第一频带组成的音频数据的每一个频带的频率宽度的信息,所述多个第一频带分别与预定比特数相关联;离散变换单元(9121),其通过获得所述音频数据并计算表示每一个频率的音频强度 的量化值,将所述音频数据从实时域离散变换到频域; 最大值计算单元(9121),其将离散变换得到的频域音频数据划分为具有所述频率宽度的所述多个第一频带,并且计算每一个所划分的第一频带的所计算的量化值之中的最大值; 确定单元(912 1),其针对每一个所述第一频带,确定用于表示由所述最大值计算单元(1921)计算的最大值所必需的比特数是否超过存储在所述存储单元(9123)中的所述预定比特数; 调整单元(9121),其针对每一个所述第一频带,在由所述确定单元(912 1)确定所述必需的比特数超过了所述预定比特数的情况下,获得一个除数,并且分别将在该第一频带内的量化值除以这个除数,从而调整所述音频强度,其中这个除数(表示为2的幂的值)是这样的值中的最小值:当用所述最大值除以该值时,所述必需的比特数不超过所述预定比特数; 重新量化单元(9121),其针对具有预定带宽的多个第二频带中的每一个,以预先确定的精度重新量化由所述离散变换单元(9121)计算的量化值,或者可替换地,重新量化由所述调整单元(9121)调整后的量化值;以及 编码 单元(9121),其编码、关联并输出由所述调整单元(9121)计算的所述除数和由所述重新量化单元(9121)计算的所述量化值。...

【技术特征摘要】
【国外来华专利技术】JP 2006-10-2 270993/20061、一种音频编码装置,包括存储单元(9123),其存储表示由多个第一频带组成的音频数据的每一个频带的频率宽度的信息,所述多个第一频带分别与预定比特数相关联;离散变换单元(9121),其通过获得所述音频数据并计算表示每一个频率的音频强度的量化值,将所述音频数据从实时域离散变换到频域;最大值计算单元(9121),其将离散变换得到的频域音频数据划分为具有所述频率宽度的所述多个第一频带,并且计算每一个所划分的第一频带的所计算的量化值之中的最大值;确定单元(9121),其针对每一个所述第一频带,确定用于表示由所述最大值计算单元(1921)计算的最大值所必需的比特数是否超过存储在所述存储单元(9123)中的所述预定比特数;调整单元(9121),其针对每一个所述第一频带,在由所述确定单元(9121)确定所述必需的比特数超过了所述预定比特数的情况下,获得一个除数,并且分别将在该第一频带内的量化值除以这个除数,从而调整所述音频强度,其中这个除数(表示为2的幂的值)是这样的值中的最小值当用所述最大值除以该值时,所述必需的比特数不超过所述预定比特数;重新量化单元(9121),其针对具有预定带宽的多个第二频带中的每一个,以预先确定的精度重新量化由所述离散变换单元(9121)计算的量化值,或者可替换地,重新量化由所述调整单元(9121)调整后的量化值;以及编码单元(9121),其编码、关联并输出由所述调整单元(9121)计算的所述除数和由所述重新量化单元(9121)计算的所述量化值。2、 如权利要求1所述的音频编码装置,其中所述存储单元(9123)所关联的比特数随着所述频率宽度的中心频率 变小而变大。3、 如权利要求1所述的音频编码装置,其中所述最大值计算单元(9121)将所述音频数据划分为所述多个第一频带,以使得每一个带宽的对数从低频侧连续地线性增大。4、 如权利要求1所述的音频编码装置,其中所述重新量化单元(9121)进行重新量化,以使得重新量化精度随着所述多个第二频带之一靠近低频侧而增大。5、 如权利要求1所述的音频编码装置,其中所述重新量化单元(9121)分别计算由所述调整单元(9121)调整后的量化值的对数,并重新量化所述对数。6、 如权利要求1所述的音频编码装置,其中所述重新量化单元(9121)划分并重新量化所述音频数据,所述划分是划分为具有所述预定带宽的所述多个第二频带,并且其中,每一个频带的对数从低频侧连续地线性增大。7、 如权利要求1所述的音频编码装置,其中-所述重新量化单元(9121)将所述音频数据划分为至少三个所述第二频带,即低频频带、中频频带和高频频带,并且所述划分使得在所述中频频带与所述高频频带之间的边界频率是所述音频数据的上限频率的一半。8、 如权利要求1所述的音频编码装置,其中所述编码单元(9121)针对多个由一个或多个所述第一频带组成的第三频带中的每一个,计算包含在该频带中的量化值的平方值的总和值,从计算得到的最大总和开始以降序确定优先级,并且以优先级的降序方式对在所述多个第三频带内的量化值进行熵编码。9、 如权利要求8所述的音频编码装置,其中所述编码单元(9121)计算每一个总和值乘以一个预定值的数值,该预定值随着所述总和值靠近低频侧而增大,并且从计算得到的最大总和开始以降序方式确定优先级。10、 如权利要求1所述的音频编码装置,其中所述离散变换单元(9121)通过使用MDCT (改进的离散余弦变换) 来计算所述量化值。11、 一种音频解码装置,包括接收单元(9161),其接收编码数据,该数据由预定编码方法编码,并包括以下内容量化的音频数据,该量化的音频数据的信号强度由针对多个第一频带中的每一个而被调整后的量化值表示;以及数值参数,其表示为2的幂,并且与为所述音频数据配置的多个 设定的第二频带中的每一个频带相关联;解码单元(9121),其通过使用对应于所述预定编码方法的解码方法, 将所述编码数据解码为所述量化的音频数据和所述数值参数;强度恢复单元(9121),其针对所述多个第二频带中的每一个,将该频 带内的已解码的所述量化值乘以与该频带相关联的已解码的所述数值参 数,从而恢复所述音频数据的音频强度;以及离散逆变换单元(9121),其针对所述多个第一频带中的每一个,将恢 复强度后的所述音频数据从频域变换到时域。12、 一种在音频编码装置中执行的音频编码方法,该音频编码装置具 有存储单元(9123),所述存储单元(9123)存储表示由多个第一频带组成 的音频数据中的每一个频带的频率宽度的信息,所述多个第一频带分别与 预定比特数相关联,所述音频编码方法包括以下步骤获得所述音频数据,并通过计算表示每一个频率的音频强度的量化值, 将所述音频数据从时域离散变换到频域;将离散变换得到的频域音频数据划分为具有所述频率宽度的所述多个 第一频带,并且计算每一个所划分的第一频带的所计算的量化值之中的最 大值;针对每一个所述第一频带,确定用于表示在最大值计算步骤中计算的最大值所必需的比特数是否超过存储在所述存储单元(9123)中的所述预定比特数;针对每一个所述第一频带,在确定步骤中确定所述必需的比特数超过所述预定比特数的情况下,通过求得一个除数并将在该第一频带内的量化值除以这个除数来调整所述音频强度,这个除数(表示为2的幂的值)是这样的值中的最小值当用所述最大值除以该值时,所述必需的比特数不超过所述预定比特数;针对具有预定带宽的多个第二频带中的每一个,以预先确定的精度重新量化在离散变换步骤中计算的所述量化值,或者可替换地,重新量化在调整步骤中调整后的所述量化值;以及编码、关联并输...

【专利技术属性】
技术研发人员:井手博康
申请(专利权)人:卡西欧计算机株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1