【技术实现步骤摘要】
本专利技术通常涉及音频编码系统,尤其涉及改善得自音频编码系统的音频信号的感知质量。
技术介绍
音频编码系统用于将音频信号编码为适合于传输或存储的编码信号,然后接收或检索编码信号并解码以获得用于回放的原始音频信号的一个版本。感知音频编码试图将原始音频信号编码为比原始音频信号信息容量要求更低的编码信号,然后将编码信号解码并提供在感知上与原始音频信号难以区别的输出。感知音频编码系统的一个实例参见高级电视标准化委员会(ATSC)A52文件(1994),称之为杜比AC-3。另一个实例参见Bodi等人的文献,“ISO/IEC MPEG-2Advanced Audio Coding,”J.AES,vol.45,no.10,October 1997,pp.789-814,称之为高级音频编码(AAC)。这两个编码系统和其它许多感知编码系统都对音频信号使用分析滤波器组以获得按聚类或频带排列的频谱分量。其带宽通常是变化的并且通常与人类听觉系统所谓临界带的宽度相当。感知编码系统可以用于减少音频信号的信息容量需求同时保留音频质量的主观或感知度量,所以音频信号的编码表示能够以更少的带宽通 ...
【技术保护点】
一种产生音频信息的方法,其中该方法包括:接收输入信号并从中获得一组子带信号,每个子带信号包含代表音频信号的频谱内容的一个或多个频谱分量;在该组子带信号中识别一个特定子带信号,其中的一个或多个频谱分量具有非零值并用具有对应于一 个阈值的最小量化水平的量化器将其量化,其中的多个频谱分量的值是零;生成对应于该特定子波带中各零值频谱分量的合成频谱分量,并按照小于或等于阈值的比例包络进行比例调整;通过在该特定子带信号中用合成频谱分量代替相应的零值频谱分量来 生成一组修改的子带信号;以及通过将合成滤波器组应用于该修改的子带信号来生成音频信息。
【技术特征摘要】
US 2002-6-17 10/174,4931.一种产生音频信息的方法,其中该方法包括接收输入信号并从中获得一组子带信号,每个子带信号包含代表音频信号的频谱内容的一个或多个频谱分量;在该组子带信号中识别一个特定子带信号,其中的一个或多个频谱分量具有非零值并用具有对应于一个阈值的最小量化水平的量化器将其量化,其中的多个频谱分量的值是零;生成对应于该特定子波带中各零值频谱分量的合成频谱分量,并按照小于或等于阈值的比例包络进行比例调整;通过在该特定子带信号中用合成频谱分量代替相应的零值频谱分量来生成一组修改的子带信号;以及通过将合成滤波器组应用于该修改的子带信号来生成音频信息。2.权利要求1的方法,其中比例包络是均匀的。3.权利要求1或2的方法,其中合成滤波器组由在相邻频谱分量之间存在频谱泄漏的块变换实现,比例包络按照一个基本上等于块变换频谱泄漏的衰减率的比率变化。4.权利要求1至3中任一个的方法,其中合成滤波器组由块变换实现,该方法包括对该组子带信号的一个或多个频谱分量使用频域滤波器;以及由频域滤波器的输出导出比例包络。5.权利要求4的方法,包括随着频率改变频域滤波器的响应。6.权利要求1至5中任何一个的方法,包括获得由该组子带信号代表的音频信号音调的度量;以及根据音调的度量适配比例包络。7.权利要求6的方法,从输入信号中获得音调的度量。8.权利要求6的方法,包括由零值频谱分量在该特定子带信号中的排列方式导出音调的度量。9.权利要求1至8中任何一个的方法,其中合成滤波器组由块变换实现,该方法包括从输入信号获得一序列子带信号组;在子带信号组序列中识别出通用子带信号,其中对于序列中的每一组有一个或多个频谱分量是非零值而多个频谱分量的值是零。在通用子带信号中识别出通用频谱分量,其值在序列的多个相邻组中为零,所述多个相邻组或者其前面或后面是具有非零值的通用频谱分量;按照比例包络比例调整对应于零频谱分量的合成频谱分量,比例包络按照人类听觉系统的时间掩蔽特征随序列中的组变化。通过在各组子带信号中用合成频谱分量代替相应的零值频谱分量来生成修改的子带信号组序列;以及通过将合成滤波器组应用于该修改的子带信号组序列来生成音频信息。10.权利要求1至9中任何一个的方法,其中合成滤波器组由块变换实现,并且该方法通过子带信号中其它频谱分量的谱平移生成合成频谱分量。11.权利要求1至10中任何一个的方法,其中比例包络按照人类听觉系统的时间掩蔽特征变化。12.一种生成输出信号的方法,其中该方法包括通过对将分析滤波器组应用于音频信息获得的信息量化来生成一组子带信号,每个子带信号包含代表音频信号频谱内容的一个或多个频谱分量;在该组子带信号中识别一个特定子带信号,其中的一个或多个频谱分量具有非零值并用具有对应于一个阈值的最小量化水平的量化器将其量化,其中的多个频谱分量的值是零;从音频信号的频谱内容中导出比例控制信息,其中比例控制信息控制合成频谱分量的比例以用于合成和代替接收机中的零频谱分量,该接收机响应于输出信号产生音频信息;以及将比例控制信息和代表该组子带信号的信息装配在一起以产生输出信号。13.权利要求12的方法,包括获得由该组子带信号代表的音频信号音调的度量;以及由音调的度量导出比例控制信息。14.权利要求12或13的方法,包括获得由该组子带信号代表的音频信号的心理声学掩蔽估计阈值;以及由该心理声学掩蔽估计阈值导出比例控制信息。15.权利要求12至14中任何一个的方法,包括获得由非零值和零值频谱分量代表的部分音频信号的频谱水平的两个度量;以及由频谱水平的这两个度量导出比例控制信息。16.一种生成音频信息的装置,其中该装置包括;解格式器,该解格式器接收输入信号并从中获得一组子带信号,每个子带信号包含代表音频信号的频谱内容的一个或多个频谱分量;与该解格式器连接的解码器,该解码器在该组子带信号中识别一个特定子带信号,其中的一个或多个频谱分量具有非零值并用具有对应于一个阈值的最小量化水平的量化器将其量化,其中的多个频谱分量的值是零,该解码器生成分别对应于该特定子波带中零值频谱分量的合成频谱分量,并按照小于或等于阈值的比例包络进行比例调整,该解码器通过在该特定子带信号中用合成频谱分量代替相应的零值频谱分量来生成一组修改的子带信号;以及与该解码器连接的合成滤波器组,响应于该修改的子带信号生成音频信息。17.权利要求16的装置,其中比例包络是均匀的。18.权利要求16或17的装置,其中合成滤波器组由在相邻频谱分量之间存在频谱泄漏的块变换实现,比例包络按照一个基本上等于块变换频谱泄漏的衰减率的比率变化。19.权利要求16至18中任何一个的装置,其中合成滤波器组由块变换实现,该解码器对该组子带信号中的一个或多个频谱分量使用频域滤波器;以及由频域滤波器的输出导出比例包络。20.权利要求19的装置,其中解码器随着频率改变频域滤波器的响应。21.权利要求16至20中任何一个的装置,其中解码器获得由该组子带信号代表的音频信号音调的度量;以及根据音调的度量适配比例包络。22.权利要求21的装置,从输入信号中获得音调的度量。23.权利要求21的装置,其中解码器由零频谱分量在该特定子带信号中的排列方式导出音调的度量。24.权利要求16至23中任何一个的装置,其中合成滤波器组由块变换实现以及解格式器从输入信号中获得一个子带信号组序列;解码器在子带信号组序列中识别出通用子带信号,其中对于序列中的每一组有一个或多个频谱分量是非零值而多个频谱分量的值是零,在通用子带信号中识别出通用频谱分量,其值在序列的多个相邻组中为零...
【专利技术属性】
技术研发人员:迈克尔M杜鲁门,格兰特A戴维森,马修C费勒斯,马克S文顿,马修A沃森,查尔斯Q鲁宾逊,
申请(专利权)人:杜比实验室特许公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。