像言语的信号和不像言语的信号的多模式编码制造技术

技术编号:5046042 阅读:237 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及可包括像言语的信号分量和不像言语的信号分量两者的音频信号的编码。它描述码激励线性预测(CELP)音频编码和解码方法,采用:通过LPC参数控制的LPC综合滤波器;各自具有码矢量的多个码本;提供较适合于不像言语的信号的激励的至少一个码本以及提供较适合于像言语的信号的激励的至少一个码本;以及多个增益因子,每一个增益因子与码本关联。所述编码方法和装置通过将所述音频信号和从码本激励得到的所述音频信号的重构之间的差异的量度最小化来从码本选择码矢量和/或关联的增益因子。所述解码方法和装置从LPC参数、码矢量和增益因子生成重构的输出信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于编码与解码音频信号(特别是可以同时包括像言语的信号分量 和不像言语的信号分量两者以及/或者在时间上顺序地包括像言语的信号分量和不像言 语的信号分量两者的音频信号)的方法与装置。能够响应于像言语的信号内容和不像言语 的信号内容的变化改变它们的编码特征和解码特征的音频编码器和解码器在本领域经常 被称作“多模式” “编解码器(codec)”(其中“编解码器”可以是编码器和解码器)。本发 明也涉及用于实现这样的编码与解码音频信号的方法的存储介质上的计算机程序。
技术实现思路
在本文档中,“像言语的信号(speech-like signal) ”通篇都指下面这样的信号, 所述信号包含a)单个、强的周期分量(“浊音的”像言语的信号)、b)没有周期性的随机噪 声(“清音的”像言语的信号)、或者c)这些信号类型之间的过渡(transition)。像言语 的信号的例子包括单个谈话者的言语和某种单个的乐器产生的音乐;以及,“不像言语的信 号(non-speech-like signal) ”指不具有像言语的信号的特征的信号。不像言语的信号的 例子包括来自个乐器的音乐信号和来自不同音高(Pitch)的(人)谈话者的混合的言语。根据本专利技术的第一个方面,用于码激励线性预测(code excited linear prediction, CELP)音频编码的方法采用通过LPC参数控制的LPC综合滤波器;多个码 本,每一个码本具有码矢量(codevector);提供较适合于像言语的信号而较不适合于不像 言语的信号的激励的至少一个码本、以及提供较适合于不像言语的信号而较不适合于像言 语的信号的激励的至少一个其他的码本;以及多个增益因子,每一个增益因子与码本关联。 该方法包含对音频信号应用线性预测编码(LPC)分析以生成LPC参数;通过将音频信号 和从码本激励得到的音频信号的重构(reconstruction)之间的差异的量度(measure)最 小化来从至少两个码本选择码矢量和/或关联的增益因子,所述码本包括提供较适合于不 像言语的信号的激励的码本和提供较适合于像言语的信号的激励的码本;以及产生可由 CELP音频解码器用于重构音频信号的输出、包括LPC参数的输出、码矢量和增益因子。所述 最小化可按闭环方式将音频信号的重构和音频信号之间的差异最小化。差异的量度可以是 感知力口权的量度(perceptually-weighted measure)。根据一种变化,可以不通过线性预测编码综合滤波器对信号或者从码本(所述码 本的激励输出较适合于不像言语的信号而较不适合于像言语的信号)得到的信号进行滤 波。提供较适合于像言语的信号而较不适合于不像言语的信号的激励输出的所述至 少一个码本可以包括生成像噪声的激励的码本和生成周期性激励的码本,以及,提供较适 合于不像言语的信号而较不适合于像言语的信号的激励输出的所述至少一个其他的码本 可包括生成对仿真(emulating)感知音频编码器有用的正弦曲线激励的码本。该方法可进一步包含对音频信号应用长期预测(LTP)分析以生成LTP参数,其中 生成周期性激励的码本是通过LTP参数控制的、接收至少周期性激励和像噪声的激励的时 间延迟的组合作为信号输入的适应性码本,并且其中输出进一步包括LTP参数。适应性码本可选择性地或者接收周期性激励、像噪声的激励和正弦曲线激励的时 间延迟的组合作为信号输入,或者仅接收周期性激励和像噪声的激励的时间延迟的组合作 为信号输入,并且输出可进一步包括关于该适应性码本是否在激励的组合中接收正弦曲线 激励的信息。该方法可进一步包含将音频信号分类成多个音频类别中的一个;响应于该分 类,选择操作模式;以及,以开环方式排它地(exclusively)选择一个或多个码本来贡献 (contribute)激励输出。该方法可进一步包含确定对操作模式的选择的置信度水平(confidence level),其中存在至少两个置信度水平,所述至少两个置信度水平包括高置信度水平,并且 仅当置信度水平为高时才以开环方式排它地选择一个或多个码本来贡献激励输出。根据本专利技术的另一个方面,用于码激励线性预测(CELP)音频编码的方法采用通 过LPC参数控制的LPC综合滤波器;多个码本,每一个码本具有码矢量;提供较适合于像 言语的信号而较不适合于不像言语的信号的激励的至少一个码本、和提供较适合于不像言 语的信号而较不适合于像言语的信号的激励的至少一个其他的码本;以及多个增益因子, 每一个增益因子与码本关联。该方法包含将音频信号分离成像言语的信号分量和不像 言语的信号分量;将线性预测编码(LPC)分析应用于音频信号的像言语的信号分量以生 成LPC参数;通过改变与提供较适合于像言语的信号而较不适合于不像言语的信号的激励 输出的所述码本或每一个码本关联的码矢量选择和/或增益因子、改变与提供较适合于不 像言语的信号而较不适合于像言语的信号的激励输出的所述码本或每一个码本关联的码 矢量选择和/或增益因子,将LPC综合滤波器输出和音频信号的像言语的信号分量之间的 差异最小化;以及,提供可由CELP音频解码器用于再生成(!^produce)音频信号的近似 (approximation)的输出(所述输出包括与每一个码本关联的码矢量选择和/或增益)以 及LPC参数。该分离可将音频信号分离成像言语的信号分量和不像言语的信号分量。根据作为替代方案的两个变化,该分离可以从音频信号分离像言语的信号分量, 并且通过从音频信号减去像言语的信号分量的重构来得到不像言语的信号分量的近似;或 者,该分离可以从音频信号分离不像言语的信号分量,并且通过从音频信号减去不像言语 的信号分量的重构来得到像言语的信号分量的近似。可以提供第二线性预测编码(LPC)综合滤波器,并且可以通过这样的第二线性预 测编码综合滤波器对不像言语的信号分量的重构进行滤波。提供较适合于像言语的信号而较不适合于不像言语的信号的激励输出的所述至 少一个码本可以包括生成像噪声的激励的码本和生成周期性激励的码本,并且提供较适合 于不像言语的信号而较不适合于像言语的信号的激励输出的所述至少一个其他的码本可以包括生成对于仿真感知音频编码器有用的正弦曲线激励的码本。该方法可进一步包含对音频信号的像言语的信号分量应用长期预测(LTP)分析 以生成LTP参数,在这种情况下,生成周期性激励的码本可以是通过LTP参数控制的适应性 码本,并且它可以接收周期性激励和像噪声的激励的时间延迟的组合作为信号输入。可以响应于像言语的信号,改变与提供较适合于不像言语的信号而较不适合于像 言语的信号的激励输出的所述码本或每一个码本关联的码本矢量选择和/或增益因子。可改变与提供较适合于不像言语的信号而较不适合于像言语的信号的激励输出 的所述码本或每一个码本关联的码本矢量选择和/或增益因子,以减少不像言语的信号与 从所述这样的码本或每一个这样的码本重构的信号之间的差异。根据本专利技术的第三个方面,用于码激励线性预测(CELP)音频解码的方法采用通 过LPC参数控制的LPC综合滤波器;多个码本,每一个码本具有码矢量;提供较适合于不像 言语的信号而较不适合于像言语的信号的激励的至少一个码本、以及提供较适合本文档来自技高网...

【技术保护点】
一种码激励线性预测CELP音频编码的方法,采用:通过LPC参数控制的LPC综合滤波器;各自具有码矢量的多个码本;提供较适合于像言语的信号而较不适合于不像言语的信号的激励的至少一个码本与提供较适合于不像言语的信号而较不适合于像言语的信号的激励的至少一个其他的码本;以及多个增益因子,每一个增益因子与码本关联,所述方法包含:对音频信号应用线性预测编码LPC分析以生成LPC参数;通过将所述音频信号和从码本激励得到的所述音频信号的重构之间的差异的量度最小化来从至少两个码本选择码矢量和/或关联的增益因子,所述码本包括提供较适合于不像言语的信号的激励的码本和提供较适合于像言语的信号的激励的码本;以及产生可由CELP音频解码器用于重构音频信号的输出,所述输出包括LPC参数、码矢量和增益因子。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:俞容山R拉达克里希南罗伯特L安德森格兰特A戴维森
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1