用于在带宽扩展系统中估计高频带能量的方法和设备技术方案

技术编号:4903801 阅读:183 留言:0更新日期:2012-04-11 18:40
一种方法(100),包括:接收(101)包括窄带信号的输入数字音频信号。对输入数字音频信号进行处理(102)以生成处理的数字音频信号。基于窄带带宽的预定上限频率范围内的处理的数字音频信号的过渡带的估计能量来估计(103)与输入数字音频信号相对应的高频带能量水平。基于高频带能量水平以及与高频带能量水平相对应的估计的高频带频谱来生成(104)高频带数字音频信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术一般地涉及呈现可听内容,并且尤其涉及带宽扩展技术。
技术介绍
从数字表示可听地呈现音频内容包括公知范围的努力。在一些应用设置中,数字 表示包括与原始音频采样相关的完整的对应带宽。在这样的情况下,可听呈现可以包括高 度准确和自然的发声输出。然而,这样的方式要求相当大的开销资源来提供对应的数据量。 在诸如无线通信设置的许多应用设置中,不能总是充分支持这样的信息量。为了适应这样的局限,所谓的窄带语音技术可以用于通过进一步将表示限制为 小于与原始音频采样相关的完整的对应带宽来限制信息量。仅作为关于这一点的示例, 虽然自然语音包括高达8kHz (或更高)的有效分量,但是窄带表示可以仅提供关于例如 300-3400HZ范围的信息。当得到的内容被呈现得可听时,得到的内容通常清晰得足以支持 基于语音的通信的功能需要。然而,遗憾的是,窄带语音处理也往往得到听起来压抑的语 音,并且与全频带语音相比甚至可能已经降低了清晰度。为了满足该需要,有时候采用带宽扩展技术。基于可用的窄带信息以及其他信息 人工生成较高和/或较低的频带中的丢失的信息来选择能够被添加到窄带内容中的信息, 从而合成伪宽带(或全带)信号。使用这样的技术,例如,能够将在300-3400HZ范围中的窄带语音转换为例如 100-8000HZ范围中的宽带语音。为此,所需要的一条关键信息是在高频带(3400-8000HZ) 中的频谱包络。如果估计了宽带频谱包络,那么通常可以容易地从宽带频谱包络中提取高 频带频谱包络。可以考虑由形状和增益(或者等同地,能量)构成的高频带频谱包络。例如,通过一种方式,借助于通过码书映射从窄带频谱包络估计宽带频谱包络来 估计高频带频谱包络形状。然后,通过调整在宽带频谱包络的窄带部分内的能量以匹配窄 带频谱包络的能量来估计高频带能量。在该方式中,高频带频谱包络形状确定高频带能量, 并且在估计形状中的任何错误也将相应地影响高频带能量的估计。在另一种方式中,分别估计高频带频谱包络形状和高频带能量,并且调整最后使 用的高频带频谱包络,以匹配估计的高频带能量。通过一种相关的方式,使用除了其他参数 之外的估计的高频带能量来确定高频带频谱包络形状。然而,未必保证得到的高频带频谱 包络具有适当的高频带能量。因此,需要附加的步骤来将高频带频谱包络的能量调整到估 计值。除非特别注意,该方式将在窄带和高频带之间的边界处产生在宽带频谱包络中的不 连续。虽然对于带宽扩展,并且特别是对于高频带包络估计的现有方式相当成功,但是在至 少一些应用设置中,这些方式未必产生适当质量的得到的语音。为了生成可接受质量的带宽扩展的语音,应当最小化在这样的语音中的人工信号 (artifact)的数目。已知高频带能量的过度估计导致麻烦的人工信号。高频带频谱包络形 状的不正确的估计也可能引起人工信号,但是这些人工信号通常不太严重,并且容易被窄 带语音所掩盖。附图说明通过提供下面详细说明中所述的在带宽扩展系统中用于估计高频带能量的方法 和设备来至少部分地满足上述需要。附图中相同的附图标记在各个视图中表示相同或功能 上类似的元素,并且附图与下面的详细说明一起并入本说明书中并且形成本说明书的一部 分,用于进一步图示各种实施例并且用于说明所有根据本专利技术的各种原理和优点。图1包括根据本专利技术的各种实施例配置的流程图;图2包括根据本专利技术的各种实施例配置的曲线图;图3包括根据本专利技术的各种实施例配置的框图;图4包括根据本专利技术的各种实施例配置的框图;图5包括根据本专利技术的各种实施例配置的框图;以及图6包括根据本专利技术的各种实施例配置的曲线图。本领域技术人员将认识到,在附图中的元素为了简单和清楚的目的而进行图示, 并且不必按照比例绘制。例如,在附图中的一些元素的尺寸和/或相对定位可以相对于其 他元素被夸大,以有助于促进对本专利技术的各种实施例的理解。而且,为了促进对于本专利技术的 这些各种实施例的不太混乱的查看,常常不描绘在商业上可行的实施例中实用或必要的常 见而公知的元素。应当进一步认识到,可以以特定的发生顺序来描述或描绘特定的动作和 /或步骤,而在本领域中的技术人员将理解,实际上不需要这样的关于顺序的指定。还应当 理解,这里所使用的术语和表达具有由如以上阐述的本领域的技术人员给予这样的术语和 表达的典型的技术含义,除非这里另外阐述了不同的特定的含义。具体实施例方式这里讨论的教导针对一种用于人工带宽扩展的有成本效益的方法和系统。根据这 样的教导,接收窄带数字音频信号。例如,窄带数字音频信号可以是在蜂窝网络中经由移动 站接收到的信号,并且窄带数字音频信号可以包括300-3400HZ的频率范围中的语音。人工 带宽扩展技术被实现为将数字音频信号的频谱扩展为包括诸如100-300HZ的低频带频率 以及诸如3400-8000HZ的高频带频率。通过利用人工带宽扩展来将频谱扩展为包括低频带 频率和高频带频率,产生更自然发音的数字音频信号,该信号对实现该技术的移动站的用 户而言更令人愉快。在人工带宽扩展技术中,基于从语音数据库得到并存储的先验信息以及可用的窄 带信息,人工地生成较高频带(3400-8000HZ)和较低频带(100-300Hz)中的丢失的信息,并 将其添加到窄带信号,以合成伪宽带信号。因为要求对现有传输系统的最小的改变,所以这 样的解决方案很吸引人。例如,不需要额外的比特率。人工带宽扩展可以被并入在接收端 处的后处理元件中,并且因此独立于通信系统中使用的语音编码技术或者通信系统本身的 性质,例如模拟、数字、地上线或蜂窝。例如,可以通过接收窄带数字音频信号的移动站来实现人工带宽扩展技术,并且利用得到的宽带信号来生成向移动站的用户播放的音频。在确定高频带信息时,首先估计高频带中的能量。利用窄带信号的子集来估计高 频带能量。最接近高频带频率的窄带信号的子集通常具有与高频带信号最高的相关性。因 此,仅利用窄带的子集而不是整个窄带来估计高频带能量。所使用的子集称为“过渡带”,并 且可以包括诸如2500-3400HZ的频率。更特定地,这里将过渡带定义为包含在窄带中并且 接近高频带的频带,即,它用作到高频带的过渡。该方式与现有技术的带宽扩展系统不同, 现有技术的带宽扩展系统根据整个窄带中的能量来估计高频带能量,通常为比率。为了估计高频带能量,首先经由下面关于图4和图5讨论的技术来估计过渡带能 量。例如,可以首先通过对输入窄带信号进行上采样、计算上采样的窄带信号的频谱并且然 后将过渡带内的频谱分量的能量相加来计算出过渡带的过渡带能量。随后,将估计的过渡 带能量作为独立变量插入多项式等式中来估计高频带能量。选择多项式等式中的独立变量 的不同幂的系数或权重(包括零幂,即,常数项,的系数或权重)来在来自训练语音数据库 的大量帧上最小化高频带能量的实际值与估计值之间的均方差。如下面更详细讨论的,通 过调节对从窄带信号得到的参数以及从过渡带信号得到的参数的估计,可以进一步提高估 计准确度。在已经估计了高频带能量之后,基于高频带能量估计来估计高频带频谱。通过以该方式来利用过渡带,提供了一种坚固的带宽扩展技术,与在使用整个窄 带中的能量来估计高频带能量时可能的音频信号相比,该技术产生更高质量的相应的音频 信号。此外,因为带宽本文档来自技高网...

【技术保护点】
一种方法,包括:接收包括窄带信号的输入数字音频信号;对所述输入数字音频信号进行处理以生成处理的数字音频信号;以及基于窄带带宽的预定上限频率范围内的所述处理的数字音频信号的过渡带,来估计与所述输入数字音频信号相对应的高频带能量水平。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:滕卡斯V拉玛巴德兰马克A加休科
申请(专利权)人:摩托罗拉公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1