根据本发明专利技术实施例用于对第一输入数据流(510-1)的第一帧(540-1)和第二输入数据流(510-2)的第二帧(540-2)进行混合的设备(500)包括:处理单元(520),适于产生输出帧(550),其中,输出帧(550)包括对输出频谱中直至输出转变频率的较低部分进行描述的输出频谱数据,其中,输出帧还包括通过输出时间/频率栅格分辨率中的能量相关值的方式,对输出频谱中在输出转变频率以上的较高部分进行描述的输出SBR数据。处理单元(520)还适于使得在频谱域中产生与第一帧、第二帧的转变频率和输出转变频率中的最小值以下的频率相对应的输出频谱数据,并在SBR域中处理与第一帧、第二帧的转变频率和输出转变频率中的最大值以上的频率相对应的输出SBR数据。
【技术实现步骤摘要】
【国外来华专利技术】
根据本专利技术的实施例涉 及用于对多个输入数据流进行混合以获得输出数据流的 设备,该设备可以用于例如包括视频会议系统和电话会议系统在内的会议系统领域。
技术介绍
在许多应用中,要以以下方式来处理多于一个音频信号根据多个音频信号, 要产生一个信号或至少减小数目的信号,这通常称为“混合”。因此,混合音频信号的 过程可以称为将多个单独音频信号捆绑为生成信号。例如在创建音乐用于致密光盘(“配 音”)时,使用这一过程。在这种情况下,典型地,将不同乐器的不同音频信号与包括 声乐表演(歌唱)的一个或多个音频信号混合为歌曲。混合处理扮演重要角色的其他应用领域是视频会议系统和电话会议系统。典型 地,这种系统能够通过采用中心服务器来对会议中的多个在空间上分散的参与者进行连 接,中心服务器对注册参与者的输入视频和音频数据进行适当混合,并将生成信号返回 发送给每个参与者。该生成信号或输出信号包括所有其他会议参与者的音频信号。在现代数字会议系统中,多个部分矛盾的目标和方面互相竞争。必须考虑重构 音频信号的质量,以及针对不同类型音频信号(例如话音信号相比于一般音频信号和音 乐信号),一些编码和解码技术的实用性和有效性。在设计和实现会议系统时还要考虑的 其他方面是可用带宽和延迟问题。例如,在对一方面质量和另一方面带宽进行平衡时,在多数情况下,折衷不可 避免。然而,可以通过实现现代编码和解码技术,如AAC-ELD技术(AAC=高级音频 编解码;ELD=增强低延迟),来实现与质量相关的改进。然而,可实现的质量可能以 更多的基本问题和方面对采用这种现代技术的系统造成负面影响。仅列出要满足的一个挑战,所有数字信号传输面临所需量化的问题,至少在原 理上,该问题在无噪声的模拟系统中的理想环境下是可避免的。由于量化过程,不可避 免地将特定量的量化噪声引入要处理的信号。为了对抗可能和可听的失真,可能尝试增 加量化级的数目,从而相应提高了量化分辨率。然而,这导致要发送更大数目的信号 值,从而导致要发送的数据量增大。换言之,通过减小由量化噪声引入的可能失真来提 高质量,在特定环境下将增大要发送的数据流,并且可能最终违反施加于传输系统上的 带宽限制。在会议系统的情况下,由于典型地要处理多于一个输入音频信号,因此对质 量、可用带宽和其他参数之间的权衡进行改进的挑战甚至更加复杂。因此,在产生由会 议系统产生的输出信号或生成信号时,必须考虑多于一个音频信号所施加的边界条件。尤其是考虑到实现具有充分低延迟的会议系统的另一挑战在不引入参与者认 为不可接受的实质延迟的情况下,实现会议参与者之间的直接通信,这种挑战进一步提 升。在会议系统的低延迟实现中,典型地在延迟源的数目方面对其进行限制,另一方面,这可能导致在通过叠加或添加相应信号可以实现音频信号混合的时域之外处理数 据的挑战。在一般音频信号的情况下,为了改进质量与比特率之间的权衡,存在大量技术,能够进一步改进这种矛盾参数(如重构信号的质量、比特率、延迟、计算复杂度和 其他参数)之间的权衡。用于改进上述权衡的一种高灵活性的工具是所谓频谱带表示工具(SBR)。SBR 模块典型地不被实现为中心编码器(如MPEG-4 AAC编码器)的一部分,而是附加的编 码器和解码器。SBR利用音频信号内较高和较低频率之间的相关性。SBR基于以下假 设信号的较高频率仅是基础振荡的整数倍,使得可以基于较低频谱来复制较高频率。 由于在较高频率的情况下,人耳的可听分辨率具有对数特性,因此,只有非常有经验的 收听者能够进一步认识到与较高频率相关的较小差异,使得大多数收听者将很可能不会 注意到SBR编码器引入的不精确性。SBR编码器对提供给MPEG-4编码器的音频信号进行预处理,并将输入信号分 离为频率范围。由所谓转变频率将较低频率范围或频带与较高频带或频率范围分开,根 据可用比特率和其他参数,可以对转变频率进行可变设置。SBR编码器利用滤波器组来 分解频率,该滤波器组典型地被实现为正交镜像滤波器组(QMF)。SBR编码器从较高频率范围的频率表示中提取能量值,该能量值随后用于基于 较低频带来重构该频率范围。因此,SBR编码器向核心编码器提供了 SBR数据或SBR参数以及滤波后的音频 信号或滤波后的音频数据,基于原始音频信号的采样频率的一半将核心编码器应用至较 低频带。这提供了对明显较少的采样值进行处理的机会,从而可以更加精确地设置各个 量化级。SBR编码器提供的附加数据,即SBR参数,将存储至MPEG-4编码器或任何 其他编码器的生成比特流中,作为辅助信息。这可以使用合适的比特复用器来实现。在解码器侧,比特解复用器首先对输入比特流进行解复用,比特解复用器分离 至少SBR数据并将其提供给SBR解码器。然而,在SBR解码器处理SBR参数之前,核 心解码器将首先解码较低频带以重构较低频带的音频信号。SBR解码器本身基于SBR能 量值(SBR)参数和较低频率范围的频谱信息,来计算音频信号的频谱的较高部分。换言 之,SBR解码器基于较低频带以及在上述比特流中传输的SBR参数,来复制音频信号的 较高频谱带。除了上述SBM模块的可能性之外,为了增强重构音频信号的整体音频感 知,SBR还提供了对附加噪声源以及各个正弦波进行编码的可能性。因此,SBR表现为一种非常灵活的工具,用于改进质量和比特率之间的权衡, 这也使得SBR成为会议系统领域中应用的值得注意的候选。然而,由于复杂度和大量可 能性和选择,目前仅通过将相应音频信号完全解码为时域信号以在时域中执行实际混合 过程,然后将混合信号重新编码为SBR编码信号,从而在时域中对SBR编码的音频信号 进行混合。除了由于将信号编码至时域而引入的附加延迟之外,对编码的音频信号的频 谱信息的重构也可能需要较高计算复杂度,例如在便携式或其他能效或计算复杂度效率 较高的应用的情况下,这可能缺乏吸引力。
技术实现思路
因此,本专利技术的目的是降低对SBR编码的音频信号进行混合时涉及的计算复杂度。这一目的是通过根据权利要求1或3的设备、根据权利要求15的方法或根据权 利要求16的程序来实现的。根据本专利技术的实施例基于可以通过以下操作来降低计算复杂度的发现针对通 过在频谱域中混合频谱信息而引入的转变频率的最小值以下的频率、针对SBR域中最大 转变频率以上的频率、以及针对该最小值与该最大值之间的区域中的频率,通过估计至 少一个SBR值并基于至少所估计的SBR值来产生对应的SBR值,或基于相应SBR数据 来估计频谱值或频谱信息,并且基于所估计的频谱值或频谱信息来产生频谱信息的频谱 值,来执行混合。换言之,根据本专利技术的实施例基于以下发现针对最大转变频率以上的频率, 可以在SBR域中执行混合;而针对转变频率的最小值以下的频率,可以通过直接处理对 应频谱值,在频谱域中执行混合。此外,根据本专利技术的实施例的设备可以针对该最大值 和该最小值之间的频率,通过根据对应SBR值估计频谱值或通过根据频谱值来估计SBR 值以在SBR域或频谱域中,基于所估计的值来执行实际混合,从而在SBR域或频谱域中 执行混合。在该上下文中,应注意,输出转变频率可以是输入数据流的转变频率中的任 一个或者其他值。因此,减少了设备要执行的步骤数目,从而降低了相关计算复杂度,因为基本文档来自技高网...
【技术保护点】
一种对第一输入数据流(510-1)的第一帧(540-1)和第二输入数据流(510-2)的第二帧(540-2)进行混合以获得输出数据流(530)的输出帧(550)的设备(500),其中,第一帧(540-1)包括对第一转变频率(570)以下的第一音频信号的第一频谱的较低部分(580)进行描述的第一频谱数据和对第一转变频率(570)以上的第一频谱的较高部分(590)进行描述的第一频谱带重复SBR数据,其中,第二帧(540-2)包括对第二转变频率(570)以下的第二音频信号的第二频谱的较低部分(580)进行描述的第二频谱数据和对第二转变频率(570)以上的第二频谱的较高部分(590)进行描述的第二SBR数据,其中,第一和第二SBR数据通过时间/频率栅格分辨率中的能量相关值描述了第一和第二频谱的相应较高部分(590),其中,第一转变频率(570)与第二转变频率(570)不同, 所述设备(500)包括: 处理单元(520),适于产生输出帧(550),输出帧(550)包括对输出转变频率(570)以下的输出频谱的较低部分(580)进行描述的输出频谱数据,输出帧(550)还包括通过输出时间/频率栅格分辨率中的能量相关值对输出转变频率(570)以上的输出频谱的(590)进行描述的输出SBR数据, 其中,处理单元(520)在频谱域中基于第一和第二频谱数据来产生与第一转变频率(570)、第二转变频率(570)和输出转变频率(570)中的最小值以下的频率相对应的输出频谱数据; 其中,处理单元(520)还在SBR域中基于第一和第二SBR数据来处理与第一转变频率(570)、第二转变频率(570)和输出转变频率(570)中的最大值以上的频率相对应的输出SBR数据;以及 其中,处理单元(520)还针对所述最小值和所述最大值之间的频率区域,根据第一和第二频谱数据中的至少一个来估计至少一个SBR值,并至少基于所估计的SBR值来产生输出SBR数据的相应SBR值。...
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:马库斯施内尔,曼弗雷德卢茨基,马库斯马特拉斯,
申请(专利权)人:弗劳恩霍夫应用研究促进协会,
类型:发明
国别省市:DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。