使附加数据和基本数据同步的装置和方法制造方法及图纸

技术编号:3689279 阅读:146 留言:0更新日期:2012-04-11 18:40
为了向如传统立体声数据的基本数据添加如多通道扩充数据的附加数据,提供(10)与测试数据的测试时刻相关联的测试数据的测试指纹。测试数据等同于附加数据或基本数据,或以参数形式取决于附加数据或基本数据。使用测试指纹,确定(11)基于参考数据中的参考时刻的参考时刻信息,参考数据是传统的立体声数据。最后,处理(12)附加数据或基本数据,即,使用参考时刻信息和测试时刻信息来进行处理,以获得处理数据,通过该处理数据,可执行数据信息的同步再现(13)。因此,获得了鲁棒且灵活的同步,尤其是利用附加数据在事后扩充基本数据。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及多媒体数据处理,具体地,涉及将附加音频信息时间同步地附加到音频基本数据上。
技术介绍
当前发展的技术或者将来将发展的技术能够越来越有效地存储音频信号或视频信号,还通过扩充(extention),例如通过采样多通道技术,增强了视听愉悦感。这种扩充可以按照新文件格式编成文件,并与音频基本数据一起可供用户使用,其中音频基本数据是例如单声道或立体声音频信号。例如,该扩充数据可以是附加的多通道信息。这意味着,音频基本数据和扩充数据都包含在公共数据流或文件内。然而,同时还需要关注的是,感兴趣的在于已经处理了音频信号的立体声版本的用户仅获得了扩充,即多通道音调,然后将其添加到已有音频信号或相应的文件中。具体地,这种变化具有多种优点。不必一定要传输用户已有的数据。尤其是在服务供应商根据经由网络传输的数据量来对其服务进行收费的场景中,用户可经由网络接收尽可能少的数据,来实现显著的成本节省。例如,用户拥有立体声CD,因此具有特定音乐片段的左和右通道。利用多通道技术,例如5.1技术,用户现在也许不仅希望在新的环绕系统中播放其立体声CD,而且希望具有其立体声CD的5通道版本,并播放该版本。在这种情况下,仅向已经具有左和右通道的用户传输左环绕通道、右环绕通道和中央通道就足够了。在对所传输的数据量进行收费的上述场景中,如果仅发送3个通道而不是5个通道,用户就节省了40%的数据量。此外,由于用户不再需要为已有的音频基本数据付费,所以扩充数据的附加购买可能对于用户在经济上更具吸引力。因此,已经出售了立体声CD的唱片公司可以比音乐片段的整个5通道版本更低的价格来提供“环绕”扩充,作为针对其顾客的附加服务。然而,使用已有数据的附加数据也引起了多种其它应用的关注。具体地,在可缩放音频/视频数据中,附加数据可存在于更高的缩放层。在现有技术已知的可缩放概念中,例如,存在基本缩放层,包括音频片段的例如多达8kHz的一定带宽的音频信号。利用这些数据可完全实现能够再现最大带宽为8kHz的播放装置。例如,播放装置可以是并不特别具有宽带扬声器的播放器。同样地,该信号可以是向下带限(band-limited downward)的,而且播放器也不能够再现例如低于500Hz的音调。紧邻更高的缩放层可以是在向下方向上丢失的带宽和/或在向上方向上丢失的带宽,例如从20Hz-500Hz的带宽和从8kHz-16kHz的带宽。该第一缩放层则必须与带宽在500Hz和8kHz之间的原始音频信号组合,以便获得宽带音频信号,然后由宽带再现装置再现该宽带音频信号。这种缩放层变化也可优选地由提供商提供,由于用户先前已经购买了“窄带”音频信号,所以第一缩放层对于用户而言比宽带音频信号花费更少。其它的扩充数据包括视频数据,其中,基本层给视频序列提供了特定的分辨率,而紧邻的缩放层单独或者在与原始视频数据结合时提供了本身已经具有更高分辨率的音频数据,导致具有更高分辨率的视频序列。这种场景出现在用户仅拥有具有较低分辨率的视频再现装置、之后又获得了具有更高分辨率的视频再现装置并希望通过新装置以更高分辨率来观看“旧”视频的情况下。其它扩充数据还包括所谓SBR(光谱带复制)数据。在已知的SBR技术中,由于较低的输出数据可用,编码器仅产生带限信号,该带限信号仅扩展到例如4或6kHz的最大截止频率。不再将丢失的高频带数据编码为音频采样或音频值,而将其编码为参数数据。在SBR技术中,频谱包络上的是参数数据信息。SBR解码器然后将频谱值从可用的波段复制到更高的波段,从而建立更高波段的精细频谱结构,而粗略频谱结构(即频谱包络)由参数附加数据确定。根据实施方式,用户因此可基于所传输的SBR参数或者由于仅包括高波段的时间音频采样,将其已有带限的编码或未编码的音频数据补充为宽带音频信号。在至少具有如左、右和中央的三个再现通道的多通道音频再现技术中,逐渐开始采用参数技术,该技术也公知为首字母缩写的BCC技术。在BCC技术中,原理上,使用参数附加数据,将一个或两个基带通道用于产生任意数目的再现通道,例如环绕再现技术中的5个通道。这里,参数数据是通道间电平差值(ICLD)、通道间时间差值或通道间相干(ICC)信息。该参数数据应用于所传输的立体声基本通道,通过两个基本通道的多种加权/组合,以产生再现通道。此外,在这种场景中,已经拥有音乐片段的两个立体声通道的用户也许希望“另外购买”参数数据,这当然需要非常低的数据率。但是,在这种情况下,接收机必须具有BCC解码器,以能够处理参数数据。然而,可选地,服务提供商可基于这种参数数据,从参数数据和两个立体声基本通道的(理想)版本中产生左环绕、右环绕和中央这3个通道,并以“已解码”的方式将它们发送到接收机,即作为音频数据,而不是参数数据。使用参数数据的类似多通道编码技术已知为“强度立体声编码(intensity stereo coding)”的首字母缩写。将时间连续的扩充数据时间同步地添加到时间连续的音频基本数据,导致为了成功应用而必须解决的一系列实际问题,例如其中时间连续的扩充数据是从参数数据中产生的。对于所有的扩充数据,应该确保扩充数据精确地与大量多种音频基本数据中的针对此而设计、产生或计算该扩充数据的对应物相配。具体地,由于基本数据不具有可识别或甚至与唯一对应物相关联的唯一标记,这非常难。作为示例,应该将音乐段X的多通道附加数据Dx添加到该音乐段X上而不是另一音乐段Y或同一音乐段X的所谓二次混合“XR”上。关于这一点,要指出,在流行的摇滚音乐中,总是有多个音乐版本,这些版本可以是CD的长版本、独唱的短版本、现场版本或所谓重新发行或重新混合的版本。但是在古典音乐中,对于同一个片段,仅存在由多个乐队记录片段而产生的多次演奏。因此,无须说,乐队X的古典乐段的记录的多通道附加数据当然与乐队Y的同一古典乐段的记录不匹配。另一问题在于,必须以精确的时间连续方式来提供音频基本数据以匹配扩充数据,反之亦然。如果不是这样,在多数情况下,扩充数据则对于用户无用。如果音乐段的多通道附加信息具有与立体声基本数据的最小偏移,则在声印象中,出现清晰可听见的伪象,用户因此仅具有音乐段的错误的多通道版本,在极限情况下该版本无用。音频基本数据也可以截短形式存在。例如,如果假设服务提供商要提供已有立体声信号的多通道扩充,即要产生多通道附加数据,则他们访问音乐段的多通道版本。想要多通道附加信息的服务用户还拥有一种音乐段版本,即立体声版本。如果终端用户在创建或处理中,例如在读取CD时,故意或无心地删除了音频数据的开始或结尾部分,则服务提供商的多通道版本和终端用户的立体声版本不再覆盖相同的音频范围。在添加多通道附加数据时,只要发生这些情况,就必须考虑这些情况。如果音频基本数据在时间上拉伸或缩短了,即如果快进或慢进地记录/播放音频基本数据,则这还也会在附加中产生问题。这里,必须确定正确的缩短/拉伸因子,然后以类似方式用于扩充数据。如果终端用户已经从收音机中记录了其立体声版本,例如,该版本可以是3%快进或慢进地播放的版本。因此,终端用户现在拥有音乐段的拉伸/更长或缩短/更短版本,这对于多通道附加数据也是相应的。此外,如果音频基本数据在特定范围内不再以原始形式存在,而已通过传输(例如通过音本文档来自技高网...

【技术保护点】
一种用于使附加数据和基本数据同步的设备,附加数据和基本数据定义了时程并包括可一起再现的数据信息,所述设备包括:提供装置(10),用于提供与测试数据的测试时刻有关的测试数据的测试指纹,测试数据是附加数据或基本数据,或者测试数据取决于附 加数据或基本数据;确定装置(11),用于使用测试指纹来确定取决于参考数据中的参考时刻的参考时刻信息(tx,SS),参考数据是测试时刻指纹不来源于其中的数据;以及处理装置(12),用于使用参考时刻信息和取决于测试时刻的测试时刻 信息(t↓[0])来处理附加数据或基本数据以便获得处理数据,其中,形成所述处理装置(12),以便处理附加数据或基本数据,以便能够基于处理数据来执行数据信息的同步再现。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:于尔根赫勒奥立弗赫尔穆特安德列亚斯赫尔蒂斯特凡盖尔斯贝格
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:DE[德国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利