当前位置: 首页 > 专利查询>SSI株式会社专利>正文

具有用于实时时间定标的参数的数字音频制造技术

技术编号:3059332 阅读:195 留言:0更新日期:2012-04-11 18:40
预处理音频数据以生成与时间定标相关的参数,减少了进行音频数据实时时间定标所需要的处理功率。一增大音频数据结构包括音频数据与参数。用于音频数据帧的参数可识别用于时间定标的最匹配块,或表现出可被间插以确定偏移的偏移对时间标度坐标图。实时时间定标处理方法使用参数识别出的块,而非执行搜索以找到最佳匹配块。参数亦可指出哪些帧表示静默,且可与表示非静默的帧做不同的定标处理。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及具有用于实时时间定标的参数的数字音频
技术介绍
数字音频信号的时间定标(例如时间压缩或扩展)改变已记录音频信号的播放速率而不改变音频的感知音调。因此,使用具有时间定标功率的播放系统的听者可以加速视频以加快接收信息或者减速视频以减慢接收信息,同时,此时间定标技术能够保存原始音频的音调而使信息更易聆听与了解。理想地,具有时间定标功率的播放系统应赋予听者控制播放的播放速率或者时间定标的功率,使得听者可以选择与正在播放信息的复杂程度对应的速率和听者正在致力于播放的专注程度。时间定标系统通常需要大量的处理功率,以便将预先记录的数字音频数据实时转换为时间定标的数字音频数据流。因此,诸如便携式电话等具有有限处理功率的很多系统不能对音频进行实时的时间定标,且此类系统必须仰赖一种提供具有所欲时间标度的时间定标信号的源。再者,用户对时间标度的选择需要时间定标的音频源能够准确地响应所选择的时间标度内的改变,以及在正确时间标度处提供时间定标的音频数据。名称为“播放中播放速率的实时控制”的第09/849,719号美国专利申请中描述了一种经过具有时间定标数字音频的多个信道的源提供播放速率实时控制从而使每个信道对应于不同时间标度的方法。这种方法允许所欲时间定标数据在网络上发送给一个具有低处理功率的接收器。然而,在此源处具有许多不同时间标度以及相关音频数据声道需要庞大的数据结构。具有较小数据结构但仍允许在具较低可用处理功率的系统中做实时时间定标的另外处理方法被寻找中。
技术实现思路
依据本专利技术的一个方面,一增大的数字音频数据结构提供减少对音频做时间定标的处理负荷的时间定标参数并藉此允许一低处理功率接收器/播放器在播放具有良好音质的时间定标音频时执行时间定标。一种时间定标参数指出对在时间定标处理中使用的音频段的偏移,且偏移的使用排除了对搜索提供时间定标音频的最佳音质的音频段的需要。另一种时间定标参数将例如指示哪个帧对应于静默的音频帧内容分类,且当处理不同分类的帧时,时间定标处理可以使用不同的技术或时间标度。其它型式的时间定标参数视所使用定标处理方法而定。为了生成增大的音频数据,一预处理系统使用时间定标处理生成时间定标参数。包括时间定标参数的增大音频数据结构可被记录以备后用或马上被发送给一个播放系统。此播放系统使用经过预处理时间定标参数来避免在时间定标以及播放时间定标的音频时的密集计算过程。一低功率系统因而可执行音频数据的实时时间定标且提供良好音质。因此,与音频数据比较,与一特定时间标度相关的时间定标参数需要非常少的附加存储器或者是发送频宽。因此,使用时间定标参数增大的音频数据可以存储在具有有限可用存储器的系统中并可在具有有限带宽的系统中发送。在本专利技术的一实施例中,添加的参数指出对在生成时间定标视频数据中使用的“最匹配”数据块的偏移。通常,搜索最匹配块需要在时间定标处理中消耗的大部分处理功率。因此,一个具有大于比实时时间定标正常所需处理功率为小的幅值阶的可用处理功率的系统可以接收具有参数的增大音频数据,不经搜索地识别最佳匹配块,和执行实时时间定标。在本专利技术的另一实施例中,在增大数据结构中的参数将音频数据的每个部分或帧的音频内容分类,且音频数据的非线性定标可依帧的音频内容将不同的时间定标处理或时间标度应用于不同的部分。在一具体实施例中,增大音频数据结构中的参数包括用于识别对应于静默的标记。在播放音频数据时,对应于静默的帧可被丢弃、被更有效地定标,或反之备特别处理以实现所希望的音频数据的时间定标。本专利技术的一具体实施例是包括对音频数据进行预处理以确定与该音频数据的时间定标相关的参数的处理。音频数据及参数可在诸如CD或DVD的存储介质上提供给一个播放系统,从而使该播放系统能够经过诸如电话网络、LAN或Internet的网络读出或者接收音频数据和所述参数。播放系统使用对音频数据进行时间定标时的参数生成时间定标的音频数据流。使用预处理时间定标参数的时间定标处理需要较没有时间定标参数的音频数据时间定标少的处理功率。因此,较低功率的播放系统可执行实时时间定标。通常,音频数据具有包括音频取样的输入帧以及包括对取样块偏移的参数。通常,各偏移根据输入帧识别在生成时间定标的视频数据中使用的取样块。可确定多个用于每个帧的偏移,其中,用于每个帧的偏移对应于不同的时间标度。本专利技术的另一实施例是一音频时间定标处理方法,包括接收具有指出一小块偏移与时间标度之间的关系的参数的音频数据帧、使用该参数确定在该小块上且对应于所选择时间标度的偏移以及使用由该偏移识别的块内的取样生成时间定标帧。可以为那些位于小块上且分别对应于不同时间标度的偏移预先确定参数。当用户选择的时间标度不是被提供偏移的时间标度之一时,将小块插入预设偏移间可确定对应于所选择时间标度的偏移。本专利技术的再一个实施例是一种增大的音频数据结构。增大的音频数据结构包括对应于音频不同部分的帧和一个或多个与该帧相关的参数。每个帧包括音频对应部分的取样,且参数提供简化音频数据的时间定标的信息。特别是,帧的“偏移”参数可识别用于生成时间定标数据的取样。每个音频帧可具有分别对应于不同时间标度的多个偏移,且当以和偏移相关的时间标度对帧进行时间定标时,与帧相关的每个偏移识别与帧组合的取样块。虽然,低处理功率播放器可使用前述的时间定标处理方法和增大音频数据结构来执行实时时间定标,但是,诸如服务器的一种高功率处理系统也可以使用时间定标处理和增大的音频数据结构以实时构建时间定标的数据。这样,服务器可仅提供时间定标数据给有限音频数据发送频宽的系统内的播放器。附图说明图1示出了从输入音频数据帧的时间定标输出的时间定标音频数据帧。图2示出了一种时间定标处理方法的流程图。图3示出了识别用于图2所示时间定标处理方法的最匹配块的偏移。图4示出了用于使用最匹配数据块生成时间定标数据的处理方法。图5示出了对一用于图2时间定标处理方法的缓冲器的输出及填充处理方法。图6示出了用于构建简化音频数据的实时时间定标的增大音频数据结构的处理流程。图7示出了使用偏移得到最匹配块的时间标度范例。图8示出了使用增大音频结构的时间定标处理方法流程图。图9示出了包括一非线性时间定标处理方法可移除或用其它处理方法做特别地处理的静默区间的声波波形。图10是一系统方块图,在该系统中,服务器使用增大的音频数据结构来建构将被发送给播放器的时间定标音频数据。不同图中使用相同的符号指出相似或相同的项目。具体实施例方式(实施例)依据本专利技术的一方面,一增大的音频数据结构包括数字音频数据和参数以减低对数字音频数据执行时间定标处理所需的处理功率。图1示出了被分成输入帧IF1至FIX的数字音频数据100。在一范例性实施例中,每个输入帧包括一固定数量m的音频信号取样且需要固定数量的时间T以便以正常播放速率播出。具体地说,对应于每个输入帧的时间T等于帧内的取样数除以用于播放操作的取样频率。诸如以后叙述的时间定标处理方法将数字音频数据100及输入帧IF1至IFX转换成具有输出时间定标帧OF1至OFX的时间定标数字音频数据110。每一输出帧的n个取样等于每一输入帧的m个取样除以时间标度S。因此,由于时间标度S等于2,每个输出帧OF1至OFX的取样数是各输入帧IF1至IFX取样数的一半本文档来自技高网...

【技术保护点】
一种处理方法,包括:预处理音频数据,以确定与该音频数据的时间定标相关的参数;将该音频数据与这些参数供给一装置;以及使该装置在音频数据的时间定标处理中使用这些参数生成时间定标的音频,其中,在时间定标中使用这些参数比不使 用这些参数进行音频数据的时间定标需要更少的处理功率。

【技术特征摘要】
US 2001-12-5 10/010,5141.一种处理方法,包括预处理音频数据,以确定与该音频数据的时间定标相关的参数;将该音频数据与这些参数供给一装置;以及使该装置在音频数据的时间定标处理中使用这些参数生成时间定标的音频,其中,在时间定标中使用这些参数比不使用这些参数进行音频数据的时间定标需要更少的处理功率。2.如权利请求1的处理方法,其中,该装置使用该音频数据与这些参数执行该音频数据的实时时间定标。3.如权利请求1的处理方法,其中,提供该音频数据与这些参数的步骤包括将该音频数据与这些参数记录在该装置可读取的一存储媒体上,且该装置访问该存储媒体以读取该音频数据与这些参数。4.如权利请求3的处理方法,其中,该存储媒体是一个盘。5.如权利请求1的处理方法,其中,提供该音频数据与这些参数的步骤包括经由一网络将该音频数据与这些参数发送给该装置。6.如权利请求1的处理方法,其中该音频数据包括多个输入帧;和所述参数包括与每个输入帧相关的一个或多个偏移,每个偏移识别用于相关输入帧的取样块,用于根据该相关输入帧生成时间定标数据。7.如权利请求6的处理方法,其中,所述参数包括用于每个输入帧的多个偏移,所述用于每个输入帧的多个偏移对应于不同的时间标度。8.如权利请求1的处理方法,其中,该装置执行该音频数据的预处理以确定这些参数,并存储该音频数据和这些参数,供以后在音频数据的实时时间定标期间使用。9.如权利请求1的处理方法,其中该音频数据包括多个输入帧;和一个或多个所述参数将这些输入帧的各音频内容分类。10.如权利请求9的处理方法,其中,所述参数识别哪个输入帧表示静默。11.如权利请求9的处理方法,其中,使该装置使用这些参数的步骤包括对其参数指出表示静默的输入帧的处理不同于其参数指出表示非静默的输入帧的处理。12.如权利请求1的处理方法,其中,一语音邮件系统执行该音频数据的预处理,以确定与该音频数据的时间定标相关的参数...

【专利技术属性】
技术研发人员:肯尼思HP张
申请(专利权)人:SSI株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利