数据处理器及用户控制数据至音频解码器和渲染器的传输制造技术

技术编号:21975005 阅读:24 留言:0更新日期:2019-08-28 02:14
一种音频数据处理器,包括:接收器接口,用于接收编码的音频数据以及与编码的音频数据相关的元数据;元数据解析器,用于解析元数据以确定音频数据操作可能性;交互接口,用于接收交互输入并用于从交互输入生成与音频数据操作可能性相关的交互控制数据;以及数据流生成器,用于获取交互控制数据、编码的音频数据以及元数据,并用于生成输出数据流,输出数据流包括编码的音频数据、元数据的至少部分,以及交互控制数据。

Data Processor and User Control Data Transfer to Audio Decoder and Render

【技术实现步骤摘要】
数据处理器及用户控制数据至音频解码器和渲染器的传输本申请是申请人为弗劳恩霍夫应用研究促进协会、申请日为2015年3月27日、申请号为201580028647.8、专利技术名称为“数据处理器及用户控制数据至音频解码器和渲染器的传输”的分案申请。
本专利技术涉及音频数据处理器,用于处理音频数据的方法以及用于执行处理音频数据的方法的计算机程序。
技术介绍
在家用消费性电子产品(CE)设施中,功能遍布于通过标准化接口连接的多个装置之上。另外,(高品质)设备常常不止构建为单个装置,而且可获得复杂的单个装置(考虑机顶盒、电视机、AVR接收器)。这些装置通过标准化接口(诸如HDMI)通信。在第一装置提取期望流并向用户提供所有接口时,第二装置常常在没有任何接口给用户的情况下以“从属模式”执行解码。就用户交互及解码器的控制而论,在此情形下,有必要将此用户信息从装置#1传输至装置#2。例如,如图9中所示,电视节目常常通过诸如机顶盒的第一装置接收,该第一装置选择适合的传输信道并提取包括期望编码要素的相关基本流。这些提取的流可被馈送至诸如音频-视频-接收器的第二装置用于再现。可通过传输解码的/解压缩的表示(PCM音频)或以编码的表示(尤其是在对所使用的互连线应用带宽限制的情况下)实现这两个装置之间的传输。另外,由于选择期望流和/或可选地用户交互在装置#1(例如,机顶盒)中实现,在大多数情况下,仅此装置向用户提供控制接口。第二装置(例如,A/V接收器)仅提供配置接口并在正常操作时间以“从属模式”起作用,该配置接口通常仅可被用户在设定系统时访问一次。现代音频编解码器方案不仅支持音频信号的编码,并且提供用于用户交互以使得音频播出及渲染适于听者喜好的方法。音频数据流由大量编码的音频信号(例如,信道信号或音频对象)和伴随元数据信息组成,该伴随元数据信息描述这些音频信号如何形成被渲染至扬声器的音频场景。用于音频对象的示例为:·以不同语言进行的对话,·额外对话如音频描述,或·音乐及音效背景。用于元数据信息的示例为:·每个对象信号的默认音量等级(即,其混合成混合信号以用于扬声器呈现所需的响度),·默认空间位置(即,其必须被渲染的位置),·信息,针对特定对象是否允许用户交互,或·允许用户如何交互的信息,例如,最小/最大音量等级或对用户可将对象重新平移到的位置的限制。·音频对象的分类和/或描述。为了实现用户交互,音频解码器/渲染器(例如装置#2)需要提供用于控制信息的额外(输入或交互)接口以用于期望的用户交互。可选地,当在装置#2而不是在装置#1中实施解码和渲染时,在装置#1中实施用于音频对象选择和操作的用户控制并将此数据馈送至装置#2也是可取的。然而,由于现有的标准化连接不支持用户控制数据和/或渲染器信息的传输的事实,此类数据的传输受到限制。可选地,如以上针对装置#1所述的流选择和用户交互以及如以上针对装置#2所述的解码可由包含在相同装置中的两个单独的功能部件在对两个部件之间的数据传输具有相同限制的情况下处理,该限制即:仅用于编码的数据及用户交互数据的一个接口是可用的,优选地为装置#1的交互接口,而可以省略用于用户交互数据的第二接口(即通常由装置#2提供的接口)。即使装置#1和装置#2包含或实施于相同(硬件)装置内,此导致如针对单独的装置#1和装置#2的情况所描述的相同情形。为了实现所述用例并克服以上所述的限制,提出将用户控制信息数据或(通常的)交互数据嵌入至编码的音频数据流中。
技术实现思路
因此,本专利技术的目标在于改进现有的音频数据处理器。一般地,第一装置可被配置为如下定义的音频数据处理器,包括:接收器接口,用于接收编码的音频数据以及与编码的音频数据相关的元数据;元数据解析器,用于解析元数据以确定音频数据操作可能性;交互接口,用于接收交互输入并用于从交互输入生成与音频数据操作可能性相关的交互控制数据;以及数据流生成器,用于获取交互控制数据、编码的音频数据以及元数据,并用于生成输出数据流,输出数据流包括编码的音频数据、元数据的至少部分以及交互控制数据。编码的音频数据可包括单独的编码的音频对象,其中元数据的至少部分与对应音频对象相关,其中元数据解析器用于解析用于编码的音频对象的对应部分以至少针对音频对象确定对象操作可能性,其中交互接口用于针对至少一个编码的音频对象从与至少一个编码的音频对象相关的交互输入生成交互控制数据。因此,通过使用各自的交互控制数据,可在存储于元数据内的它们的对应对象操作可能性内简单并直接地操作音频对象。交互接口可用于向用户呈现由元数据解析器从元数据得出的音频数据操作可能性,并用于从用户接收关于数据操作可能性的特定数据操作的用户输入。此可实现切实可行的方法,以向用户提供用户接口用于与所专利技术的装置进行交互(例如,用于操作音频对象,优选地在外部从解码器)。数据流生成器可用于处理包括通过接收器接口接收的编码的音频数据和元数据的数据流而不对编码的音频数据进行解码,或用于复制编码的音频数据和元数据的至少部分而不改变输出数据流,其中数据流生成器用于将包含交互控制数据的额外数据部分添加至输出数据流中的编码的音频数据和/或元数据。此提供较小复杂性的优势,因为音频数据处理器不需要解码音频信号。它仅需要解析元数据并将其写回至编码的音频数据流的元数据部分。数据流生成器可用于在输出数据流中以与元数据相同的格式生成交互控制数据。因此,可将任何交互控制数据有利地整合至输出数据流中。数据流生成器可用于将交互控制数据与输出数据流中的标识符相关联,标识符不同于与元数据相关联的标识符。使用用于经操作的元数据的不同标识符的优势在于可使能远程解码器以在接收原始数据的同时从接收的经操作的数据流识别交互。数据流生成器可用于将签名数据添加至交互控制数据,签名数据表示关于执行交互(例如音频数据操作)或提供用户输入的应用、装置或用户的信息。通过传输原始以及经操作的数据,元数据的重置是可能的。元数据中的签名允许追踪操作的起源。元数据解析器可用于识别用于由编码的音频数据表示的一个或多个音频对象的禁用可能性,其中交互接口用于接收用于一个或多个音频对象的禁用信息,以及其中数据流生成器用于在交互控制数据中将一个或多个音频对象标记为禁用,或用于从编码的音频数据中移除被禁用的一个或多个音频对象,以使得输出数据流不包括用于被禁用的一个或多个音频对象的编码的音频数据。因此,数据流可适于那些实际上或当前可用的音频对象,从而可减少当前比特流的总数据内容。数据流生成器可用于动态地生成输出数据流,其中响应于新的交互输入,更新交互控制数据以匹配新的交互输入,以及其中数据流生成器用于将更新的交互控制数据包括至输出数据流中。因此,数据流可与实时信息一起发送。换言之,可以以快速方式(优选地,实时地)更新并处理关于任意音频对象特定值的交互输入。接收器接口可用于接收包括编码的音频数据以及与编码的音频数据相关的元数据的主音频数据流,并用于额外地接收包括可选音频对象的可选音频数据,其中与所述可选音频对象相关的元数据包含在所述主音频数据流中。以此配置,音频数据处理器可将所选可选音频对象的编码的音频数据合并至主音频数据流中,从而导致由数据流生成器生成的完整的输出音频数据流。因此,可随后或按需要向用户额外地提供可选音频本文档来自技高网
...

【技术保护点】
1.一种音频数据处理器(1),包括:接收器接口(2),用于接收编码的音频数据(3)以及与编码的音频数据(3)相关的元数据(4);元数据解析器(5),用于解析所述元数据(4)以确定音频数据操作可能性;交互接口(6),用于接收交互输入(7)并用于从所述交互输入(7)生成与所述音频数据操作可能性相关的交互控制数据(8);以及数据流生成器(9),用于获取所述交互控制数据(8)、所述编码的音频数据(3)以及所述元数据(4),并用于生成输出数据流(10),所述输出数据流(10)包括所述编码的音频数据(3)、所述元数据(4)的至少部分以及所述交互控制数据(8)。

【技术特征摘要】
2014.05.28 EP 14170416.31.一种音频数据处理器(1),包括:接收器接口(2),用于接收编码的音频数据(3)以及与编码的音频数据(3)相关的元数据(4);元数据解析器(5),用于解析所述元数据(4)以确定音频数据操作可能性;交互接口(6),用于接收交互输入(7)并用于从所述交互输入(7)生成与所述音频数据操作可能性相关的交互控制数据(8);以及数据流生成器(9),用于获取所述交互控制数据(8)、所述编码的音频数据(3)以及所述元数据(4),并用于生成输出数据流(10),所述输出数据流(10)包括所述编码的音频数据(3)、所述元数据(4)的至少部分以及所述交互控制数据(8)。2.根据权利要求1所述的音频数据处理器,其中所述编码的音频数据(3)包括单独的编码的音频对象(11;12),其中所述元数据(4)的至少部分(13;14)与对应音频对象(11;12)相关,其中所述元数据解析器(5)用于解析用于所述编码的音频对象(11;12)的对应部分(13;14)以至少针对音频对象(11)确定对象操作可能性,其中所述交互接口(6)用于针对至少一个编码的音频对象(11)从与所述至少一个编码的音频对象(11)相关的交互输入(7)生成所述交互控制数据(8)。3.根据权利要求1或2所述的音频数据处理器,其中所述交互接口(6)用于向用户呈现由所述元数据解析器(5)从元数据(4)得出的音频数据操作可能性,并用于从用户接收关于所述数据操作可能性的特定数据操作的用户输入(7)。4.根据前述权利要求中任一项所述的音频数据处理器,其中所述数据流生成器(9)用于处理包括通过所述接收器接口(2)接收的所述编码的音频数据(3)和元数据(4)的数据流(15)而不对所述编码的音频数据(3)进行解码,或用于复制所述编码的音频数据(3)和元数据(4)的至少部分而不改变所述输出数据流(10),其中所述数据流生成器(9)用于将包含所述交互控制数据(8)的额外数据部分添加至所述输出数据流(10)中的所述编码的音频数据(3)和/或所述元数据(4)。5.根据前述权利要求中任一项所述的音频数据处理器,其中所述数据流生成器(9)用于在所述输出数据流(10)中以与所述元数据(4)相同的格式生成所述交互控制数据(8)。6.根据前述权利要求中任一项所述的音频数据处理器,其中所述数据流生成器(9)用于将所述交互控制数据(8)与所述输出数据流(10)中的标识符相关联,所述标识符不同于与所述元数据(4)相关联的标识符。7.根据前述权利要求中任一项所述的音频数据处理器,其中所述数据流生成器(9)用于将签名数据添加至所述交互控制数据(8),所述签名数据表示关于执行音频数据操作或提供交互输入的应用、装置或用户的信息。8.根据前述权利要求中任一项所述的音频数据处理器,其中所述元数据解析器(5)用于识别用于由所述编码的音频数据(3)表示的一个或多个音频对象(11,12)的禁用可能性,其中所述交互接口(6)用于接收用于所述一个或多个音频对象(11,12)的禁用信息,以及其中所述数据流生成器(9)用于在所述交互控制数据(8)中将所述一个或多个音频对象(11,...

【专利技术属性】
技术研发人员:斯蒂芬·施赖纳西蒙·法格哈拉尔德·福斯简·普洛格施蒂斯斯蒂芬·多赫拉
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国,DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1