【技术实现步骤摘要】
用于虚拟现实应用的音频传递优化
[0001]本申请是申请日为2018年10月11日的PCT国际申请PCT/EP2018/077770在2020年6月11日向中国专利局递交并进入中国国家阶段后对应的题为“用于虚拟现实应用的音频传递优化”的专利技术专利申请No.201880080196.6的分案申请。
技术介绍
[0002]说明
[0003]介绍
[0004]在虚拟现实(VR)环境中或类似地在增强现实(AR)或混合现实(MR)或360度视频环境中,用户通常可以使用例如头戴式显示器(HMD)来可视化完全360度内容并通过耳机(或类似地通过扩音器,包括取决于其位置的正确渲染)收听。
[0005]在简单的用例中,以这样的方式授权内容:在特定的时间点仅再现一个音频/视频场景(例如,360度视频)。音频/视频场景具有固定位置(例如,用户位于中心的球体),并且用户可能不在场景中移动,而是仅在各种方向(偏航、俯仰、横滚)上旋转他的头部。在这种情况下,基于用户头部的取向向用户播放不同的视频和音频(显示不同的视口)。
[0006]然而,对于视频,视频内容连同用于描述渲染过程的元数据(例如,拼接信息、投影映射等)一起被传送用于整个360度场景,并基于当前用户的视口进行选择,对于音频,针对整个场景内容都一样。基于元数据,音频内容适应于当前用户的视口(例如,基于视口/用户取向信息,音频对象被不同地呈现)。应当注意,360度内容是指用户可以(例如通过用户头部取向或通过使用遥控器)从其选择的包括相同时刻处的一个以上视角的任何类型的内容 ...
【技术保护点】
【技术特征摘要】
1.一种用于接收要在媒体消费设备中再现的音频流的系统(102),其中所述系统(102)包括:至少一个音频解码器(104),被配置为从多个音频流(106)中解码音频信号(108),以表示音频场景,以及混合器,混合从不同音频流中解码的不同音频信号,其中,所述系统(102)被配置为:至少基于用户的当前移动数据和/或交互元数据和/或虚拟位置数据(110),请求(112)至少一个音频流(106)和/或音频流的一个音频元素和/或一个适应集。2.根据权利要求1所述的系统,被配置为输出用户的当前移动数据和/或交互元数据和/或虚拟位置数据(110),以便获得至少一个音频流(106)和/或音频流的一个音频元素和/或一个适应集。3.根据权利要求1所述的系统,其中,至少一个场景与至少一个音频元素(152)相关联,每个音频元素与其中所述音频元素能够听见的环境中的位置和/或区域相关联,使得针对所述场景中不同的用户的移动数据和/或交互元数据和/或虚拟位置数据,提供不同的音频流。4.根据权利要求1所述的系统,被配置为决定是否要为当前用户的移动数据和/或交互元数据和/或虚拟位置再现音频流的至少一个音频元素和/或一个适应集,其中所述系统被配置为请求和/或接收当前用户的虚拟位置处的至少一个音频元素。5.根据权利要求1所述的系统,其中,所述系统被配置为至少基于用户的当前移动数据和/或交互元数据和/或虚拟位置数据(110),预测性地决定音频流的至少一个音频元素(152)和/或一个适应集是否将变得相关和/或能够听见,其中所述系统被配置为在场景中预测的用户的移动和/或交互之前,请求和/或接收所述至少一个音频元素和/或音频流和/或适应集,并且其中所述系统被配置为在所述场景中所述用户的移动和/或交互之后,当接收到所述至少一个音频元素和/或音频流时,在特定的用户的虚拟位置处再现所述至少一个音频元素和/或音频流。6.根据权利要求1所述的系统,被配置为在所述场景中用户的移动和/或交互之前,在用户的虚拟位置以较低的比特率和/或质量水平请求和/或接收至少一个音频元素(152),其中,所述系统被配置为在场景中所述用户的移动和/或交互之后,以较高的比特率和/或质量水平请求和/或接收所述至少一个音频元素。7.根据权利要求1所述的系统,其中,至少一个音频元素(152)与至少一个场景相关联,每个音频元素与关联到场景的环境中的位置和/或区域相关联,其中,所述系统配置为针对与更远离用户的元素相比更靠近用户的音频元素,以较高的比特率和/或质量请求和/或接收流。8.根据权利要求1所述的系统,其中至少一个音频元素(152)与至少一个场景相关联,所述至少一个音频元素与关联到场景的环境中的位置和/或区域相关联,其中,所述系统被配置为基于音频元素在场景中每个用户的虚拟位置处的相关性和/或可听性级别,以不同比特率和/或质量水平请求不同流,其中,所述系统被配置为针对在所述当前用户的虚拟位置处更相关和/或更能够听见
的音频元素以较高的比特率和/或质量水平请求所述至少一个适应集的音频流,和/或针对在当前用户的虚拟位置处不太相关和/或不太能够听见的音频元素,以较低的比特率和/或质量水平请求音频流。9.根据权利要求1所述的系统,所述至少一个音频元素(152)与场景相关联,每个音频元素与关联到场景的环境中的位置和/或区域相关联,其中,所述系统配置为定期输出所述用户的当前移动数据和/或交互元数据和/或虚拟位置数据(110),使得:针对第一位置,以较高的比特率和/或质量接收流,以及针对第二位置,以较低的比特率和/或质量接收流,其中所述第一位置比所述第二位置更靠近所述至少一个音频元素(152)。10.根据权利要求1所述的系统,针对多个环境定义多个场景(150A、150B),所述多个环境是邻近和/或相邻环境,使得提供与第一当前场景相关联的第一流,并且在用户到第二其他场景的转换的情况下,提供与所述第一场景相关联的流和与所述第二场景相关联的第二流两者。11.根据权利要求1所述的系统,其中,针对第一和第二环境定义多个场景(150A、150B),所述第一和第二环境是邻近和/或相邻环境,其中,在所述用户的位置或虚拟位置在与所述第一场景相关联的第一环境中的情况下,接收与所述第一场景相关联的第一流,以再现所述第一场景,在所述用户的位置或虚拟位置在与所述第二场景相关联的第二环境中的情况下,接收与所述第二场景相关联的第二流,以再现所述第二音频场景,以及在所述用户的位置或虚拟位置在所述第一场景和所述第二场景之间的转换位置中的情况下,提供与所述第一场景相关联的第一流和与所述第二场景相关联的第二流二者。12.根据权利要求1所述的系统,其中,针对第一和第二环境定义多个场景(150A、150B),所述第一和第二环境是邻近和/或相邻环境,其中所述系统被配置为在所述用户的虚拟位置在所述第一环境中的情况下,请求和/或接收与关联到所述第一环境的第一场景(150A)相关联的第一流,以再现所述第一场景,其中,所述系统被配置为在所述用户的虚拟位置在所述第二环境中的情况下,请求和/或接收与关联到所述第二环境的第二场景(150B)相关联的第二流,以再现所述第二场景,并且其中所述系统被配置为在所述用户的位置或虚拟位置在所述第一环境和所述第二环境之间的转换位置(150AB)中的情况下,请求和/或接收与所述第一场景相关联的第一流和与所述第二场景相关联的第二流二者。13.根据权利要求10所述系统,其中,当所述用户在与所述第一场景相关联的第一环境中时,与所述第一场景相关联的所述第一流以较高的比特率和/或比特率获得,而当所述用户处于从所述第一场景到所述第二场景的转换的开始时,与关联到所述第二环境的所述第二场景相关联的所述第二流以较低的比特率和/或质量获得,并且当所述用户处于从所述第一场景到所述第二场景的转换位置的末端时,与所述第一场景相关联的所述第一流以较低的比特率和/或质量获得,并且与所述第二场景相关联的所
述第二流以较高的比特率和/或质量获得,其中,所述较低的比特率和/或质量低于所述较高的比特率和/或质量。14.根据权利要求1所述的系统,其中,针对多个环境定义多个场景(150A、150B),所述多个环境是邻近和/或相邻环境,使得所述系统被配置为获取与关联到第一当前环境的第一当前场景相关联的流,以及在用户的位置或虚拟位置距场景的边界的距离低于预定阈值的情况下或者在第二场景的相关性或可听性高于预定阈值的情况下,所述系统进一步获取与关联到第二场景的第二邻近和/或相邻环境相关联的音频流。15.根据权利要求1所述的系统,其中,针对多个环境定义多个场景(150A、150B),使得所述系统以较高的比特率和/或质量来请求和/或获得与当前场景相关联的流,以及以较低的比特率和/或质量来请求和/或获得与所述第二场景相关联的流,其中,所述较低的比特率和/或质量低于所述较高的比特率和/或质量。16.根据权利要求1所述的系统,其中,定义了多个N个音频元素,并且在用户到这些音频元素的位置或区域的距离大于预定阈值的情况下,处理N个音频元素以获得与靠近所述N个音频元素的位置或区域的位置或区域相关联的较少数量M个音频元素(M<N),以:在所述用户到所述N个音频元素的位置或区域的距离小于预定阈值的情况下,向所述系统提供与所述N个音频元素相关联的至少一个音频流,或者在所述用户到所述N个音频元素的位置或区域的距离大于预定阈值的情况下,向所述系统提供与所述M个音频元素相关联的至少一个音频流。17.根据权利要求1所述的系统,其中,至少一个环境场景与至少一个多个N个音频元素(N>=2)相关联,每个音频元素与所述环境中的位置和/或区域相关联,其中,以高比特率和/或质量以至少一个表示来提供至少所述至少一个多个N个音频元素,以及其中以低比特率和/或质量以至少一个表示来提供至少所述至少一个多个N个音频元素,其中通过处理所述N个音频元素以获得与靠近所述N个音频元素的位置或区域的位置或区域相关联的较少数量M个音频元素(M<N),来获得至少一个表示,其中,所述系统被配置为在所述音频元素在所述当前用户在所述场景中的虚拟位置处更相关和/或更能够听见的情况下,针对所述音频元素以较高的比特率和/或质量水平来请求所述表示,其中,所述系统被配置为在所述音频元素在所述当前用户在所述场景中的虚拟位置处更不相关和/或更不能够听见的情况下,针对所述音频元素以较低的...
【专利技术属性】
技术研发人员:阿德里安,
申请(专利权)人:弗劳恩霍夫应用研究促进协会,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。