用于实现音频渲染的装置、方法和计算机程序制造方法及图纸

技术编号:38989319 阅读:11 留言:0更新日期:2023-10-07 10:19
本公开的示例涉及用于实现可以适应用户的移动的空间音频渲染的装置、方法和计算机程序。示例装置包括用于执行以下操作的部件:获得表示至少一个音频空间的音频内容;使得至少一个数字信号处理操作能够渲染音频内容,以使得经渲染的音频内容包括针对至少一个音频空间的至少一个目标响应,其中,基于以下操作来控制使得至少一个数字信号处理操作能够渲染音频内容:获得针对至少一个音频空间的至少一个目标响应。当所获得的目标响应已知时,所述部件用于获得用于至少一个数字信号处理操作的至少一个参数,并且使用所获得的至少一个参数使得至少一个数字信号处理操作能够针对至少一个音频空间内的用户位置再现具有该目标响应的声学效果。当所获得的目标响应未知时,所述部件用于获得用于神经网络的至少一个参数,使用神经网络以确定用于至少一个数字信号处理操作的至少一个参数,并且使用至少一个所确定的参数使得至少一个数字信号处理操作能够针对至少一个音频空间内的用户位置再现具有该目标响应的声学效果。有该目标响应的声学效果。有该目标响应的声学效果。

【技术实现步骤摘要】
【国外来华专利技术】用于实现音频渲染的装置、方法和计算机程序


[0001]本公开的示例涉及用于实现空间音频渲染的装置、方法和计算机程序。一些示例涉及用于实现可以适应用户的移动的空间音频渲染的装置、方法和计算机程序。

技术介绍

[0002]当渲染设备被用于针对介导现实提供声学时,它渲染声学效果以便为用户提供空间音频。在一些示例中,渲染设备可以渲染空间音频,以使得用户可以在介导现实环境内的不同位置处感知不同的空间音频效果。如果用户正在环境中移动,则渲染设备可以更新用于渲染音频效果的数字信号处理操作,以使能向用户提供正确的声学效果。如果数字信号处理操作的更新太慢,则可能会降低空间音频效果的准确性。

技术实现思路

[0003]根据本公开的各种但并非所有示例,可以提供一种装置,其包括用于执行以下操作的部件:获得表示至少一个音频空间的音频内容;使得至少一个数字信号处理操作能够渲染音频内容,以使得经渲染的音频内容包括针对至少一个音频空间的至少一个目标响应,其中,基于以下操作来控制使得至少一个数字信号处理操作能够渲染音频内容:获得针对至少一个音频空间的至少一个目标响应;以及当所获得的目标响应已知时,获得用于至少一个数字信号处理操作的至少一个参数,并且使用所获得的至少一个参数使得至少一个数字信号处理操作能够针对至少一个音频空间内的用户位置再现具有该目标响应的声学效果;或者当所获得的目标响应未知时,获得用于神经网络的至少一个参数,使用神经网络以确定用于至少一个数字信号处理操作的至少一个参数,并且使用至少一个所确定的参数使得至少一个数字信号处理操作能够针对至少一个音频空间内的用户位置再现具有该目标响应的声学效果。
[0004]数字信号处理操作可以包括一个或多个滤波器组,并且至少一个所获得的参数包括一个或多个滤波器组增益。
[0005]滤波器组可以包括用于执行以下中的任何一项或多项的部件:混响器衰减滤波,混响器扩散对直接比率控制,方向性滤波,材料衰减,介质吸收滤波。
[0006]滤波器组可以包括图形均衡器滤波器组。
[0007]目标响应可以包括用于输出音频信号的目标控制增益,以使得音频场景能够基于至少一个音频空间内的用户位置而向用户渲染。
[0008]所述部件可以用于使得所述装置能够接收一个或多个声学效果参数,以及用于使得声学效果参数和神经网络能够被用以获得用于数字信号处理操作的参数。
[0009]一个或多个声学效果参数可以包括指示针对音频信号的至少一个目标响应的信息。
[0010]所述部件可以用于接收用于神经网络的一个或多个参数,以及使用用于神经网络的参数以生成神经网络并获得用于数字信号处理操作的参数。
[0011]可以从编码设备接收用于神经网络的一个或多个参数。
[0012]所述部件可以用于接收指示用于神经网络的一个或多个权重的信息,使用指示用于神经网络的一个或多个权重的信息来调整神经网络,以及使用经调整的神经网络以获得用于数字信号处理操作的参数。
[0013]指示用于神经网络的一个或多个权重的信息可以包括以下中的至少一项:用于神经网络的一个或多个权重的一个或多个值;以及对用于神经网络的一组所存储的权重的一个或多个引用。
[0014]所述部件可以用于更新用于神经网络的一个或多个权重,使用所更新的权重来调整神经网络,以及使用经调整的神经网络以获得用于数字信号处理操作的参数。
[0015]所述部件可以用于确定在至少一个音频空间内的用户的位置。
[0016]所述部件可以提供双耳音频输出。
[0017]根据本公开的各种但并非所有示例,可以提供一种包括如本文所描述的装置的音频渲染设备。
[0018]根据本公开的各种但并非所有示例,可以提供一种包括如本文所描述的装置的编码设备。
[0019]根据本公开的各种但并非所有示例,可以提供一种装置,其包括:至少一个处理器;包括计算机程序代码的至少一个存储器,该至少一个存储器和计算机程序代码被配置为与该至少一个处理器一起使该装置至少执行:获得表示至少一个音频空间的音频内容;使得至少一个数字信号处理操作能够渲染音频内容,以使得经渲染的音频内容包括针对至少一个音频空间的至少一个目标响应,其中,基于以下操作来控制使得至少一个数字信号处理操作能够渲染音频内容:获得针对至少一个音频空间的至少一个目标响应;以及当所获得的目标响应已知时,获得用于至少一个数字信号处理操作的至少一个参数,并且使用所获得的至少一个参数使得至少一个数字信号处理操作能够针对至少一个音频空间内的用户位置再现具有该目标响应的声学效果;或者当所获得的目标响应未知时,获得用于神经网络的至少一个参数,使用神经网络以确定用于至少一个数字信号处理操作的至少一个参数,并且使用至少一个所确定的参数使得至少一个数字信号处理操作能够针对至少一个音频空间内的用户位置再现具有该目标响应的声学效果。
[0020]根据本公开的各种但并非所有示例,可以提供一种方法,其包括:获得表示至少一个音频空间的音频内容;使得至少一个数字信号处理操作能够渲染音频内容,以使得经渲染的音频内容包括针对至少一个音频空间的至少一个目标响应,其中,基于以下操作来控制使得至少一个数字信号处理操作能够渲染音频内容:获得针对至少一个音频空间的至少一个目标响应;以及当所获得的目标响应已知时,获得用于至少一个数字信号处理操作的至少一个参数,并且使用所获得的至少一个参数使得至少一个数字信号处理操作能够针对至少一个音频空间内的用户位置再现具有该目标响应的声学效果;或者当所获得的目标响应未知时,获得用于神经网络的至少一个参数,使用神经网络以确定用于至少一个数字信号处理操作的至少一个参数,并且使用至少一个所确定的参数使得至少一个数字信号处理操作能够针对至少一个音频空间内的用户位置再现具有该目标响应的声学效果。
[0021]数字信号处理操作可以包括一个或多个滤波器组,并且至少一个所获得的参数包括一个或多个滤波器组增益。
[0022]根据本公开的各种但并非所有示例,可以提供一种包括计算机程序指令的计算机程序,这些计算机程序指令在由处理电路执行时导致:获得表示至少一个音频空间的音频内容;使得至少一个数字信号处理操作能够渲染音频内容,以使得经渲染的音频内容包括针对至少一个音频空间的至少一个目标响应,其中,基于以下操作来控制使得至少一个数字信号处理操作能够渲染音频内容:获得针对至少一个音频空间的至少一个目标响应;以及当所获得的目标响应已知时,获得用于至少一个数字信号处理操作的至少一个参数,并且使用所获得的至少一个参数使得至少一个数字信号处理操作能够针对至少一个音频空间内的用户位置再现具有该目标响应的声学效果;或者当所获得的目标响应未知时,获得用于神经网络的至少一个参数,使用神经网络以确定用于至少一个数字信号处理操作的至少一个参数,并且使用至少一个所确定的参数使得至少一个数字信号处理操作能够针对至少一个音频空间内的用户位置再现具有该目标响应的声学效果。
[0023]数字信号处理操作可以包括一个或多个滤波器组,并本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种装置,包括用于执行以下操作的部件:获得表示至少一个音频空间的音频内容;使得至少一个数字信号处理操作能够渲染所述音频内容,以使得经渲染的音频内容包括针对所述至少一个音频空间的至少一个目标响应,其中,基于以下操作来控制使得所述至少一个数字信号处理操作能够渲染所述音频内容:获得针对所述至少一个音频空间的所述至少一个目标响应;以及当所获得的目标响应已知时,获得用于所述至少一个数字信号处理操作的至少一个参数,并且使用所获得的至少一个参数使得所述至少一个数字信号处理操作能够针对所述至少一个音频空间内的用户位置再现具有所述目标响应的声学效果;或者当所获得的目标响应未知时,获得用于神经网络的至少一个参数,并使用所述神经网络以确定用于所述至少一个数字信号处理操作的至少一个参数,其中,所确定的至少一个参数使得所述至少一个数字信号处理操作能够针对所述至少一个音频空间内的所述用户位置再现具有所述目标响应的声学效果。2.根据权利要求1所述的装置,其中,所述数字信号处理操作包括一个或多个滤波器组,并且至少一个所获得的参数包括一个或多个滤波器组增益。3.根据权利要求2所述的装置,其中,所述滤波器组包括用于执行以下中的任何一项或多项的部件:混响器衰减滤波,混响器扩散对直接比率控制,方向性滤波,材料衰减,介质吸收滤波。4.根据权利要求3所述的装置,其中,所述滤波器组包括图形均衡器滤波器组。5.根据前述权利要求中任一项所述的装置,其中,所述目标响应包括用于输出音频信号的目标控制增益,以使得音频场景能够基于所述至少一个音频空间内的所述用户位置而向用户渲染。6.根据前述权利要求中任一项所述的装置,其中,所述部件用于使得所述装置能够接收一个或多个声学效果参数,以及用于使得所述声学效果参数和所述神经网络能够被用以获得用于所述数字信号处理操作的参数。7.根据前述权利要求中任一项所述的装置,其中,所述一个或多个声学效果参数包括指示针对音频信号的所述至少一个目标响应的信息。8.根据权利要求1至5中任一项所述的装置,其中,所述部件用于接收用于所述神经网络的一个或多个参数,以及使用用于所述神经网络的所述参数以生成所述神经网络并获得用于所述数字信号处理操作的参数。9.根据权利要求8所述的装置,其中,从编码设备接收用于所述神经网络的所述一个或多个参数。10.根据权利要求1至5中任一项所述的装置,其中,所述部件用于接收指示用于所述神经网络的一个或多个权重的信息,使用指示用于所述神经网络的一个或多个权重的所述信息来调整所述神经网络,以及使用经调整的神经网络以获得用于所述数字信号处理操作的参数。11.根据权利要求10所述的装置,其中,指示用于所述神经网络的一个或多个权重的所述信息包括以下中的至少一项:用于所述神经网络的一个或多个权重的一个或多个值;以及对用于所述神经网络的一组所存储的权重的一个或多个引用。
12.根据权利要求1至5中任一项所述的装置,其中,所述部件用于更新用于所述神经网络的一个或多个权重,使用所更新的权重来调整所述神经网络,以及使用经调整的神经网络以获得用于所述数字信号处理操作的参数。13.根据前述权利要求中任一项所述的装置,其中,所述部件用于确定在所述至少一个音频空间内的用户的位置。14.根据前述权利要求中任一项所述的装置,其中,所述部件用于提供双耳音频输出。15.一种音频渲染设备,包括根据前述权利要求中的任何一项所述的装置。16.一种编码设备,包括根据权利要求1至14中的...

【专利技术属性】
技术研发人员:A
申请(专利权)人:诺基亚技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1