生成参数化空间音频表示制造技术

技术编号:41077975 阅读:28 留言:0更新日期:2024-04-25 10:04
一种用于生成空间音频流的方法,该方法包括:获得来自至少两个麦克风的至少两个音频信号;从该至少两个音频信号提取第一音频信号,该第一音频信号至少部分地包括用户的语音;从该至少两个音频信号提取第二音频信号,其中该用户的语音在该第二音频信号内基本不存在;以及对该第一音频信号和该第二音频信号进行编码以生成该空间音频流,使得能够将该用户的语音渲染到可控方向和/或距离。

【技术实现步骤摘要】

本申请涉及用于生成参数化空间音频表示的装置和方法,但是不是排他地用于从音频编码器的双声道记录生成参数化空间音频表示。


技术介绍

1、捕获空间音频的方法有很多。一种选项是使用例如作为移动设备的一部分的麦克风阵列捕获空间音频。使用麦克风信号,可以执行声音场景的空间分析以确定频带中的空间元数据。此外,可以使用麦克风信号来确定传输音频信号。空间元数据和传输音频信号可以被组合以形成空间音频流。

2、元数据辅助空间音频(masa)是空间音频流的一个示例。它是即将来临的沉浸式语音和音频服务(ivas)编解码器将支持的输入格式之一。它使用音频信号以及对应的空间元数据(包含例如频带中的方向和直接能量与总能量比(direct-to-total energy ratios))和描述性元数据(包含与例如原始捕获和(传输)音频信号相关的附加信息)。masa流可以例如通过用例如移动设备的麦克风捕获空间音频来获得,其中空间元数据集是基于麦克风信号来估计的。masa流还可以从其他来源获得,例如特定的空间音频麦克风(例如高保真度立体声响复制(ambisonics))、工作室混音本文档来自技高网...

【技术保护点】

1.一种用于生成空间音频流的方法,所述方法包括:

2.根据权利要求1所述的方法,其中,所述空间音频流还使得能够可控渲染所捕获的环境音频内容。

3.根据权利要求1所述的方法,其中,从所述至少两个音频信号提取所述第一音频信号还包括:将机器学习模型应用于所述至少两个音频信号或基于所述至少两个音频信号的至少一个音频信号以生成所述第一音频信号。

4.根据权利要求3所述的方法,其中,将所述机器学习模型应用于所述至少两个音频信号或基于所述至少两个音频信号的至少一个音频信号以生成所述第一音频信号还包括:

5.根据权利要求3所述的方法,其中,从所述至少两个音...

【技术特征摘要】

1.一种用于生成空间音频流的方法,所述方法包括:

2.根据权利要求1所述的方法,其中,所述空间音频流还使得能够可控渲染所捕获的环境音频内容。

3.根据权利要求1所述的方法,其中,从所述至少两个音频信号提取所述第一音频信号还包括:将机器学习模型应用于所述至少两个音频信号或基于所述至少两个音频信号的至少一个音频信号以生成所述第一音频信号。

4.根据权利要求3所述的方法,其中,将所述机器学习模型应用于所述至少两个音频信号或基于所述至少两个音频信号的至少一个音频信号以生成所述第一音频信号还包括:

5.根据权利要求3所述的方法,其中,从所述至少两个音频信号提取所述第一音频信号还包括:对所述至少两个音频信号进行波束成形以生成语音音频信号。

6.根据权利要求5所述的方法,其中,对所述至少两个音频信号进行波束成形以生成所述语音音频信号包括:

7.根据权利要求6所述的方法,其中,将所述机器学习模型应用于所述至少两个音频信号或基于所述至少两个音频信号的至少一个音频信号以生成所述第一音频信号还包括:

8.根据权利要求3所述的方法,其中,将所述机器学习模型应用于所述至少两个音频信号或基于所述至少两个音频信号的至少一个信号以生成所述第一音频信号还包括:均衡所述第一音频信号。

9.根据权利要求3所述的方法,其中,从所述至少两个音频信号提取所述第二音频信号包括:

10.根据权利要求1所述的方法,其中,从所述至少两个音频信号提取包括所述用户的语音的所述第一音频信号包括:

【专利技术属性】
技术研发人员:MV·莱蒂南J·T·维尔卡莫J·K·维罗莱宁
申请(专利权)人:诺基亚技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1