利用变换参数的音频编码/解码制造技术

技术编号:33518542 阅读:81 留言:0更新日期:2022-05-19 01:26
编码/解码技术,其中多个变换参数集与输入音频内容的被渲染回放呈现一起被编码。在解码器侧使用多个变换参数来变换该回放呈现,以提供对于个体收听者相对于他们的听觉简档而优化的个性化双耳回放呈现。这可以通过选择或组合元数据流中存在的数据来实现。组合元数据流中存在的数据来实现。组合元数据流中存在的数据来实现。

【技术实现步骤摘要】
【国外来华专利技术】利用变换参数的音频编码/解码
[0001]相关申请的交叉引用
[0002]本申请要求2019年9月23日提交的美国临时专利申请第62/904,070号和2020年6月2日提交的美国临时专利申请第63/033,367号的优先权,这些申请通过引用而结合于此。
专利

[0003]本公开涉及具有一个或多个音频分量的音频内容的编码和解码。
[0004]专利技术背景
[0005]沉浸式娱乐内容通常采用基于通道或基于对象的格式,以用于跨诸如电影院、家庭音频系统和耳机的目标回放系统的音频的创建、编码、分发和再现。基于通道的格式和基于对象的格式两者采用不同的渲染策略,例如下混合,以便优化音频在其中被再现的目标系统的回放。
[0006]在耳机回放的情况下,一种潜在的渲染方案(如图1所示)涉及使用头部相关脉冲响应(HRIRs,时域)或头部相关传递函数(HRTFs,频域)来模拟多通道扬声器回放系统。HRIRs和HRTFs模拟声音从扬声器传播到收听者耳膜时声学环境的各个方面。具体而言,这些响应引入了特定的线索,包括双耳时间差(ITD)、双耳声级差(本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种对具有一个或多个音频分量的输入音频内容进行编码的方法,其中每个音频分量与空间位置相关联,该方法包括以下步骤:渲染所述输入音频内容的音频回放呈现,所述音频回放呈现预期在音频再现系统上再现;通过将M组传递函数应用于输入音频内容来确定一组M个双耳表征,其中所述M组传递函数基于个体双耳回放简档的集合;计算能够实现从所述音频回放呈现到所述M个双耳表征的M个近似的变换的M组变换参数,其中通过优化所述M个双耳表征和所述M个近似之间的差异来确定所述M组变换参数;和对所述音频回放呈现和所述M组变换参数进行编码,以传输到解码器。2.根据权利要求1所述的方法,其中所述M个双耳表征是预期在耳机上再现的M个个体双耳回放呈现,所述M个个体双耳回放呈现对应于M个个体回放简档。3.根据权利要求1所述的方法,其中所述M个双耳表征是预期在耳机上再现的M个规范双耳回放呈现,所述M个规范双耳回放呈现代表个体回放简档的较大集合。4.根据权利要求1的方法,其中所述M组传递函数是M组头部相关传递函数。5.根据权利要求1所述的方法,其中所述音频回放呈现是预期在耳机上再现的主要双耳回放呈现,并且其中所述M个双耳表征是M个信号对,每个信号对表示所述主要双耳回放呈现和与个体回放简档对应的双耳回放呈现之间的差异。6.根据权利要求1所述的方法,其中所述音频回放呈现预期用于扬声器系统,并且其中M个双耳表征包括预期在耳机上再现的主要双耳呈现,以及M

1个信号对,每个信号对表示所述主要双耳回放呈现和与个体回放简档对应的双耳回放呈现之间的差异。7.根据权利要求5所述的方法,其中所述M个信号对由M个主分量分析(PCA)基函数渲染。8.根据权利要求1所述的方法,其中,对于不同的频带,传递函数集的数量M是不同的。9.根据权利要求1所述的方法,其中通过将线性增益N
×
2矩阵应用于音频回放呈现来执行将个性化的变换参数集应用于音频回放呈现的步骤,其中N是音频回放呈现中通道的数量,并且矩阵的元素由变换参数形成。10.一种对来自音频比特流的个性化双耳回放呈现进行解码的方法,该方法包括以下步骤:接收并解码音频回放呈现,所述音频回放呈现预期在音频再现系统上再现;接收并解码M组变换参数,所述M组变换参数使得能够实现从所述音频回放呈现到M个双耳表征的M个近似的变换,其中,所述M组变换参数已经由编码器确定,以最小化所述M个双耳表征和通过将变换参数应用于音频回放呈现而生成的所述M个近似之间的差异;将所述M组变换参数组合成个性化的一组变换参数;以及将个性化的该组变换参数应用于音频回放呈现,以生成所述个性化的双耳回放呈现。11.根据权利要求10的方法,其中组合所述M组变换参数的步骤包括选择个性化组作为该M组之一。12.根据权利要求10的方法,其中组合所述M组变换参数的步骤包括形成作为该M组的线性组合的个性化组。
13.根据权利要求10所述的方法,其中所述音频回放呈现是预期在耳机上再现的主要双耳回放呈现,并且其中,所述M组变换参数能够实现从所述音频回放呈现到M个信号对的变换,每个信号对表示所述主要双耳回放呈现和与个体回放简档对应的双耳回放呈现之间的差异,以及其中,将个性化的一组变换参数应用于主要双耳回放呈现的步骤包括:通过将该个性化的一组变换参数作为线性增益2
×
2矩阵应用于主要双耳回放呈现来形成个性化双耳差异,以及将所述个性化双耳差异和主要双耳回放呈现进行求和。14.根据权利要求10所述的方法,其中所述音频回放呈现预期在扬声器上再现,并且其中,所述M组变换参数中的第一组使得能够从所述音频回放呈现变换成主要双耳呈现的近似,并且剩余的变换参数组使得能够从所述音频回放呈现变换成M

1个信号对,每个信号对表示所述主要双耳回放呈现和与个体回放简档相对应的双耳回放呈现之间的差异,并且其中,将个性化的一组变换参数应用于主要双耳回放呈现的步骤包括:通过将第一组变换参数应用于音频回放呈现来形成主要双耳呈现,通过将该个性化的一组变换参数作为线性增益2
×
2矩阵应用于所述主要双耳回放呈现来形成个性化的双耳差异,以及将所述个性化双耳差异和主要双耳回放呈现求和。15.根据权利要求14所述的方法,其中通过将线性增益N
×
2矩阵应用于音频回放呈现来执行将第一组变换参数应用于音频回放呈现的步骤,其中N是音频回放呈现中...

【专利技术属性】
技术研发人员:D
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1