【技术实现步骤摘要】
【国外来华专利技术】
本公开涉及音频源的建模,并且更特别地涉及基于体素的早期声音源反射估计方法和设备。
技术介绍
1、声学反射表面的声音反射可以影响音频源的感知声音。在目标位置(例如,收听者位置)处在直达声音之后不久被反射和接收的声音(其在本文中将被称为早期反射(er))在对声音源进行建模时特别令人感兴趣,因为仅考虑直达声音和er就可以对音频源的感知声音准确地建模。另一方面,更高阶的声学反射常常不太重要,因为它们在能量上较低并且在时间上/在空间上被er和其它组分心理声学地掩蔽。
2、er引起若干感知效果,诸如表观源宽度、感知的距离、音色和宽敞感。er在时间上相对稀疏并且跨越相对短的时间,通常包含在房间脉冲响应的前~80ms内(参见图1)。图1图示了房间的回声图,包括直达声音源、早期反射和晚期反射的回声图。图1还允许关于直达声音、早期反射和晚期反射之间的差异的可视化。
3、er的心理声学相关性很大程度上取决于若干因素,诸如音频信号的方向、水平、时间延迟和频谱内容。
4、er的方向特别影响收听者的耳朵处的时间延迟和频率响应。因
...【技术保护点】
1.一种估计三维音频场景中的音频源的早期反射轨迹的方法,所述方法包括:
2.如权利要求1所述的方法,还包括:
3.如权利要求1或2所述的方法,还包括:
4.如权利要求1至3中的任一项所述的方法,其中所述射线方向图定义射线的预定义的数量和从原点的射线的预定义的方向。
5.如权利要求4所述的方法,其中所述射线的预定义的数量是6、8、或者12。
6.如权利要求5所述的方法,其中所述三维音频网格中的体素位置由网格索引定义,并且所述射线的预定义的方向包括以下中的一个或多个:
7.如权利要求2所述的方法,其中
...【技术特征摘要】
【国外来华专利技术】
1.一种估计三维音频场景中的音频源的早期反射轨迹的方法,所述方法包括:
2.如权利要求1所述的方法,还包括:
3.如权利要求1或2所述的方法,还包括:
4.如权利要求1至3中的任一项所述的方法,其中所述射线方向图定义射线的预定义的数量和从原点的射线的预定义的方向。
5.如权利要求4所述的方法,其中所述射线的预定义的数量是6、8、或者12。
6.如权利要求5所述的方法,其中所述三维音频网格中的体素位置由网格索引定义,并且所述射线的预定义的方向包括以下中的一个或多个:
7.如权利要求2所述的方法,其中确定所述射线方向图是基于所述三维音频场景的场景类型、可用的计算资源、编码器预设、或者其组合。
8.如权利要求3所述的方法,其中连接所述音频源位置和所述收听者位置的线上的所述一个或更多个点的坐标基于所述一个或更多个点的基数被确定。
9.如权利要求8所述的方法,其中所述一个或更多个点被确定为将连接所述音频源位置和所述收听者位置的线划分成n-1个相等的线段,其中n是所述一个或更多个点的基数并且大于或等于2。
10.如权利要求3所述的方法,其中所述一个或更多个点的基数取决于所述三维音频场景的场景类型、可用的计算资源、编码器预设、或者其组合。
11.如权利要求7或10所述的方法,其中所述场景类型包括室内场景和室外场景。
12.如权利要求1至11中的任一项所述的方法,其中所述一组碰撞体素中的每个碰撞体素是所述三维音频场景的基于体素的表示中的遮挡物体素。
13.如权利要求12所述的方法,其中所述遮挡物体素表示声学反射表面。
14.如权利要求12所述的方法,其中所述遮挡物体素表示所述三维音频场景的基于体素的表示中除空气以外的任何材料。
15.如权利要求12至14中的任一项所述的方法,其中基于所述多个射线和所述三维音频场景的基于体素的表示确定所述一组碰撞体素包括:
16.如权利要求1至15中的任一项所述的方法,其中基于所述一组碰撞体素、所述收听者位置、所述音频源位置以及几何有效性测试确定(s204)早期反射轨迹包括:
17.如权利要求16所述的方法,其中确定(s401)碰撞体素是否可以产生一阶反射的几何有效表示包括:
...
【专利技术属性】
技术研发人员:P·塞提阿万,L·特伦蒂夫,D·菲舍尔,C·J·弗尔施,
申请(专利权)人:杜比国际公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。