一种音频渲染方法及装置制造方法及图纸

技术编号:24041843 阅读:26 留言:0更新日期:2020-05-07 03:40
本申请提供一种音频渲染方法,包括:获取待渲染BRIR信号,待渲染BRIR信号对应的高度角为0度;根据待渲染BRIR信号获得直达声信号;根据目标高度角,对直达声信号对应的频域信号进行修正,以获得对应目标高度角的频域信号;根据目标高度角的频域信号获取时域信号;将时域信号与待渲染BRIR信号中位于第一时段之后的第二时段的信号叠加,以获得目标高度角的BRIR信号。由于根据目标高度角的频域信号获得的时域信号与目标高度角存在对应关系,第二时段的信号能够体现出环境反射导致的音频变换,因此两者合成的BRIR信号为立体声的BRIR信号。本申请还提供一种能实现以上音频渲染方法的音频渲染装置。

An audio rendering method and device

【技术实现步骤摘要】
一种音频渲染方法及装置
本申请涉及音频处理领域,尤其涉及一种音频渲染方法以及装置。
技术介绍
三维音频是指通过模拟真实声源在两耳的声场,使听者感觉到声音来自立体空间的声源的音频处理技术。头部相关传递函数(headrelatedtransferfunction,HRTF)是一种音频处理技术,用于模拟在自由场条件下声源到耳膜之间的音频信号变换,其包括头、耳廓、肩等对声音传输的影响。在实际环境中,耳朵听到的声音不仅包括从声源直接到达耳膜的声音,还包括经过环境反射到达耳膜的声音。为了模拟完整的声音,现有技术提供双耳房间冲激响应(binauralroomimpulseresponse,BRIR),用于表示在房间内从声源到双耳的音频信号变换。现有BRIR渲染方法大致如下:以一个单声道信号或者立体声信号作为输入音频信号,根据虚拟声源的方位角选择对应的BRIR函数,根据该BRIR函数对输入音频信号进行渲染得到目标音频信号。但是,现有BRIR渲染方法仅考虑了同一水平面的不同方位角的影响,不考虑虚拟声源的高度角,因此不能对立体空间的声音进行准确渲染。
技术实现思路
有鉴于此,本申请提供一种基于双耳的音频处理方法和音频处理装置,用于对立体空间的音频进行准确渲染。第一方面提供一种音频渲染方法,包括:获取待渲染BRIR信号,待渲染BRIR信号对应的高度角为0度;根据待渲染BRIR信号获得直达声信号;根据目标高度角,对直达声信号对应的频域信号进行修正,以获得对应目标高度角的频域信号;根据修正后的频域信号获取时域信号;将时域信号与待渲染BRIR信号中位于第一时段之后的第二时段的信号叠加,以获得目标高度角的BRIR信号。其中,直达声信号对应待渲染BRIR信号对应的时段中的第一时段。依此实施,由于根据修正后的频域信号获取得到的时域信号与目标高度角存在对应关系,第二时段的信号能够体现出环境反射导致的音频变换,因此两者合成的目标BRIR信号为立体声的BRIR信号。在一种可能的实现方式中,根据目标高度角,对直达声信号对应的频域信号进行修正包括:根据目标高度角和修正函数确定修正系数;根据修正系数对直达声信号对应的频域信号进行修正,得到修正后的频域信号。修正函数包括对应不同高度角的HRTF信号的系数之间的数值关系。依此实施,根据目标高度角以及与目标高度角对应的修正函数,可以确定修正系数。修正系数可以是一组系数组成的向量。使用修正系数处理直达声信号对应的频域信号,得到的修正后的频域信号与目标高度角对应。由此提供了一种修正直达声对应的频域信号的方法,能够使得修正后的频域信号对应目标高度角。在另一种可能的实现方式中,根据目标高度角,对直达声信号对应的频域信号进行修正包括:根据目标高度角,对直达声信号对应的频谱包络中的峰值点或谷点至少一项的信息进行修正,从而得到峰值点或谷点至少一项修正后的信息,该峰值点或谷点至少一项修正后的信息对应目标高度角;根据峰值点或谷点至少一项修正后的信息,确定目标滤波器;使用目标滤波器对直达声信号进行滤波得到修正后的频域信号。依此实施,根据目标高度角可以确定在频谱包络中峰值点的修正系数,然后利用峰值点的修正系数对峰值点的至少一项的信息进行修正。峰值点的至少一项的信息包括峰值点的中心频率、峰值点的带宽和峰值点的增益。根据峰值点的至少一项修正后的信息确定峰值点滤波器。并且,根据目标高度角可以确定在频谱包络中谷点的修正系数,然后利用谷点的修正系数对谷点的至少一项的信息进行修正。谷点的至少一项的信息包括但不限于:谷点的带宽和谷点的增益。根据谷点修正后的至少一项的信息确定谷点滤波器。将峰值点滤波器与谷点滤波器级联得到目标滤波器。由于峰值点滤波器与谷点滤波器均与修正后的信息对应,因此目标滤波器与修正后的信息同样存在对应关系。由于修正后的信息与目标高度角相关,这样使用目标滤波器对直达声信号进行滤波,得到的修正后的频域信号与目标高度角相关。由此提供了另一种获取与目标高度角对应的直达声频域信号的方法。在另一种可能的实现方式中,根据修正后的频域信号获取时域信号包括:根据目标高度角和能量调整函数,确定能量调整系数;根据能量调整系数,对修正后的频域信号进行调整,从而得到调整后的频域信号;将调整后的频域信号进行频时转换,从而得到时域信号。能量调整函数包括对应不同高度角的HRTF信号的频带能量之间的数值关系。依此实施,根据目标高度角和能量调整函数,可以确定能量调整系数。由于能量调整函数包括对应不同高度角的HRTF信号的频带能量之间的数值关系,因此能量调整系数能够表示信号的频带能量分布的差异。根据能量调整系数对修正后的频域信号进行调整,能够将修正后的频域信号的频带能量分布进行调整,从而减少声音在异侧耳谷点消失的问题,优化立体声效果。在另一种可能的实现方式中,根据待渲染BRIR信号,获得直达声信号包括:从待渲染BRIR信号中提取第一时段的信号;对第一时段的信号使用汉宁窗进行处理,从而得到直达声信号。依此实施,使用汉宁窗对第一时段的信号进行加窗处理,可以消除在时频转换过程中的截断效应,减少躯干散射的干扰,提高信号的准确性。另外还可以使用海明窗对第一时段的信号进行加窗处理。在另一种可能的实现方式中,根据待渲染BRIR信号,获得直达声信号包括:从待渲染BRIR信号中提取第一时段的信号;对第一时段的信号使用汉宁窗进行处理,从而得到直达声信号;根据修正后的频域信号获取时域信号包括:将修正后的频域信号的频谱与频谱细节叠加;将叠加得到的频谱对应的信号进行频时转换得到时域信号。频谱细节为第一时段的信号的频谱与直达声信号的频谱的差,其可以表示在加窗过程中损失的音频信号。依此实施,利用频谱细节对修正后的频域信号进行修正,能够增加在加窗过程中损失的音频信号,从而更好的还原BRIR信号,达到更好的仿真效果。在另一种可能的实现方式中,根据待渲染BRIR信号,获得直达声信号包括:从待渲染BRIR信号中提取第一时段的信号;对第一时段的信号使用汉宁窗进行处理,从而得到直达声信号;根据修正后的频域信号获取时域信号包括:将修正后的频域信号的频谱与频谱细节叠加,频谱细节为第一时段的信号的频谱与直达声信号的频谱的差;根据目标高度角和能量调整函数,确定能量调整系数;根据能量调整系数,对叠加得到的频谱对应的信号进行调整,从而得到调整后的频域信号;将调整后的频域信号进行频时转换得到时域信号。能量调整函数包括对应不同高度角的HRTF信号的频带能量之间的数值关系。依此实施,将频谱细节与修正后的频域信号的频谱叠加之后,使用能量调整系数对叠加频谱对应的信号进行调整,能够对叠加频谱对应的信号的频带能量分布进行调整,优化立体声效果。第二方面提供一种音频渲染方法,包括:获取待渲染BRIR信号,待渲染BRIR信号对应的高度角为0度;根据目标高度角,对待渲染BRIR信号对应的频域信号进行修正;将修正后的频域信号进行频时转换,以获得目标高度角的BRIR信号。依此实施,根据目标高度角对待渲染BRIR信号对应的频域信号进行修正,能够得到对应目标本文档来自技高网...

【技术保护点】
1.一种音频渲染方法,其特征在于,包括:/n获取待渲染双耳房间冲激响应BRIR信号,所述待渲染BRIR信号对应的高度角为0度;/n根据所述待渲染BRIR信号,获得直达声信号,所述直达声信号对应所述待渲染BRIR信号对应的时段中的第一时段;/n根据目标高度角,对所述直达声信号对应的频域信号进行修正,以获得对应所述目标高度角的频域信号;/n根据所述目标高度角的频域信号获取时域信号;/n将所述时域信号与所述待渲染BRIR信号中位于所述第一时段之后的第二时段的信号叠加,以获得所述目标高度角的BRIR信号。/n

【技术特征摘要】
1.一种音频渲染方法,其特征在于,包括:
获取待渲染双耳房间冲激响应BRIR信号,所述待渲染BRIR信号对应的高度角为0度;
根据所述待渲染BRIR信号,获得直达声信号,所述直达声信号对应所述待渲染BRIR信号对应的时段中的第一时段;
根据目标高度角,对所述直达声信号对应的频域信号进行修正,以获得对应所述目标高度角的频域信号;
根据所述目标高度角的频域信号获取时域信号;
将所述时域信号与所述待渲染BRIR信号中位于所述第一时段之后的第二时段的信号叠加,以获得所述目标高度角的BRIR信号。


2.根据权利要求1所述的方法,其特征在于,所述根据目标高度角,对所述直达声信号对应的频域信号进行修正包括:
根据所述目标高度角和修正函数,确定修正系数,所述修正函数包括对应不同高度角的HRTF信号的系数之间的数值关系;
根据所述修正系数对所述直达声信号对应的频域信号进行修正,得到所述修正后的频域信号。


3.根据权利要求1所述的方法,其特征在于,所述根据目标高度角,对所述直达声信号对应的频域信号进行修正包括:
根据目标高度角,对所述直达声信号对应的频谱包络中的峰值点或谷点至少一项的信息进行修正,从而得到所述峰值点或谷点至少一项修正后的信息;
根据所述峰值点或谷点至少一项修正后的信息,确定目标滤波器;
使用所述目标滤波器对所述直达声信号进行滤波得到所述修正后的频域信号。


4.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述修正后的频域信号获取时域信号包括:
根据所述目标高度角和能量调整函数,确定能量调整系数,所述能量调整函数包括对应不同高度角的HRTF信号的频带能量之间的数值关系;
根据所述能量调整系数,对所述修正后的频域信号进行调整,从而得到调整后的频域信号;
将所述调整后的频域信号进行频时转换,从而得到所述时域信号。


5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述待渲染BRIR信号,获得直达声信号,包括:
从所述待渲染BRIR信号中提取第一时段的信号;对所述第一时段的信号使用汉宁窗进行处理,从而得到直达声信号。


6.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述待渲染BRIR信号,获得直达声信号包括:
从所述待渲染BRIR信号中提取第一时段的信号;对所述第一时段的信号使用汉宁窗进行处理,从而得到直达声信号;
所述根据所述修正后的频域信号获取时域信号包括:
将所述修正后的频域信号的频谱与频谱细节叠加,所述频谱细节为所述第一时段的信号的频谱与所述直达声信号的频谱的差;
将叠加得到的频谱对应的信号进行频时转换得到所述时域信号。


7.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述待渲染BRIR信号,获得直达声信号包括:
从所述待渲染BRIR信号中提取第一时段的信号;
对所述第一时段的信号使用汉宁窗进行处理,从而得到直达声信号;
所述根据所述修正后的频域信号获取时域信号包括:
将所述修正后的频域信号的频谱与频谱细节叠加,所述频谱细节为所述第一时段的信号的频谱与所述直达声信号的频谱的差;
根据所述目标高度角和能量调整函数,确定能量调整系数,所述能量调整函数包括对应不同高度角的HRTF信号的频带能量之间的数值关系;
根据所述能量调整系数,对叠加得到的频谱对应的信号进行调整,从而得到调整后的频域信号;
将所述调整后的频域信号进行频时转换得到所述时域信号。


8.一种音频渲染方法,其特征在于,包括:
获取待渲染双耳房间冲激响应BRIR信号,所述待渲染BRIR信号对应的高度角为0度;
根据目标高度角,对所述待渲染BRIR信号对应的频域信号进行修正;
将修正后的频域信号进行频时转换,以获得所述目标高度角的BRIR信号。


9.根据权利要求8所述的方法,其特征在于,所述根据目标高度角,对所述待渲染BRIR信号对应的频域信号进行修正包括:
根据所述目标高度角和修正函数,确定修正系数,所述修正函数包括对应不同高度角的HRTF信号的频谱之间的数值对应关系;
将所述修正系数处理所述待渲染BRIR信号对应的频域信号,得到所述修正后的频域信号。


10.一种音频渲染方法,其特征在于,包括:
获取待渲染双耳房间冲激响应BRIR信号,所述待渲染BRIR信号对应的高度角为0度;
获取目标高度角对应的HRTF频谱;
根据所述目标高度角对应的HRTF频谱,对所述待渲染BRIR信号进行修正,以获得所述目标高度角的BRIR信号。

<...

【专利技术属性】
技术研发人员:王宾刘泽新夏日升
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1