一种音频渲染方法及装置制造方法及图纸

技术编号：24041843 阅读：26 留言：0更新日期：2020-05-07 03:40

本申请提供一种音频渲染方法，包括：获取待渲染BRIR信号，待渲染BRIR信号对应的高度角为0度；根据待渲染BRIR信号获得直达声信号；根据目标高度角，对直达声信号对应的频域信号进行修正，以获得对应目标高度角的频域信号；根据目标高度角的频域信号获取时域信号；将时域信号与待渲染BRIR信号中位于第一时段之后的第二时段的信号叠加，以获得目标高度角的BRIR信号。由于根据目标高度角的频域信号获得的时域信号与目标高度角存在对应关系，第二时段的信号能够体现出环境反射导致的音频变换，因此两者合成的BRIR信号为立体声的BRIR信号。本申请还提供一种能实现以上音频渲染方法的音频渲染装置。

An audio rendering method and device

全部详细技术资料下载

【技术实现步骤摘要】
一种音频渲染方法及装置
本申请涉及音频处理领域，尤其涉及一种音频渲染方法以及装置。
技术介绍
三维音频是指通过模拟真实声源在两耳的声场，使听者感觉到声音来自立体空间的声源的音频处理技术。头部相关传递函数(headrelatedtransferfunction，HRTF)是一种音频处理技术，用于模拟在自由场条件下声源到耳膜之间的音频信号变换，其包括头、耳廓、肩等对声音传输的影响。在实际环境中，耳朵听到的声音不仅包括从声源直接到达耳膜的声音，还包括经过环境反射到达耳膜的声音。为了模拟完整的声音，现有技术提供双耳房间冲激响应(binauralroomimpulseresponse，BRIR)，用于表示在房间内从声源到双耳的音频信号变换。现有BRIR渲染方法大致如下：以一个单声道信号或者立体声信号作为输入音频信号，根据虚拟声源的方位角选择对应的BRIR函数，根据该BRIR函数对输入音频信号进行渲染得到目标音频信号。但是，现有BRIR渲染方法仅考虑了同一水平面的不同方位角的影响，不考虑虚拟声源的高度角，因此不能对立体空间的声音进行准确渲染。
技术实现思路
有鉴于此，本申请提供一种基于双耳的音频处理方法和音频处理装置，用于对立体空间的音频进行准确渲染。第一方面提供一种音频渲染方法，包括：获取待渲染BRIR信号，待渲染BRIR信号对应的高度角为0度；根据待渲染BRIR信号获得直达声信号；根据目标高度角，对直达声信号对应的频域信号进行修正，以获得对应目标高度角的频域信号；根据修正后的频域信号获取时域信号；...

【技术保护点】
1.一种音频渲染方法，其特征在于，包括：/n获取待渲染双耳房间冲激响应BRIR信号，所述待渲染BRIR信号对应的高度角为0度；/n根据所述待渲染BRIR信号，获得直达声信号，所述直达声信号对应所述待渲染BRIR信号对应的时段中的第一时段；/n根据目标高度角，对所述直达声信号对应的频域信号进行修正，以获得对应所述目标高度角的频域信号；/n根据所述目标高度角的频域信号获取时域信号；/n将所述时域信号与所述待渲染BRIR信号中位于所述第一时段之后的第二时段的信号叠加，以获得所述目标高度角的BRIR信号。/n

【技术特征摘要】
1.一种音频渲染方法，其特征在于，包括：
获取待渲染双耳房间冲激响应BRIR信号，所述待渲染BRIR信号对应的高度角为0度；
根据所述待渲染BRIR信号，获得直达声信号，所述直达声信号对应所述待渲染BRIR信号对应的时段中的第一时段；
根据目标高度角，对所述直达声信号对应的频域信号进行修正，以获得对应所述目标高度角的频域信号；
根据所述目标高度角的频域信号获取时域信号；
将所述时域信号与所述待渲染BRIR信号中位于所述第一时段之后的第二时段的信号叠加，以获得所述目标高度角的BRIR信号。

2.根据权利要求1所述的方法，其特征在于，所述根据目标高度角，对所述直达声信号对应的频域信号进行修正包括：
根据所述目标高度角和修正函数，确定修正系数，所述修正函数包括对应不同高度角的HRTF信号的系数之间的数值关系；
根据所述修正系数对所述直达声信号对应的频域信号进行修正，得到所述修正后的频域信号。

3.根据权利要求1所述的方法，其特征在于，所述根据目标高度角，对所述直达声信号对应的频域信号进行修正包括：
根据目标高度角，对所述直达声信号对应的频谱包络中的峰值点或谷点至少一项的信息进行修正，从而得到所述峰值点或谷点至少一项修正后的信息；
根据所述峰值点或谷点至少一项修正后的信息，确定目标滤波器；
使用所述目标滤波器对所述直达声信号进行滤波得到所述修正后的频域信号。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述根据所述修正后的频域信号获取时域信号包括：
根据所述目标高度角和能量调整函数，确定能量调整系数，所述能量调整函数包括对应不同高度角的HRTF信号的频带能量之间的数值关系；
根据所述能量调整系数，对所述修正后的频域信号进行调整，从而得到调整后的频域信号；
将所述调整后的频域信号进行频时转换，从而得到所述时域信号。

5.根据权利要求1至4任一项所述的方法，其特征在于，所述根据所述待渲染BRIR信号，获得直达声信号，包括：
从所述待渲染BRIR信号中提取第一时段的信号；对所述第一时段的信号使用汉宁窗进行处理，从而得到直达声信号。

6.根据权利要求1至3任一项所述的方法，其特征在于，所述根据所述待渲染BRIR信号，获得直达声信号包括：
从所述待渲染BRIR信号中提取第一时段的信号；对所述第一时段的信号使用汉宁窗进行处理，从而得到直达声信号；
所述根据所述修正后的频域信号获取时域信号包括：
将所述修正后的频域信号的频谱与频谱细节叠加，所述频谱细节为所述第一时段的信号的频谱与所述直达声信号的频谱的差；
将叠加得到的频谱对应的信号进行频时转换得到所述时域信号。

7.根据权利要求1至3任一项所述的方法，其特征在于，所述根据所述待渲染BRIR信号，获得直达声信号包括：
从所述待渲染BRIR信号中提取第一时段的信号；
对所述第一时段的信号使用汉宁窗进行处理，从而得到直达声信号；
所述根据所述修正后的频域信号获取时域信号包括：
将所述修正后的频域信号的频谱与频谱细节叠加，所述频谱细节为所述第一时段的信号的频谱与所述直达声信号的频谱的差；
根据所述目标高度角和能量调整函数，确定能量调整系数，所述能量调整函数包括对应不同高度角的HRTF信号的频带能量之间的数值关系；
根据所述能量调整系数，对叠加得到的频谱对应的信号进行调整，从而得到调整后的频域信号；
将所述调整后的频域信号进行频时转换得到所述时域信号。

8.一种音频渲染方法，其特征在于，包括：
获取待渲染双耳房间冲激响应BRIR信号，所述待渲染BRIR信号对应的高度角为0度；
根据目标高度角，对所述待渲染BRIR信号对应的频域信号进行修正；
将修正后的频域信号进行频时转换，以获得所述目标高度角的BRIR信号。

9.根据权利要求8所述的方法，其特征在于，所述根据目标高度角，对所述待渲染BRIR信号对应的频域信号进行修正包括：
根据所述目标高度角和修正函数，确定修正系数，所述修正函数包括对应不同高度角的HRTF信号的频谱之间的数值对应关系；
将所述修正系数处理所述待渲染BRIR信号对应的频域信号，得到所述修正后的频域信号。

10.一种音频渲染方法，其特征在于，包括：
获取待渲染双耳房间冲激响应BRIR信号，所述待渲染BRIR信号对应的高度角为0度；
获取目标高度角对应的HRTF频谱；
根据所述目标高度角对应的HRTF频谱，对所述待渲染BRIR信号进行修正，以获得所述目标高度角的BRIR信号。

<...

【专利技术属性】
技术研发人员：王宾，刘泽新，夏日升，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人