【技术实现步骤摘要】
一种基于两级模型的个性化头相关传输函数预测方法
[0001]本专利技术涉及一种基于两级模型的个性化头相关传输函数预测方法,属于虚拟三维音频、沉浸式音频
技术介绍
[0002]近年来,以虚拟现实为代表的沉浸式系统一直在不断发展,为了得到更好的沉浸式体验,人们对三维音频的要求逐渐提高。通过对人类听觉系统的研究,目前能够使用头相关传输函数来模拟声音传输到耳朵的过程,通过头相关传输函数能够得到极佳的沉浸式体验。而头相关传输函数与人体密切相关,不同的人的头相关传输函数差异很大,所以需要得到使用者的个性化头相关传输函数。
[0003]一般通过以下几种方法获取个性化头相关传输函数:1、传统声学测量法,通过在无回声环境下将一个或几个扬声器放置在需要测量的方向上,并在听者耳道入口处放置麦克风,记录相应的脉冲响应能够得到听者的头相关传输函数;传统声学测量法需要复杂的实验设备,同时对实验环境要求高。2、数值模拟法,基于声学衍射理论,使用简化的人类模型来确定,例如无头模型、球形头模型、椭圆头模型以及雪人模型;数值模拟法需要精细的人 ...
【技术保护点】
【技术特征摘要】
1.一种基于两级模型的个性化头相关传输函数预测方法,其特征在于:首先,基于提前测量的已知数据库中的人体参数、头相关传输函数数据以及角度信息对决策树模型以及Transformer神经网络模型逐级进行训练,得到训练好的两级模型;然后,采集待预测人员的人体参数,将人体参数作为训练好的两级模型的输入,得到该人员的个性化头相关传输函数数据,由此实现个性化头相关传输函数预测。2.根据权利要求1所述的一种基于两级模型的个性化头相关传输函数预测方法,其特征在于:包括以下步骤,步骤1、获取人体参数数据以及头相关传输函数数据:在已知头相关传输函数数据库中,获取人体参数数据以及多个角度下各个频率点的头相关传输函数幅度值;步骤2、构建并训练决策树模型:构建决策树模型,构建的决策树数量与头相关传输函数频率点数量相同;步骤3、训练Transformer神经网络模型:将步骤2中每一个人在每个角度下的头相关传输函数幅度值中间预测向量以及对应的角度作为输入,将已知头相关传输函数数据库中的对应的头相关传输函数幅度值向量作为输出,对Transformer神经网络模型进行训练;步骤4、构建两...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。