【技术实现步骤摘要】
一种基于生成式深度神经网络的多区域声场重建控制方法
[0001]本专利技术涉及多区域声场重建和汽车分区域声场控制领域,尤其涉及一种基于生成式深度神经网络的多区域声场重建控制方法
。
技术介绍
[0002]在共享的空间内,不同的听者常需要不同的节目源,而不同节目源的相互串扰会显著影响听音体验,比如,在车内主驾驶位置通常需要听导航的声音,而其他座位的听众可能需要听歌曲
、
相声
、
有声书等娱乐性声音
。
个人声场多区域控制(
Personal Sound Zone Control
,
PSZC
)是解决这一问题的有效途径,其主要手段是设计一个用于扬声器阵列的数字滤波器,来优化扬声器阵列的激励信号,使阵列将不同节目源投影到声场不同区域
。
特定节目源对应的重放区域是亮区(听音区) ,而其余区域对应于此节目源都是暗区(静音区)
。
阵列优化的目标是使特定节目源在亮区的声重放性能符合预期,同时尽量减少对暗区的声辐射功率
。
[0003]现有的
PSZC
技术主要分为声学对比控制(
Acoustic Contrast Control
,
ACC
)
、
压力匹配(
Pressure matching
,
PM
)
、
加权压力匹配(
Weight Pressure Match ...
【技术保护点】
【技术特征摘要】
1.
一种基于生成式深度神经网络的多区域声场重建控制方法,其特征在于,所述方法包括以下步骤:步骤
1、
设置若干个多区域声场重建控制的目标区域,所述每个目标区域使用麦克风阵列,所述麦克风阵列最少包含一个麦克风;测量所述每个目标区域的传递函数矩阵,并通过插值和仿真操作来增加所述每个目标区域的传递函数矩阵的数量,得到最终的所述每个目标区域的传递函数矩阵;步骤
2、
为所述每个目标区域设置通过扬声器阵列模拟出来的虚拟声源,并根据所述每个目标区域和所述虚拟声源的位置关系,得到所述每个目标区域中的期望声场;步骤
3、
设计包括编码器
、
解码器和隐向量层的生成式深度神经网络,其中,所述隐向量层位于所述编码器和所述解码器之间,通过控制所述隐向量层得到所述扬声器阵列的滤波器或者驱动信号;所述编码器和所述解码器包括若干不同类型的神经网络层,所述神经网络层可以为全连接层
、
卷积层和池化层;步骤
4、
将所述每个目标区域中的期望声场作为输入,对所述生成式深度神经网络进行训练,得到重建的声场数据,通过比较所述重建的声场数据和所述每个目标区域中的期望声场的数据之间的差异来计算损失函数,并根据所述损失函数的计算结果,使用反向传播算法更新所述生成式深度神经网络的参数,再经过若干轮的迭代训练,最后所述生成式深度神经网络收敛,完成训练;步骤
5、
使用所述生成式深度神经网络生成所述扬声器阵列的所述滤波器或所述驱动信号
。2.
如权利要求1所述的基于生成式深度神经网络的多区域声场重建控制方法,其特征在于,所述步骤1包括以下子步骤:步骤
1.1、
设置若干个多区域声场重建控制的所述目标区域,所述目标区域的数量大于等于1;步骤
1.2、
通过在所述每个目标区域中设置麦克风阵列来对所述每个目标区域进行空间采样,所述麦克风阵列至少包含一个麦克风,接收所述扬声器阵列中每一个阵元依次发出的扫频信号,得到所述每个目标区域的传递函数矩阵;步骤
1.3、
通过插值和仿真操作来增加所述每个目标区域的传递函数矩阵的数量,得到最终的所述每个目标区域的传递函数矩阵
。3.
如权利要求2所述的基于生成式深度神经网络的多区域声场重建控制方法,其特征在于,所述步骤
1.2
中包括以下子步骤:步骤
1.2.1、
所述扬声器阵列发送一段频率连续变化的所述扫频信号,记为发送信号,所述发送信号的频率范围可根据实际需要进行选择;步骤
1.2.2、
所述麦克风阵列接收所述发送信号,接收到的所述发送信号包含所述发送信号在传递过程中受到的影响,记为接收信号;步骤
1.2.3、
对所述接收信号进行频域分析,得到在不同频率下的幅度和相位信息;步骤
1.2.4、
将所述发送信号和所述接收信号的频域表示进行比较,得到所述每个目标区域的传递函数矩阵
。4.
如权利要求1所述的基于生成式深度神经网络的多区域声场重建控制方法,其特征在于,所述步骤2包括以下子步骤:
步骤
2.1、
为所述每个目标区域设置通过所述扬声器阵列模拟出来的所述虚拟声源;步骤
2.2、
所述每个目标区域包含若干个不同的所述虚拟声源的位置;步骤
2.3、
根据所述每个目标区域和所述虚拟声源的位置关系,同时约束所述目标区域之间的声对比度
ACC
,...
【专利技术属性】
技术研发人员:卫慧慧,徐晨,裴国锦,杨根科,褚健,
申请(专利权)人:上海交通大学宁波人工智能研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。