一种基于生成式深度神经网络的多区域声场重建控制方法技术

技术编号:39818570 阅读:8 留言:0更新日期:2023-12-22 19:37
本发明专利技术公开了一种基于生成式深度神经网络的多区域声场重建控制方法,涉及多区域声场重建和汽车分区域声场控制领域,包括:步骤

【技术实现步骤摘要】
一种基于生成式深度神经网络的多区域声场重建控制方法


[0001]本专利技术涉及多区域声场重建和汽车分区域声场控制领域,尤其涉及一种基于生成式深度神经网络的多区域声场重建控制方法


技术介绍

[0002]在共享的空间内,不同的听者常需要不同的节目源,而不同节目源的相互串扰会显著影响听音体验,比如,在车内主驾驶位置通常需要听导航的声音,而其他座位的听众可能需要听歌曲

相声

有声书等娱乐性声音

个人声场多区域控制(
Personal Sound Zone Control

PSZC
)是解决这一问题的有效途径,其主要手段是设计一个用于扬声器阵列的数字滤波器,来优化扬声器阵列的激励信号,使阵列将不同节目源投影到声场不同区域

特定节目源对应的重放区域是亮区(听音区) ,而其余区域对应于此节目源都是暗区(静音区)

阵列优化的目标是使特定节目源在亮区的声重放性能符合预期,同时尽量减少对暗区的声辐射功率

[0003]现有的
PSZC
技术主要分为声学对比控制(
Acoustic Contrast Control

ACC


压力匹配(
Pressure matching

PM


加权压力匹配(
Weight Pressure Matching

WPM


其中,
ACC
法试图在亮区最大化声能,在暗区衰减声能,通过最大化两个区域的声学对比度来设计扬声器阵列的滤波器

基于这一原理,提出了不同形式的
ACC
,包括平均声能比

最大声能差等

这种对比控制方法与各个目标区域声场重建的误差无关,对声场相位没有约束,因此无法控制亮区重建的声场的空间方向
。PM
法主要是基于重建声场与期望声场的误差最小化,并采用最小二乘法减小声压误差,以获得扬声器阵列的滤波器

然而,它忽略了区域间的声学对比,在阵列工作中声能对比度表现不佳
。PM
法和
ACC
法都只关注某一指标,是一种比较极端的方法,因此在一个指标上表现得特别好,而在其他指标上表现得很差
。WPM

ACC
法和
PM
法的结合,通过调整权因子得到扬声器的驱动函数,在声场重建误差和声能对比度之间进行权衡,加权因子在0和1之间

[0004]新的技术方案主要是基于上述三种技术原理进行研究和改进,例如,在时域

子带域

模态域进行阵列的滤波器设计,或者引入一些正则化方法,如
L

曲线,
tikhonov
正则化等,以增强控制的鲁棒性

[0005]马琮淦等人在中国专利技术专利申请“一种用于车内声场分区域的主动控制方法”(申请号为
CN202210691382.1
)中根据听音需求,确定明区和暗区;布置待选扬声器阵列;设置明区控制点

暗区控制点;采用单频信号响应法,获得待选扬声器阵列到明区和暗区控制点的传递函数矩阵;利用遗传算法选择扬声器阵列的最优扬声器数量和位置;利用双重迭代法确定最优控制模型参数值(即亮区,暗区权重)并用于生成实际扬声器阵列的频域驱动信号;通过快速傅里叶逆变换将频域驱动信号转换为时域驱动信号;输入到实际扬声器阵列中,驱动扬声器产生期望的声场

该方法本质上是声压匹配法(
PM
),使用一种迭代求解的方法,即双重迭代法解决这个优化问题

双重迭代法可能受到初始猜测值的选择和收敛性的影响,需要进行适当的调整和验证

同时,传递函数矩阵是预先测量好的,但是车内的声学
混响通常较大,因为车内空间较小且由硬表面构成,这些硬表面会反射声音,导致声音在车内产生多次反射和干涉,从而增加混响效应,并且车内的驾驶员和乘客的活动

移动,也会导致声学传递函数的变化

[0006]赵翔宇等人在中国专利技术专利申请“车内声学系统的音频控制方法

装置

存储介质及设备
”ꢀ
(申请号为
CN202211470705.0
)中根据音频控制指令确定车内声场空间的明区与暗区;根据明区与暗区,确定明区对应的第一控制信号与暗区对应的第二控制信号;控制明区对应的扬声器根据第一控制信号进行音频播放,以及控制暗区对应的扬声器根据第二控制信号进行音频抑制,以在明区与暗区分别播放不同的音频内容,和
/
或在明区与暗区分别播放不同的音频音量,达到个性化的空间声场的效果

该方法是加权声压匹配法(
WPM
),用优化算法求解,存在局部最优解的情况

[0007]李辉等人在中国专利技术专利申请“一种车内声场分区调控方法

系统及车辆”(申请号为
CN202310428487.2
)中根据需要播放声音
A(t)
得到车内扬声器系统的时域驱动信号;将需要播放声音
A(t)
作为主动控制的参考信号,将实时采集的车内各声场区域的车内声信号作为主动控制的误差信号;根据误差信号和参考信号生成扬声器系统的时域补偿信号;最后将扬声器系统的时域驱动信号与时域补偿信号进行信号叠加,加载给各个扬声器发声,在需要播放声音的明区生成期望的声音,在不需要播放声音的暗区生成零信号

该方法是一种声能对比度(
ACC
)算法,存在矩阵求逆的问题

虽然结合主动控制的方法,但是,没有明确说明主动控制的详细控制策略

而且,在车内四个乘客区域布置声传感器并不能真的测量四个乘客区域的声音信号,只能测量到区域的部分点,并不能完全表征区域信号,这样的主动控制,可能导致测量点的效果很好,但是听音区域的其他点的效果下降

[0008]上述方法都是在信号处理的领域进行改进,没有利用深度学习的方法,存在以下技术问题:问题1:声对比度和重建误差是相互制衡的一对指标,声对比度提高,重建误差肯定也会变大,反之,亦然

尽管研究者们进行了各种优化求解,但是还是受到求解过程的限制,无法做到完全的分区控制

[0009]问题2:这些方法均存在传递函数矩阵的测量问题

传递函数矩阵的测量会影响分区的性能

传递函数矩阵依赖测量点的位置

个数以及扬声器本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于生成式深度神经网络的多区域声场重建控制方法,其特征在于,所述方法包括以下步骤:步骤
1、
设置若干个多区域声场重建控制的目标区域,所述每个目标区域使用麦克风阵列,所述麦克风阵列最少包含一个麦克风;测量所述每个目标区域的传递函数矩阵,并通过插值和仿真操作来增加所述每个目标区域的传递函数矩阵的数量,得到最终的所述每个目标区域的传递函数矩阵;步骤
2、
为所述每个目标区域设置通过扬声器阵列模拟出来的虚拟声源,并根据所述每个目标区域和所述虚拟声源的位置关系,得到所述每个目标区域中的期望声场;步骤
3、
设计包括编码器

解码器和隐向量层的生成式深度神经网络,其中,所述隐向量层位于所述编码器和所述解码器之间,通过控制所述隐向量层得到所述扬声器阵列的滤波器或者驱动信号;所述编码器和所述解码器包括若干不同类型的神经网络层,所述神经网络层可以为全连接层

卷积层和池化层;步骤
4、
将所述每个目标区域中的期望声场作为输入,对所述生成式深度神经网络进行训练,得到重建的声场数据,通过比较所述重建的声场数据和所述每个目标区域中的期望声场的数据之间的差异来计算损失函数,并根据所述损失函数的计算结果,使用反向传播算法更新所述生成式深度神经网络的参数,再经过若干轮的迭代训练,最后所述生成式深度神经网络收敛,完成训练;步骤
5、
使用所述生成式深度神经网络生成所述扬声器阵列的所述滤波器或所述驱动信号
。2.
如权利要求1所述的基于生成式深度神经网络的多区域声场重建控制方法,其特征在于,所述步骤1包括以下子步骤:步骤
1.1、
设置若干个多区域声场重建控制的所述目标区域,所述目标区域的数量大于等于1;步骤
1.2、
通过在所述每个目标区域中设置麦克风阵列来对所述每个目标区域进行空间采样,所述麦克风阵列至少包含一个麦克风,接收所述扬声器阵列中每一个阵元依次发出的扫频信号,得到所述每个目标区域的传递函数矩阵;步骤
1.3、
通过插值和仿真操作来增加所述每个目标区域的传递函数矩阵的数量,得到最终的所述每个目标区域的传递函数矩阵
。3.
如权利要求2所述的基于生成式深度神经网络的多区域声场重建控制方法,其特征在于,所述步骤
1.2
中包括以下子步骤:步骤
1.2.1、
所述扬声器阵列发送一段频率连续变化的所述扫频信号,记为发送信号,所述发送信号的频率范围可根据实际需要进行选择;步骤
1.2.2、
所述麦克风阵列接收所述发送信号,接收到的所述发送信号包含所述发送信号在传递过程中受到的影响,记为接收信号;步骤
1.2.3、
对所述接收信号进行频域分析,得到在不同频率下的幅度和相位信息;步骤
1.2.4、
将所述发送信号和所述接收信号的频域表示进行比较,得到所述每个目标区域的传递函数矩阵
。4.
如权利要求1所述的基于生成式深度神经网络的多区域声场重建控制方法,其特征在于,所述步骤2包括以下子步骤:
步骤
2.1、
为所述每个目标区域设置通过所述扬声器阵列模拟出来的所述虚拟声源;步骤
2.2、
所述每个目标区域包含若干个不同的所述虚拟声源的位置;步骤
2.3、
根据所述每个目标区域和所述虚拟声源的位置关系,同时约束所述目标区域之间的声对比度
ACC
,...

【专利技术属性】
技术研发人员:卫慧慧徐晨裴国锦杨根科褚健
申请(专利权)人:上海交通大学宁波人工智能研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1