System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及音频混响,特别涉及一种音频处理方法及系统、电子设备。
技术介绍
1、声音在不同声学场景内传播时,由于空间大小、反射面材质的不同,会产生不同的混响效果。人主要通过混响的细节来感知其所在的声学场景,判断当前所处空间的大小,如处于录音室、音乐厅或体育馆等等。
2、从声源通过最短路径到达人耳的声音,称为直达声。此外,声音会通过在空间中的多次反射,形成混响信号。混响信号又分为早期反射(early reflection)和晚期混响(latereverb)。早期反射指的是只经过一两次反射的声音,晚期混响是指经过多次反射形成的声音集合。
3、在音效设计中,现有技术通常会通过在原始音频中叠加特定的混响信号,虚拟在不同声学场景的听音效果。
4、常见的混响生成方法包括卷积混响方法以及人工混响方法。卷积混响方法,是指通过在实际场景测量该场景的房间冲击响应(room impulse response,rir),然后在音效生成时将目标音频和rir进行卷积操作,重现对应的混响效果。卷积混响方法可以生成真实的混淆效果,但其复杂度较高。人工混响方法,是指通过模型的方法来模拟混响的生成,包括早期放射、晚期混响、时间延迟和频率衰减特性等,仿真目标场景的混响效果。人工混响方法较为灵活且复杂度低。
5、现有技术提出了一种车内环境的虚拟声学场景解决方案,该方案中,输入麦克风信号和音乐信号经过前处理模块处理后得到人工混响所需输入信号,再利用混响生成算法对该输入信号进行处理得到多通道人工混响信号,最后通过时延、增益控制
6、然而,现有技术中的上述解决方案算法模块和参数众多,实际应用中需要对每个目标虚拟场景进行单独调音,不仅需要较多的专家经验支持,还无法满足灵活多样的场景需求。
技术实现思路
1、本公开旨在至少解决现有技术中存在的问题之一,提供一种音频处理方法及系统、电子设备。
2、本公开的一个方面,提供了一种音频处理方法,所述音频处理方法包括:
3、基于预设调音场景对应的调音参数,确定目标调音场景的目标调音参数;其中,所述调音参数基于对应的所述预设调音场景的空间大小映射所得到的调整值得到;
4、基于所述目标调音参数,对输入音频信号进行混响调音处理,得到所述目标调音场景的最终混响音频信号。
5、可选地,所述基于预设调音场景对应的调音参数,确定目标调音场景的目标调音参数,包括:
6、基于所述目标调音场景,从预设调音场景中选取出第一候选调音场景和第二候选调音场景;其中,所述第一候选调音场景的调整值不大于所述目标调音场景的调整值,所述第二候选调音场景的调整值不小于所述目标调音场景的调整值;
7、基于所述第一候选调音场景的调整值及其对应的调音参数以及所述第二候选调音场景的调整值及其对应的调音参数进行插值处理,得到所述目标调音场景的目标调音参数。
8、可选地,所述第一候选调音场景为调整值不大于所述目标调音场景的调整值的所述预设调音场景中调整值最大的调音场景;
9、所述第二候选调音场景为调整值不小于所述目标调音场景的调整值的所述预设调音场景中调整值最小的调音场景。
10、可选地,所述基于所述第一候选调音场景的调整值及其对应的调音参数以及所述第二候选调音场景的调整值及其对应的调音参数进行插值处理,得到所述目标调音场景的目标调音参数,包括:
11、根据下式(1)确定所述目标调音场景的目标调音参数:
12、p(vt)=(vt-vi)/(vj-vi)*(p(vj)-p(vi))+p(vi)(1)
13、其中,p(vt)表示目标调音场景t的调整值vt对应的目标调音参数,p(vi)表示第一候选调音场景i的调整值vi对应的调音参数,p(vj)表示第二候选调音场景j的调整值vj对应的调音参数。
14、可选地,所述基于预设调音场景对应的调音参数,确定目标调音场景的目标调音参数,包括:
15、基于所述预设调音场景,通过对应的房间冲激响应得到关键声学参数的调音参数估计值;
16、基于所述调音参数估计值,得到所述目标调音场景的中间调音参数;
17、基于所述中间调音参数和预先训练好的调音参数预测模型,得到所述目标调音场景的目标调音参数。
18、可选地,所述基于所述调音参数估计值,得到所述目标调音场景的中间调音参数,包括:
19、基于所述目标调音场景,从预设调音场景中选取出第一中间调音场景和第二中间调音场景;其中,所述第一中间调音场景的调整值不大于所述目标调音场景的调整值,所述第二中间调音场景的调整值不小于所述目标调音场景的调整值;
20、基于所述第一中间调音场景的调整值及其对应的调音参数估计值以及所述第二中间调音场景的调整值及其对应的调音参数估计值进行插值处理,得到所述目标调音场景的中间调音参数。
21、可选地,所述调音参数预测模型根据以下步骤训练得到:
22、基于所述预设调音场景对应的调音参数及其对应的所述调音参数估计值,生成训练数据;
23、将所述训练数据中的所述调音参数估计值作为输入,所述训练数据中的所述调音参数作为输出,对所述调音参数预测模型进行训练,得到所述预先训练好的调音参数预测模型。
24、可选地,所述基于所述目标调音参数,对输入音频信号进行混响调音处理,得到所述目标调音场景的最终混响音频信号,包括:
25、基于所述目标调音参数中的前处理参数,对所述输入音频信号进行前处理,得到混响输入信号;
26、基于所述目标调音参数中的混响参数,对所述混响输入信号进行混响处理,生成所述目标调音场景的初始混响音频信号;
27、基于所述目标调音参数中的加权混合参数,对所述输入音频信号中的干声信号和所述初始混响音频信号按照预设比例进行加权混合处理,得到所述目标调音场景的中间混响音频信号;
28、基于所述目标调音参数中的系统调音参数,对所述中间混响音频信号进行系统调音处理,得到所述目标调音场景的最终混响音频信号。
29、本公开的另一个方面,提供了一种音频处理系统,所述音频处理系统包括:
30、参数控制模块,用于基于预设调音场景对应的调音参数,确定目标调音场景的目标调音参数;其中,所述调音参数基于对应的所述预设调音场景的空间大小映射所得到的调整值得到;
31、音频生成模块,用于基于所述目标调音参数,对输入音频信号进行混响调音处理,得到所述目标调音场景的最终混响音频信号。
32、可选地,所述参数控制模块,用于基于预设调音场景对应的调音参数,确定目标调音场景的目标调音参数,包括:
33、所述参数控制模块,用于:
34、基于所述目标调音场景,从预设调音场景中选取出第一本文档来自技高网...
【技术保护点】
1.一种音频处理方法,其特征在于,所述音频处理方法包括:
2.根据权利要求1所述的音频处理方法,其特征在于,所述基于预设调音场景对应的调音参数,确定目标调音场景的目标调音参数,包括:
3.根据权利要求2所述的音频处理方法,其特征在于,
4.根据权利要求2所述的音频处理方法,其特征在于,所述基于所述第一候选调音场景的调整值及其对应的调音参数以及所述第二候选调音场景的调整值及其对应的调音参数进行插值处理,得到所述目标调音场景的目标调音参数,包括:
5.根据权利要求1所述的音频处理方法,其特征在于,所述基于预设调音场景对应的调音参数,确定目标调音场景的目标调音参数,包括:
6.根据权利要求5所述的音频处理方法,其特征在于,所述基于所述调音参数估计值,得到所述目标调音场景的中间调音参数,包括:
7.根据权利要求5所述的音频处理方法,其特征在于,所述调音参数预测模型根据以下步骤训练得到:
8.根据权利要求1至7任一项所述的音频处理方法,其特征在于,所述基于所述目标调音参数,对输入音频信号进行混响调音处理,得
9.一种音频处理系统,其特征在于,所述音频处理系统包括:
10.一种电子设备,其特征在于,包括:
...【技术特征摘要】
1.一种音频处理方法,其特征在于,所述音频处理方法包括:
2.根据权利要求1所述的音频处理方法,其特征在于,所述基于预设调音场景对应的调音参数,确定目标调音场景的目标调音参数,包括:
3.根据权利要求2所述的音频处理方法,其特征在于,
4.根据权利要求2所述的音频处理方法,其特征在于,所述基于所述第一候选调音场景的调整值及其对应的调音参数以及所述第二候选调音场景的调整值及其对应的调音参数进行插值处理,得到所述目标调音场景的目标调音参数,包括:
5.根据权利要求1所述的音频处理方法,其特征在于,所述基于预设调音场景对应的调音参数...
【专利技术属性】
技术研发人员:陈联武,李旭阳,孙学京,
申请(专利权)人:瑞声开泰声学科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。