一种音频信号时序对齐方法和装置制造方法及图纸

技术编号:28055445 阅读:48 留言:0更新日期:2021-04-14 13:24
本申请公开了一种音频信号时序对齐方法和装置。其中方法包括:为待对齐音频信号和模板音频信号分别生成频域图像;将频域图像分别输入到时序偏移量预测模型的双生神经网络中,得到双生神经网络输出的两个频域特征;将两个频域特征进行融合,得到融合特征;将融合特征输入到时序偏移量预测模型的预测网络中,得到预测网络输出的时序偏移量;根据时序偏移量对待对齐音频信号进行时序对齐处理。该技术方案利用深度神经网络从待对齐音频信号和模板音频信号的频域图像中进行特征提取,相较于传统的人工特征方法,鲁棒性更好,特别是在多噪声环境下,深度神经网络提取的特征更具有本质性,稳定性更好;端到端的时序偏移量预测模型精度更高,速度更快。速度更快。速度更快。

【技术实现步骤摘要】
一种音频信号时序对齐方法和装置


[0001]本申请涉及音频信号处理
,尤其涉及一种音频信号时序对齐方法和装置。

技术介绍

[0002]在工业生产过程中,通过分析生产设备所产生的音频信号是否异常,可以及发现设备产生的故障,避免发生事故。如在铁路运输过程中,通过检测列车运行过程中车轮与轨道异常声音,可以及时发现轨道或车轮的损伤,从而及时更换损伤设备,避免车轮运行事故的发生。
[0003]此外,在声学设备的生产过程中,通过播放特定的不同频段的声音信号,可以分析判断声学设备是否有故障,以及分析出故障发生的频段和时间,以改进生产工艺提升整体产品的品质。
[0004]一般地,采集被检设备产生的一段音频信号序列,将其与标准信号序列进行比对,能够判断出异常信号产生的位置。但由于采集设备或者操作的原因,设备采集的信号与原始信号通常存在着时序不匹配的情况,因而有必要对采集的信号序列与标准信号序列进行对齐操作,以方便后续的进一步处理。

技术实现思路

[0005]本申请实施例提供了一种音频信号时序对齐方法和装置,以利用深度神经网络本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种音频信号时序对齐方法,包括:为待对齐音频信号和模板音频信号分别生成频域图像;将所述频域图像分别输入到时序偏移量预测模型的双生神经网络中,得到所述双生神经网络输出的两个频域特征;将所述两个频域特征进行融合,得到融合特征;将所述融合特征输入到时序偏移量预测模型的预测网络中,得到所述预测网络输出的时序偏移量;根据所述时序偏移量对所述待对齐音频信号进行时序对齐处理。2.如权利要求1所述的方法,其特征在于,所述为待对齐音频信号和模板音频信号分别生成频域图像包括:根据所述模板音频信号的时长,对所述待对齐音频信号进行剪切,使剪切后的待对齐音频信号的时长与所述模板音频信号的时长相一致;为剪切后的待对齐音频信号和所述模板音频信号分别生成频域图像。3.如权利要求1所述的方法,其特征在于,所述为待对齐音频信号和模板音频信号分别生成频域图像包括:利用快速傅里叶变换法为所述待对齐音频信号和所述模板音频信号分别生成频域图像。4.如权利要求1所述的方法,其特征在于,所述将所述两个频域特征进行融合,得到融合特征包括:将所述两个频域特征进行拼接,得到融合特征;所述根据所述时序偏移量对所述待对齐音频信号进行时序对齐处理包括:根据所述两个频域特征在拼接时的先后顺序,确定所述时序偏移量的使用方式。5.如权利要求1所述的方法,其特征在于,所述将所述融合特征输入到时序偏移量预测模型的预测网络中,得到所述预测网络输出的时序偏移量包括:由所述预测网络的全连接层对所述融合特征进行全连接处理,得到全连接特征;由所述预测网络的F...

【专利技术属性】
技术研发人员:邹李兵张一凡王学强张富强
申请(专利权)人:歌尔股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1