基于深度聚类的车辆鸣笛声分类方法及系统技术方案

技术编号:24173679 阅读:44 留言:0更新日期:2020-05-16 03:50
本发明专利技术公开了一种基于深度聚类的车辆鸣笛声分类方法及系统,方法包括:实测交通声音信号数据,并从交通声音信号数据中截取若干单声源车辆鸣笛声信号;基于若干单声源车辆鸣笛声信号,获取混合车辆鸣笛声信号的时频单元矩阵以及该矩阵对应的声源标识矩阵;利用时频单元矩阵以及该矩阵对应的声源标识矩阵优化LSTM神经网络;获取单声源车辆鸣笛声信号的MFCC系数;基于MFCC系数优化BP神经网络;利用优化后的LSTM神经网络和BP神经网络对待分类的混合车辆鸣笛声信号进行分类。系统用于实现上述方法。本发明专利技术可以有效地对来自不同车辆的单声源鸣笛声和混合鸣笛声进行分类,且分类结果准确,性能优良。

【技术实现步骤摘要】
基于深度聚类的车辆鸣笛声分类方法及系统
本专利技术属于非语音识别
,特别涉及一种基于深度聚类的车辆鸣笛声分类方法及系统。
技术介绍
交通鸣笛声是城市交通环境中常见的一类噪声,是城市噪声的主要来源之一,随着中国经济与社会的持续快速发展,交通鸣笛声污染这一问题越来越严重,控制交通鸣笛声的噪声水平势在必行。以往整治违法交通鸣笛声的方式主要是人工辨别,这一方式会消耗大量的人力物力,而且效果往往不够理想。加上道路环境复杂,交通管理人员执法难度大,因此智能化的违法车辆鸣笛声分类识别方法具有重大意义。虽然目前已经出现了一些针对交通鸣笛声分类的方法,但是这些方法只能完成对单声源交通鸣笛声的分类。在真实道路环境下,经常出现多辆车同时鸣笛的情况,现有的交通鸣笛声分类方法对这种情况下产生的交通鸣笛声无能为力,因此,迫切需要新的方法实现针对由多辆车同时鸣笛产生的混合交通鸣笛声的分类。
技术实现思路
本专利技术的目的在于提供一种能实现车辆鸣笛声有效、准确分类的分类方法及系统。实现本专利技术目的的技术解决方案为:一种基于深度聚类的本文档来自技高网...

【技术保护点】
1.一种基于深度聚类的车辆鸣笛声分类方法,其特征在于,包括以下步骤:/n步骤1、实测交通声音信号数据,并从所述交通声音信号数据中截取若干单声源车辆鸣笛声信号;/n步骤2、基于所述若干单声源车辆鸣笛声信号,获取混合车辆鸣笛声信号的时频单元矩阵以及该矩阵对应的声源标识矩阵;/n步骤3、利用所述时频单元矩阵以及该矩阵对应的声源标识矩阵优化LSTM神经网络;/n步骤4、获取所述单声源车辆鸣笛声信号的MFCC系数;/n步骤5、基于MFCC系数优化BP神经网络;/n步骤6、利用所述优化后的LSTM神经网络和BP神经网络对待分类的混合车辆鸣笛声信号进行分类。/n

【技术特征摘要】
1.一种基于深度聚类的车辆鸣笛声分类方法,其特征在于,包括以下步骤:
步骤1、实测交通声音信号数据,并从所述交通声音信号数据中截取若干单声源车辆鸣笛声信号;
步骤2、基于所述若干单声源车辆鸣笛声信号,获取混合车辆鸣笛声信号的时频单元矩阵以及该矩阵对应的声源标识矩阵;
步骤3、利用所述时频单元矩阵以及该矩阵对应的声源标识矩阵优化LSTM神经网络;
步骤4、获取所述单声源车辆鸣笛声信号的MFCC系数;
步骤5、基于MFCC系数优化BP神经网络;
步骤6、利用所述优化后的LSTM神经网络和BP神经网络对待分类的混合车辆鸣笛声信号进行分类。


2.根据权利要求1所述的基于深度聚类的车辆鸣笛声分类方法,其特征在于,步骤2中基于所述若干单声源车辆鸣笛声信号,获取混合车辆鸣笛声信号的时频单元矩阵以及该矩阵对应的声源标识矩阵,具体包括:
步骤2-1、在时域空间,对所述若干单声源车辆鸣笛声信号中的两两单声源车辆鸣笛声信号进行混合,每个混合信号的长度取其对应的两个单声源车辆鸣笛声信号中较短信号的长度;
步骤2-2、对每个混合信号进行采样,并进行短时傅里叶变换,获得该混合信号对应的时频单元矩阵;
步骤2-3、针对时频单元矩阵中的每一个元素,标记该元素对应的单声源车辆鸣笛声信号,由此生成时频单元矩阵对应的声源标识矩阵。


3.根据权利要求2所述的基于深度聚类的车辆鸣笛声分类方法,其特征在于,步骤3中利用所述时频单元矩阵以及该矩阵对应的声源标识矩阵优化LSTM神经网络,具体包括:
步骤3-1、初始化LSTM神经网络中隐藏层的层数和各层的神经元数量、连接权重、阈值以及阈值更新的学习率,并预设迭代次数阈值p;
步骤3-2、将所述时频单元矩阵及其对应的声源标识矩阵划分为训练集与验证集,且采用批处理的方式将训练集输入至初始化后的LSTM神经网络中进行训练,并利用正向传播算法预测所述LSTM神经网络输入数据的嵌入式特征;
步骤3-3、基于所述嵌入式特征,利用反向传播算法更新所述LSTM神经网络中的连接权重、阈值;
步骤3-4、判断当前训练次数n是否等于所述预设迭代次数阈值p,若是,则完成LSTM神经网络的优化;反之执行步骤3-2~步骤3-3。


4.根据权利要求1所述的基于深度聚类的车辆鸣笛声分类方法,其特征在于,步骤4所述获取单声源车辆鸣笛声信号的MFCC系数,具体包括:
步骤4-1、对所述单声源车辆鸣笛声信号进行预加重、短时分帧以及加窗处理;
步骤4-2、对每一帧单声源车辆鸣笛声信号进行快速傅里叶变换,获得该帧单声源车辆鸣笛声信号频谱;
步骤4-3、获取所述单声源车辆鸣笛声信号频谱对应的幅度谱;
步骤4-4、将所述幅度谱输入至Mel滤波器组;
步骤4-5、对所述Mel滤波器组的输出进行对数运算,获得对数能量;
步骤4-6、对所述对数能量进行离散余弦变换,获得MFCC系数。


5.根据权利要求4所述的基于深度聚类的车辆鸣笛声分类方法,其特征在于,步骤5所述基于MFCC系数优化BP神经网络,具体包括:
步骤5-1、初始化BP神经网络中隐藏层的层数和各层的神经元数量、连接权重、阈值以及阈值更新的学习率,并预设迭代次数阈值q;
步骤5-2、根据MFCC系数对应的单声源车辆鸣笛声信号,为每个MFCC系数添加单声源车辆鸣笛声类别标签,将添加有标签的MFCC系数记为输入特征;
步骤5-3、将所述输入特征划分为训练集与验证集,且采用批处理的方式将训练集输入至初始化的BP神经网络中进行训练,并利用正向传播算法预测所述BP神经网络输入数据的类别;
步骤5-4、基于上述预测的类别,利用反向传播算法更新所述BP神经网络中的连接权重、阈值;
步骤5-5、判断当前训练次数m是否等于所述预设迭代次数阈值q,若是,则完成BP神经网络的优化;反之执行步骤5-3~步骤5-4。


6.根据权利要求3或5所述的基于深度聚类的车辆鸣笛声分类方法,其特征在于,步骤6所述利用优化后的LSTM神经网络和BP神经网络对待分类的混合车辆鸣笛声信号进行分类,具体包括:
步骤6-1、对待分类的混合车辆鸣笛声信号进行采样,并进行短时傅里叶变换,获得该待分类的混合车辆鸣笛声信号对应的时频单元矩阵;
步骤6-2、将所述待分类的混合车辆鸣笛声信号对应的时频单元矩阵输入至步骤3优化后的LSTM神经网络,获得嵌入式特征;
步骤6-3、对步骤6-2中的嵌入式特征进行聚类;
步骤6-4、对所述聚类后的结果进行逆短时傅里叶变换,获得若干单声源车辆鸣笛声时域信号;
步骤6-5、按照步骤4的过程,提取步骤6-4所述单声源车辆鸣笛声时域信号的MFCC系数;
步骤6-6、将步骤6-5提取到的MFCC系...

【专利技术属性】
技术研发人员:赵兆庄正高许志勇
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1