一种基于卷积神经网络的汽车鸣笛识别方法技术

技术编号:21895747 阅读:32 留言:0更新日期:2019-08-17 16:02
本发明专利技术提供了一种基于卷积神经网络的汽车鸣笛识别方法,通过空气声呐传感器接收空气中的声音信号,采集大量汽车鸣笛声音和环境背景噪声,通过短时傅里叶变换产生声音信号的声谱图,将变换后的声谱图矩阵分为训练集和验证集输入卷积神经网络进行训练,结合卷积神经网络参数调整,使得基于训练集和验证集的效果达到最佳。最终将待识别声音输入卷积神经网络给出判别结果。本发明专利技术将人工智能技术应用在了智能交通领域,能够准确识别马路上的鸣笛声音。

A Recognition Method of Car Horn Based on Convolutional Neural Network

【技术实现步骤摘要】
一种基于卷积神经网络的汽车鸣笛识别方法
本专利技术属于信号处理领域,涉及神经网络、声信号处理识别等理论。
技术介绍
通过云、大数据和人工智能方法来提升城市舒适度与便捷度,推动城市建设,智慧城市成为当今世界城市发展不可逆转的历史潮流。智慧城市建设过程中,治理机动车乱鸣喇叭是十分重要的一环,违法鸣笛不仅影响了道路周围市民的正常生活,也为文明城市建设制造了不和谐的噪声。各地交警部门投入了大量精力来整治汽车违法鸣笛问题,但治理效果差强人意。究其原因是由于交警部门查处违法鸣笛的方式主要是人工辨别,在嘈杂的马路上人工辨别的难度较大,采样取证更为困难,加大了交警的执法难度,很难取得理想的效果。传统的声音识别算法一般有动态时间规整技术、支持向量机、高斯混合模型以及隐马尔可夫模型等。但是这些识别模型都只是一种符号化系统,降低了建模的能力,因此在实际环境中对不同质量的声音信号的识别性能将会大幅下降。人工神经网络是20世纪80年代以来人工智能领域兴起的研究热点。随着人工神经网络的研究工作不断深入,目前已经取得了很大的进展。将神经网络应用于声音信号的处理,可以解决高维空间和非线性模式等方面的识别问题,适用于对多个信号、特征量维数多的复杂声音的识别。近年来大规模标记数据的出现和GPU计算性能的快速提高使得卷积神经网络在实际环境中应用成为可能。
技术实现思路
为了克服现有技术的不足,本专利技术提供一种基于卷积神经网络的汽车鸣笛识别方法,通过空气声呐传感器接收空气中的声音信号,采集大量汽车鸣笛声音和环境背景噪声,通过短时傅里叶变换产生声音信号的声谱图,将变换后的声谱图矩阵分为训练集和验证集输入卷积神经网络进行训练,结合卷积神经网络参数调整,使得基于训练集和验证集的效果达到最佳。最终将待识别声音输入卷积神经网络给出判别结果。本专利技术解决其技术问题所采用的技术方案包括以下步骤:第一步,采用空气声呐传感器接收多径环境下的声源信号;第二步,对采集到的声源信号进行高通滤波;第三步,对高通滤波后的信号进行短时傅里叶变换;第四步,将第三步处理后得到的数据划分为训练集、验证集和测试集;第五步,构建卷积神经网络并进行训练优化;第六步,将测试集中的数据输入优化后的卷积神经网络,得到识别结果。所述的第二步采用巴特沃斯滤波器对采集到的声源信号进行高通滤波。所述的第三步采用汉宁窗进行信号截取,对高通滤波后的信号进行短时傅里叶变换。所述的第四步采用的划分方法包括留出法、交叉验证法和自助法。所述的第五步,构建卷积神经网络并对超参数进行训练优化,所述的超参数包括学习率、批次大小、迭代次数、卷积核尺寸、步长和激活函数。本专利技术的有益效果是:能够准确识别马路上的鸣笛声音,并记录相应车辆鸣笛声音信号,通过摄像头进行图像获取,辅助交警部门执法取证,解决交警治理违法鸣笛事件执法难、取证更难的痛点。基于卷积神经网络的汽车鸣笛识别方法不仅可以使用大量的训练数据来训练模型,并且比传统机器学习算法具有更好的鲁棒性。因此本专利技术可以有效降低违法鸣笛频率,治理汽车鸣笛噪声污染,对于智慧城市的建设具有深远意义。本专利技术采用较为成熟同时广泛使用的卷积神经网络,成功的将人工智能技术应用在了智能交通领域,推动了该技术在安防、监控等领域的应用与发展。附图说明图1是本专利技术的方法流程图。具体实施方式下面结合附图和实施例对本专利技术进一步说明,本专利技术包括但不仅限于下述实施例。对传统方法声音识别率低的问题,本专利技术提出了一种基于卷积神经网络的汽车鸣笛识别方法,主要步骤如下:第一步:空气声呐传感器接收信号假设在一个多径环境下存在N个声传感器阵元接收声信号,声源信号为正弦信号s,阵列接收信号x的矢量表达式为:x(t)=h(t)*s(t)+n(t)(1)式中,h(t)表示N维的多途信道冲击响应向量,n(t)为N维接收噪声向量,*表示卷积运算,t为时间变量。第二步:高通滤波巴特沃斯滤波器的特点是通频带内的频率响应曲线最大限度平坦,没有起伏,而在阻频带则逐渐下降为零。巴特沃斯低通滤波器可用如下振幅的平方对频率的公式表示:式中,其中,n=滤波器的阶数,ωc为截止频率同时也是振幅下降3分贝时的频率。设计巴特沃斯高通滤波器可先将要设计的技术指标通过某种频率转换关系转换成模拟低通滤波器的技术指标,并依据这些技术指标设计出低通滤波器的转移函数,然后在依据频率转换关系变成所要设计的滤波器的转移函数。通过高通滤波之后可以去除低频成分的噪声,提高识别效果。第三步:短时傅里叶变换短时傅里叶变换是和傅里叶变换相关的一种数学变换,用以确定时变信号其局部区域正弦波的频率与相位。其基本思想是把非平稳过程看成是一系列短时平稳信号的叠加,短时性可通过在时间上加窗实现。短时傅里叶变换可以表示为:式中x(t)代表信号,w(t)为窗函数。为了减少频谱能量泄漏,可采用不同的截取函数对信号进行截断,截断函数称为窗函数,简称为窗。一般来说,短窗能够提供较好的时域解析度,长窗能够提供较好的频域解析度。常用的窗有矩形窗、汉宁窗、海明窗、高斯窗等。汉宁窗主瓣加宽并降低,旁瓣则显著减小,从而使旁瓣互相抵消,消去高频干扰和漏能。汉宁窗表达式:第四步:划分训练集、验证集、测试集从采集的数据中学习模型的过程称为训练,训练过程中使用的数据称为训练数据,所有的训练数据组成了训练集。在模型的反复训练和评估中测试使用的数据集常常称为验证集,来辅助确定最终的模型。确定最终的学习模型后进行预测的过程所使用的数据集称为测试集,并且测试集应当尽量与训练集互斥。对原始数据进行三个数据集的划分,目的是希望学得的模型很好的预测新数据,防止在训练集过拟合,具有更强的泛化能力。常用的划分方法有留出法、交叉验证法和自助法等。留出法:直接将数据集划分为两个互斥的集合,其中一个集合作为训练集,另外一个作为测试集。交叉验证:可将数据集分割成K个子样本,一个单独的子样本被保留作为验证模型的数据,其他K-1个样本用来训练。交叉验证重复K次,每个子样本验证一次,平均K次的结果或者使用其它结合方式,以此来做为评价分类器的性能指标。自助法:每次从数据集D中有放回地采一个样本,并将这个样本放入训练集S中,共重复m次,此时训练集共有m个样本,而测试集T则为D\S。第五步:构建卷积神经网络卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一。卷积神经网络能够进行平移不变分类,其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化特征,擅长处理图像特别是大图像的相关机器学习问题。卷积网络通过一系列方法,成功将数据量庞大的图像识别问题不断降维,最终使其能够被训练。卷积层:卷积层的功能是对输入数据进行特征提取,其内部包含多个卷积核。卷积核的工作原理类似于滤波器,卷积核在工作的时候,会对核内输入特征元素进行卷积操作,然后依次扫过其余特征元素。卷积层的参数包括卷积核的尺寸、移动的步长以及填充方式,三者决定了输出卷积特征的尺寸。激励函数操作通常在卷积核之后,通过引入非线性函数作为激励函数,增强深层神经网络表达复杂特征的能力。整个卷积的过程可以用下式表示:式中yi表示卷积操作之后的特征矩阵,xi表示输入的特征矩阵,Wi式权重矩阵,bi表示偏置项,fc()表示卷积层激活函数,表示本文档来自技高网...

【技术保护点】
1.一种基于卷积神经网络的汽车鸣笛识别方法,其特征在于包括以下步骤:第一步,采用空气声呐传感器接收多径环境下的声源信号;第二步,对采集到的声源信号进行高通滤波;第三步,对高通滤波后的信号进行短时傅里叶变换;第四步,将第三步处理后得到的数据划分为训练集、验证集和测试集;第五步,构建卷积神经网络并进行训练优化;第六步,将测试集中的数据输入优化后的卷积神经网络,得到识别结果。

【技术特征摘要】
1.一种基于卷积神经网络的汽车鸣笛识别方法,其特征在于包括以下步骤:第一步,采用空气声呐传感器接收多径环境下的声源信号;第二步,对采集到的声源信号进行高通滤波;第三步,对高通滤波后的信号进行短时傅里叶变换;第四步,将第三步处理后得到的数据划分为训练集、验证集和测试集;第五步,构建卷积神经网络并进行训练优化;第六步,将测试集中的数据输入优化后的卷积神经网络,得到识别结果。2.根据权利要求1所述的基于卷积神经网络的汽车鸣笛识别方法,其特征在于:所述的第二步采用巴特沃斯滤波器对采集到的声源信...

【专利技术属性】
技术研发人员:陈建峰白吉生项彬
申请(专利权)人:西北工业大学西安联丰迅声信息科技有限责任公司
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1