一种基于深度学习的车辆鸣笛定位方法及系统技术方案

技术编号:38463700 阅读:11 留言:0更新日期:2023-08-11 14:40
本发明专利技术提供一种基于深度学习的车辆鸣笛定位方法及系统,包括以下步骤:S1:在路口设置麦克风阵列,通过麦克风阵列获取声音信号;S2:构建声源识别网络,通过声源识别网络对声音信号进行鸣笛识别,获得鸣笛声源;S3:通过到达时间差定位法对鸣笛声源进行定位,获得鸣笛声源的空间位置。本发明专利技术创新性的提出了一种用于鸣笛定位的深度学习声源识别网络模型,该网络模型包括特征提取模块、注意力模块和全连接模块;通过特征提取模块和注意力模块对输入的四通道MFCC特征进行多路特征的提取和融合,学习出对声源识别任务最重要的信息,有效提升了模型的识别效率和准确度。型的识别效率和准确度。型的识别效率和准确度。

【技术实现步骤摘要】
一种基于深度学习的车辆鸣笛定位方法及系统


[0001]本专利技术涉及声信号分类识别领域,尤其涉及一种基于深度学习的车辆鸣笛定位方法及系统。

技术介绍

[0002]随着对声学研究的深入,研究人员发现可以通过声音识别并对声源定位来实现对违法鸣笛的抓拍,近年来陆续在违法鸣笛抓拍上取得了一些进步,也有一些应用于实际道路上。对于违法鸣笛抓拍系统来说,都是通过麦克风对环境声音进行识别,然后再通过麦克风阵列对声源进行定位,从而识别出违法鸣笛的车辆。
[0003]常用的声源定位技术有三种:基于到达时间差、基于可控波束形成和基于高分辨率谱估计。基于到达时间差的方法有两步,首先分析麦克风接收到的信号的时间,互相关求出差值,然后根据麦克风阵型,几何空间变换推导出声源位置。此方法计算量小,运算速度快,缺点是受噪声影响大以及多声源时会降低性能。可控波束形成是对阵列的输出信号加权求和形成波束,再通过不同的加权引导波束,此时指向的输出功率最大的点即为声源的位置。此方法也已经广泛应用于声源定位领域,但是由于需要搜索全局,计算量大,实时性不好,实际使用中通常用一些迭代方法来减小运算量。高分辨率谱估计方法主要包括多重信号分类(MUSIC)、自回归模型(AR)、最小方差谱估计(MV)等算法,其中以MUSIC算法为代表,其利用了信号子空间和噪声子空间的正交性,构造空间谱函数,然后搜索谱峰,得到DOA。在实际中运用时,若想达到较理想的精度,计算量会很大,并且需要较多的初值条件。还有此方法对环境噪声敏感,抗噪能力差,因此现代声源定位系统中采用高分辨率谱估计方法的较少。
[0004]在传统声源定位算法中,也有许多改进的方法,可以在复杂环境内提高一定的抗干扰能力。但在混响极其严重,或者信噪比很小的情况下,传统的声源定位方法效果有待提升,尤其是当麦克风阵列不能获得声源信号的直达声时,系统的定位能力会非常差。并且,目前多数CNN对输入进行特征提取时,对输入信息进行平均并没有突出关键信息。因此,CNN在面对复杂问题时存在速率慢、精确度不高的缺点,除此以外,受到长时信息存储的限制,网络往往不能有效处理长时间序列信息。

技术实现思路

[0005]为解决上述技术问题,本专利技术提供一种基于深度学习的车辆鸣笛定位方法,包括以下步骤:S1:在路口设置麦克风阵列,通过麦克风阵列获取路口的声音信号;S2:构建声源识别网络,通过声源识别网络对声音信号进行鸣笛识别,获得鸣笛声源;S3:通过到达时间差定位法对鸣笛声源进行定位,获得鸣笛声源的空间位置。
[0006]优选的,步骤S2具体为:
S21:将声音信号进行预处理,获得四通道MFCC特征;S22:构建声源识别网络,声源识别网络包括:特征提取模块、注意力模块和全连接模块;S23:将四通道MFCC特征输入特征提取模块中进行特征提取,获得四通道特征图;S24:将四通道特征图输入注意力模块进行特征加权,获得加权后的特征图;S25:将加权后的特征图输入至全连接模块进行分类识别,获得鸣笛声源。
[0007]优选的,特征提取模块、注意力模块和全连接模块依次连接;特征提取模块包括:第一特征提取通道、第二特征提取通道、第三特征提取通道和第四特征提取通道;第一特征提取通道包括:第一卷积层、第一最大池化层、第二卷积层和第二最大池化层,第一卷积层、第一最大池化层、第二卷积层和第二最大池化层依次连接;第一特征提取通道、第二特征提取通道、第三特征提取通道和第四特征提取通道的结构相同;注意力模块包括:通道注意力模块、空间注意力模块,通道注意力模块与空间注意力模块连接;通道注意力模块包括:全局最大池化、全局平均池化、共享全连接层和第一sigmoid层,全局最大池化、全局平均池化、共享全连接层和第一sigmoid层依次连接;空间注意力模块包括:通道堆叠、7*7卷积层和第二sigmoid层,通道堆叠、1*1卷积层和第二sigmoid层依次连接。
[0008]优选的,步骤S23具体为:S231:通过特征提取通道提取MFCC特征的特征图,计算公式为:其中,i为通道的编号,i=1,2,3,4;x
i1
为第i个MFCC特征,Conv1为第一卷积层,MaxPool1为第一最大池化层,Conv2为第二卷积层,MaxPool2为第二最大池化层;x
i2
为第i特征提取通道输出的特征图;S232:将四个特征图进行拼接,获得四通道特征图,计算公式为:其中,[;]为向量拼接符号,x为四个特征图在通道维度上进行堆叠所得到的四通道特征图。
[0009]优选的,注意力模块的计算公式具体为:其中,x为四通道特征图,σ为Sigmoid激活函数,Conv7×7为卷积核尺寸为7
×
7的卷积操作,[;]为向量拼接符号,x
Avg
表示将x进行平均池化操作,x
Max
表示将x进行最大池化操作,W
MLP
为共享全连接层的权重,F(x)为加权后的特征图。
[0010]一种基于深度学习的车辆鸣笛定位系统,包括以下模块:声音信号获取模块,用于在路口设置麦克风阵列,通过麦克风阵列获取路口的声
音信号;鸣笛声源识别模块,用于构建声源识别网络,通过声源识别网络对声音信号进行鸣笛识别,获得鸣笛声源;鸣笛声源定位模块,用于通过到达时间差定位法对鸣笛声源进行定位,获得鸣笛声源的空间位置。
[0011]本专利技术具有以下有益效果:本专利技术创新性的提出了一种用于鸣笛定位的深度学习声源识别网络模型,该网络模型包括特征提取模块、注意力模块和全连接模块;通过特征提取模块和注意力模块对输入的四通道MFCC特征进行多路特征的提取和融合,学习出对声源识别任务最重要的信息,有效提升了模型的识别效率和准确度;这种轻巧的模型结构也有助于在硬件设备上的部署,克服了传统模型参数多、较难应用的缺点;后续通过该模型可以精确识别目标鸣笛声源,从而结合时延估计定位方法提高对鸣笛声音定位的准确率。
附图说明
[0012]图1为本专利技术实施例方法流程图;图2为声源识别网络结构图;图3为到达时间差定位法示意图;本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0013]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0014]参照图1,本专利技术提供一种基于深度学习的车辆鸣笛定位方法,包括以下步骤:S1:在路口设置麦克风阵列,通过麦克风阵列获取路口的声音信号;S2:构建声源识别网络,通过声源识别网络对声音信号进行鸣笛识别,获得鸣笛声源;S3:通过到达时间差定位法对鸣笛声源进行定位,获得鸣笛声源的空间位置。
[0015]进一步的,步骤S2具体为:S21:将声音信号进行预处理,获得四通道MFCC特征;具体的,在路口环境下,麦克风所采集的鸣笛声音受到噪声的影响较大,需要通过预处理提高信噪比,提取出的四通道MFCC特征为梅尔频谱(MFCC)特征,梅尔频谱是根据人的听觉实验的结果来分析声音的频谱,MFCC可以模拟人耳的听觉本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的车辆鸣笛定位方法,其特征在于,包括以下步骤:S1:在路口设置麦克风阵列,通过麦克风阵列获取路口的声音信号;S2:构建声源识别网络,通过声源识别网络对声音信号进行鸣笛识别,获得鸣笛声源;S3:通过到达时间差定位法对鸣笛声源进行定位,获得鸣笛声源的空间位置;步骤S2具体为:S21:将声音信号进行预处理,获得四通道MFCC特征;S22:构建声源识别网络,声源识别网络包括:特征提取模块、注意力模块和全连接模块;S23:将四通道MFCC特征输入特征提取模块中进行特征提取,获得四通道特征图;S24:将四通道特征图输入注意力模块进行特征加权,获得加权后的特征图;S25:将加权后的特征图输入至全连接模块进行分类识别,获得鸣笛声源。2.根据权利要求1所述的基于深度学习的车辆鸣笛定位方法,其特征在于,特征提取模块、注意力模块和全连接模块依次连接;特征提取模块包括:第一特征提取通道、第二特征提取通道、第三特征提取通道和第四特征提取通道;第一特征提取通道包括:第一卷积层、第一最大池化层、第二卷积层和第二最大池化层,第一卷积层、第一最大池化层、第二卷积层和第二最大池化层依次连接;第一特征提取通道、第二特征提取通道、第三特征提取通道和第四特征提取通道的结构相同;注意力模块包括:通道注意力模块、空间注意力模块,通道注意力模块与空间注意力模块连接;通道注意力模块包括:全局最大池化、全局平均池化、共享全连接层和第一sigmoid层,全局最大池化、全局平均池化、共享全连接层和第一sigmoid层依次连接;空间注意力模块包括:通道堆叠、7*7卷积层和第二sigmoid层,通道堆叠、1*1卷积层和第二sigmoid层依次连接。3.根据权利要求2所述的基于深度学习的车辆鸣笛定位方法,其特征在于,步骤S23具体为:S231:通过特征提取通道提取MFCC特征的特征图,计算公式为:其中,i为通道的...

【专利技术属性】
技术研发人员:孔绎杨谷林溪吴灿
申请(专利权)人:海纳科德湖北科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1