一种基于深度学习的车辆鸣笛定位方法及系统技术方案

技术编号：38463700 阅读：11 留言：0更新日期：2023-08-11 14:40

本发明专利技术提供一种基于深度学习的车辆鸣笛定位方法及系统，包括以下步骤：S1：在路口设置麦克风阵列，通过麦克风阵列获取声音信号；S2：构建声源识别网络，通过声源识别网络对声音信号进行鸣笛识别，获得鸣笛声源；S3：通过到达时间差定位法对鸣笛声源进行定位，获得鸣笛声源的空间位置。本发明专利技术创新性的提出了一种用于鸣笛定位的深度学习声源识别网络模型，该网络模型包括特征提取模块、注意力模块和全连接模块；通过特征提取模块和注意力模块对输入的四通道MFCC特征进行多路特征的提取和融合，学习出对声源识别任务最重要的信息，有效提升了模型的识别效率和准确度。型的识别效率和准确度。型的识别效率和准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的车辆鸣笛定位方法及系统

[0001]本专利技术涉及声信号分类识别领域，尤其涉及一种基于深度学习的车辆鸣笛定位方法及系统。

技术介绍

[0002]随着对声学研究的深入，研究人员发现可以通过声音识别并对声源定位来实现对违法鸣笛的抓拍，近年来陆续在违法鸣笛抓拍上取得了一些进步，也有一些应用于实际道路上。对于违法鸣笛抓拍系统来说，都是通过麦克风对环境声音进行识别，然后再通过麦克风阵列对声源进行定位，从而识别出违法鸣笛的车辆。
[0003]常用的声源定位技术有三种：基于到达时间差、基于可控波束形成和基于高分辨率谱估计。基于到达时间差的方法有两步，首先分析麦克风接收到的信号的时间，互相关求出差值，然后根据麦克风阵型，几何空间变换推导出声源位置。此方法计算量小，运算速度快，缺点是受噪声影响大以及多声源时会降低性能。可控波束形成是对阵列的输出信号加权求和形成波束，再通过不同的加权引导波束，此时指向的输出功率最大的点即为声源的位置。此方法也已经广泛应用于声源定位领域，但是由于需要搜索全局，计算量大，实时性不好，实际使用中通常用一些迭代方法来减小运算量。高分辨率谱估计方法主要包括多重信号分类（MUSIC）、自回归模型（AR）、最小方差谱估计（MV）等算法，其中以MUSIC算法为代表，其利用了信号子空间和噪声子空间的正交性，构造空间谱函数，然后搜索谱峰，得到DOA。在实际中运用时，若想达到较理想的精度，计算量会很大，并且需要较多的初值条件。还有此方法对环境噪声敏感，抗噪能力差，因此现代声源定位系统中采用高分辨率谱...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的车辆鸣笛定位方法，其特征在于，包括以下步骤：S1：在路口设置麦克风阵列，通过麦克风阵列获取路口的声音信号；S2：构建声源识别网络，通过声源识别网络对声音信号进行鸣笛识别，获得鸣笛声源；S3：通过到达时间差定位法对鸣笛声源进行定位，获得鸣笛声源的空间位置；步骤S2具体为：S21：将声音信号进行预处理，获得四通道MFCC特征；S22：构建声源识别网络，声源识别网络包括：特征提取模块、注意力模块和全连接模块；S23：将四通道MFCC特征输入特征提取模块中进行特征提取，获得四通道特征图；S24：将四通道特征图输入注意力模块进行特征加权，获得加权后的特征图；S25：将加权后的特征图输入至全连接模块进行分类识别，获得鸣笛声源。2.根据权利要求1所述的基于深度学习的车辆鸣笛定位方法，其特征在于，特征提取模块、注意力模块和全连接模块依次连接；特征提取模块包括：第一特征提取通道、第二特征提取通道、第三特征提取通道和第四特征提取通道；第一特征提取通道包括：第一卷积层、第一最大池化层、第二卷积层和第二最大池化层，第一卷积层、第一最大池化层、第二卷积层和第二最大池化层依次连接；第一特征提取通道、第二特征提取通道、第三特征提取通道和第四特征提取通道的结构相同；注意力模块包括：通道注意力模块、空间注意力模块，通道注意力模块与空间注意力模块连接；通道注意力模块包括：全局最大池化、全局平均池化、共享全连接层和第一sigmoid层，全局最大池化、全局平均池化、共享全连接层和第一sigmoid层依次连接；空间注意力模块包括：通道堆叠、7*7卷积层和第二sigmoid层，通道堆叠、1*1卷积层和第二sigmoid层依次连接。3.根据权利要求2所述的基于深度学习的车辆鸣笛定位方法，其特征在于，步骤S23具体为：S231：通过特征提取通道提取MFCC特征的特征图，计算公式为：其中，i为通道的...

【专利技术属性】
技术研发人员：孔绎杨，谷林溪，吴灿，
申请(专利权)人：海纳科德湖北科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人