一种基于深度学习的声源空间方位检测方法技术

技术编号:19818125 阅读:48 留言:0更新日期:2018-12-19 13:26
本发明专利技术公开了一种基于深度学习的声源空间方位检测方法,包括步骤:步骤1、采用人工头双麦克风系统捡拾多个声源空间方位的双耳声信号,用于深度神经网络模型的训练;步骤2、对所述深度神经网络模型进行迭代训练,得到一个具有最优参数的分类器;步骤3、输入未知声源方位的双耳信号至训练好的深度神经网络模型,所述深度神经网络模型输出声源空间方位的预测值。相对于现有技术,本发明专利技术的硬件实施简便;同时,神经网络信息量大,预测准确性接近人类行为学实验的水平。

【技术实现步骤摘要】
一种基于深度学习的声源空间方位检测方法
本专利技术涉及声源定位相关的
,特别涉及一种基于深度学习的声源空间方位检测方法。
技术介绍
声源定位是一种接受目标声场信息,并施以声源定位算法处理,进而确定目标声源方位的技术。声源定位技术涉及声信号检测、音频数字信号处理、空间听觉研究等一系列领域,在军事和民用消费领域有着重要的应用。例如,声源定位技术可以提高远程通讯的临场感和语言可懂度,也可用于车辆停放地的搜索和导航、智能音箱的唤醒等。目前,声源定位技术主要是利用麦克风阵列(即传声器阵列)接收声场信息,根据声源信号到达各个麦克风阵元的物理差异(例如声达时间差,timedifferencesofarrivalTDOA),被动估计声源的空间方位。已有多种麦克风阵列,如线性阵列、环形整列等;通常,麦克风阵元的数量和定位准确性呈正相关关系。实际应用中,为了获得良好的声源空间方位的检测效果,需要将较多数量的麦克风阵元按照一定的空间几何位置进行排列。多阵元麦克风阵列不仅需要精确设计阵列的孔径大小、阵元间距等参数,还需要多通道采集系统和算法支撑。这些对麦克风系统的软、硬件都提出了较高的要求,增加了系统本文档来自技高网...

【技术保护点】
1.一种基于深度学习的声源空间方位检测方法,其特征是,包括如下步骤:步骤1、采用人工头双麦克风系统捡拾多个声源空间方位的双耳声信号,用于深度神经网络模型的训练;步骤2、对所述深度神经网络模型进行迭代训练,得到一个具有最优参数的分类器;步骤3、输入未知声源方位的双耳信号至训练好的深度神经网络模型,所述深度神经网络模型输出声源空间方位的预测值。

【技术特征摘要】
1.一种基于深度学习的声源空间方位检测方法,其特征是,包括如下步骤:步骤1、采用人工头双麦克风系统捡拾多个声源空间方位的双耳声信号,用于深度神经网络模型的训练;步骤2、对所述深度神经网络模型进行迭代训练,得到一个具有最优参数的分类器;步骤3、输入未知声源方位的双耳信号至训练好的深度神经网络模型,所述深度神经网络模型输出声源空间方位的预测值。2.根据权利要求1所述的一种基于深度学习的声源空间方位检测方法,其特征是:所述步骤1具体包括:步骤11、将人工头放置在转盘上,双耳距离地面的垂直高度为1米;将一个扬声器固定在距离人工头水平距离为1米的方位,和双耳等高;所述扬声器的输入端经由外置声卡和计算机连接;将两个麦克风分别固定在所述人工头的耳道末端,所述麦克风的输出端经由外置声卡和计算机连接;步骤12、所述扬声器播放声源单通路信号,声音经过周围环境的传播到达人工头的双耳,随即被所述麦克风捡拾,最后保存至计算机;步骤13、转动所述转盘,改变所述人工头和所述扬声器的相对空间方位,重复步骤12,记录Q个声源空间方位的双耳声信号。3.根据权利要求1所述的一种基于深度学习的声源空间方位检测方法,其特征是:所述步骤2具体包括:步骤21、数据的预处理:将Q个方位采集到的双声道长声源信号进行下采样处理,然后使用端点检测去除静音部分,并对余下部分进行50ms分段切片操作,每个方位得到M≥5000个片段,并附上对应角度的标签作为训练集T,所述训练集T包含N=Q×M个训练样本;步骤22、搭建神经网络结构,初始化每层网络权重系数和偏置总训练次数K、学习效率α,其中,k为当前训练次数,初始值为1;l为神经...

【专利技术属性】
技术研发人员:俞胜锋钟小丽顾正晖
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1