一种面向多通道音频定位的特征预处理和提取方法技术

技术编号:40554051 阅读:24 留言:0更新日期:2024-03-05 19:14
本发明专利技术是一种面向多通道音频定位的特征预处理和提取方法。本发明专利技术涉及音频预处理技术领域,本发明专利技术进行DSB特征提取LogMel特征和IV特征,提取后的特征进行全局归一化,归一化的数据在深度学习上进行训练和测试;通过DSB边缘端加速方法进行加速处理,将提取的特征用于训练一个CRNN模型,用于声源方向的估计。本发明专利技术对经过DSB处理的音频进行LogMel特征和IV特征的提取。在特征提取过程中,本发明专利技术利用边缘端GPU在Nano上加速处理。最后使用提取的特征训练一个CRNN。与使用不进行DSB的特征相比,使用DSB方法训练的CRNN可以有效的降低DoA误差,并且依然可以在边缘端实时的运行。

【技术实现步骤摘要】

本专利技术涉及音频预处理,是一种面向多通道音频定位的特征预处理和提取方法


技术介绍

1、随着计算能力的不断增强和网络连接的普及,基于人工智能(artificialintelligence,ai)的算法越来越广泛地应用于工业环境。在现代工厂中,产品的制造在很大程度上依赖于机器和工具的正确和可靠操作。然而,机器和工具发生故障时,维修和生产中断的成本会导致巨大的收入损失。因此,基于状态的维护和早期故障检测在当今的工厂中至关重要。传感器在设备故障检测中得到了广泛研究和应用。虽然图像在故障检测方面非常有效,但它容易引发信息泄漏问题,从而限制了在国防工业等敏感领域的使用。因此,非图像传感数据,如电流和电压信息,通常是首选选择。然而,这些数据通常要么依赖于机器自带的传感器,要么需要昂贵的仪器来获取。与之相比,使用麦克风的声学方法为机器诊断提供了一种低成本的数据收集方式。这些麦克风可以安装在机器附近或放置在工厂车间。故障的声源可能来自各个方向,因此声源的位置确定变得至关重要。声源定位(soundsource localization,ssl)通常使用多个麦克风音频通道来本文档来自技高网...

【技术保护点】

1.一种面向多通道音频定位的特征预处理和提取方法,其特征是:所述方法包括以下步骤:

2.根据权利要求1所述的方法,其特征是:所述步骤1具体为:

3.根据权利要求2所述的方法,其特征是:

4.根据权利要求3所述的方法,其特征是

5.根据权利要求4所述的方法,其特征是:

6.根据权利要求5所述的方法,其特征是:所述步骤2具体为:

7.根据权利要求6所述的方法,其特征是:

8.一种面向多通道音频定位的特征预处理和提取系统,其特征是:所述系统包括:

9.一种计算机可读存储介质,其上存储有计算机程序,其...

【技术特征摘要】

1.一种面向多通道音频定位的特征预处理和提取方法,其特征是:所述方法包括以下步骤:

2.根据权利要求1所述的方法,其特征是:所述步骤1具体为:

3.根据权利要求2所述的方法,其特征是:

4.根据权利要求3所述的方法,其特征是

5.根据权利要求4所述的方法,其特征是:

6.根据权利要求5所述的方法,其特征是:所述步骤2具体为:

7.根据权利要求...

【专利技术属性】
技术研发人员:贺长江程思瑶刘劼
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1