基于伪彩色时频图像及卷积网络的环境声音识别方法技术

技术编号:28053551 阅读:34 留言:0更新日期:2021-04-14 13:19
本发明专利技术涉及一种基于伪彩色时频图像及卷积网络的环境声音识别方法,该方法首先提出了一种基于模态中心频率差分的自适应变分模态分解方法,通过其对环境声音信号进行噪声去除与信号重建,并结合伪Wigner

【技术实现步骤摘要】
基于伪彩色时频图像及卷积网络的环境声音识别方法


[0001]本专利技术属于声音信号识别领域,本专利技术涉及一种环境声音信号检测方法,特别是一种基于伪彩色时频图像及卷积网络的环境声音识别方法。

技术介绍

[0002]环境声是除语音声和音乐声之外的所有可听声的总称。过去几十年来,人们主要针对语音声和音乐声进行了大量的基础和应用研究,如语音合成和识别、乐声分析与自动索检等等。将环境声作为一种单独的声音类别进行听觉感知与应用研究是近十多年的事。环境声自动识别在科学研究、工业生产、社会生活、军事斗争等诸多领域有着广泛的应用,如基于动物发声的物种调查与保护、基于声与振动的故障诊断与修复、水下目标的识别与分类等。目前,环境声识别的热门应用领域是城市中环境声识别,其对帮助人们实现智能化的城市管理具有重要意义。
[0003]文献“噪声背景下环境声音识别研究,Electronic Engineering&Product World,2019,Vol26(09),p34

38”公开了一种基于声音增强与声谱图扇形投影特征的噪本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于伪彩色时频图像及深度卷积神经网络的鲁棒环境声音信号识别方法,其特征在于,包括以下步骤:步骤1:计算模态数为K时各模态信号u
k
及相应的中心频率ω
k
:::其中,f表示输入的声音信号,n表示迭代次数,τ为噪声容限,λ为拉格朗日乘子,ζ为无约束变分问题,{}表示集合;步骤2:计算相邻模态信号中心频率的差分值D
k
=ω
k+1
(t)

ω
k
(t) k=1,...,K
‑1ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)λ
k
=D
k+1
/D
k k=1,...,K
‑2ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)其中,D
k
为中心频率差值,λ
k
中心频率差分值。步骤3;确定最优分解个数K满足终止条件时,最优分解个数K
best
=K

1。步骤4去除噪声分量后计算各模态信号的时频分布:其中,h(τ)为高斯核函数,表示对频率的二维卷积,imf
n
为第n个模态分量信号,pwvd
n
(t,f)为第n个IMF的PWVD时频图。步骤5重构得到灰度时频图步骤6引入阈值并进行归一化PWVD(t,f)=max[PWVD(t,f)

【专利技术属性】
技术研发人员:王靖宇张彦华苏雨张科王霰禹王林马振宇谢方园王红梅
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1