一种基于卷积神经网络和多核学习SVM的关键音频检测方法技术

技术编号:21688531 阅读:27 留言:0更新日期:2019-07-24 15:19
本发明专利技术提出一种基于卷积神经网络和多核学习SVM的关键音频检测方法,包括步骤:S1:处理音频数据集,得到音频原始波形序列数据集和音频声谱图数据集;S2:建立提取音频原始波形序列特征的一维卷积神经网络和提取音频声谱图特征的二维卷积神经网络;S3:使用音频的原始波形序列数据集和声谱图数据集分别训练一维和二维卷积神经网络,得到对应的两个特征提取的网络模型;S4:输入音频的原始波形序列和声谱图分别至对应的两个网络模型,提取对应的特征;S5:输入两类特征至多核支持向量机,构建基于特征融合模型的核函数,进行音频分类。本发明专利技术所述检测方法将卷积神经网络从音频语谱图和音频原始波形中提取的特征进行融合,提高了检测识别准确率。

A Key Audio Detection Method Based on Convolutional Neural Network and Multi-core Learning SVM

【技术实现步骤摘要】
一种基于卷积神经网络和多核学习SVM的关键音频检测方法
本专利技术属于音频监控
,主要涉及安防领域,具体来说,即安防领域下音频监控中的关键音频检测方法。
技术介绍
随着多媒体技术发展,越来越多公共场所安装了音频监控以保障公共安全。声音信息中包含了不亚于图像信息的信息量,通过监控识别公共场合声音信息,可以迅速发现所关注的事件,从而做出应对。声音信息具有良好的实时性,对视频监控具有良好的辅助作用。卷积神经网络本质上是多层感知机模型的简单扩展,然而对于他们系统架构的更改带来更多的不同,使得他们更加适合用于图片分类,典型的卷积神经网络包含众多的网络层堆叠在一起:输入层、一群卷基层和池化层,有限数量的全连接层和输出层。多核学习是一种特征融合方法,可以处理异质或不规则数据,巨大的样本量,样本的不均匀分布以及其他问题,在多核学习中,多种特征被组织成组,并且每个组拥有自己的核函数。这些不同的核函数被组合成一个新的核函数,该核函数用于分类器中。
技术实现思路
本专利技术提出一种基于卷积神经网络和多核学习SVM的音频事件检测方法,利用多核学习方法将卷积神经网络从音频语谱图和音频原始波形中提取的特征进行本文档来自技高网...

【技术保护点】
1.一种基于卷积神经网络和多核学习SVM的关键音频检测方法,其特征在于,包括步骤:S1:处理音频数据集,得到音频原始波形序列数据集和音频声谱图数据集;S2:分别建立提取音频原始波形序列特征的一维卷积神经网络和提取音频声谱图特征的二维卷积神经网络;S3:使用音频原始波形序列数据集和音频声谱图数据集分别训练一维卷积神经网络和二维卷积神经网络,得到对应的两个特征提取的网络模型;S4:输入音频的原始波形序列和声谱图分别至对应的两个网络模型,提取得到对应的特征;S5:输入两类特征至多核支持向量机,构建基于特征融合模型的核函数,进行音频分类。

【技术特征摘要】
1.一种基于卷积神经网络和多核学习SVM的关键音频检测方法,其特征在于,包括步骤:S1:处理音频数据集,得到音频原始波形序列数据集和音频声谱图数据集;S2:分别建立提取音频原始波形序列特征的一维卷积神经网络和提取音频声谱图特征的二维卷积神经网络;S3:使用音频原始波形序列数据集和音频声谱图数据集分别训练一维卷积神经网络和二维卷积神经网络,得到对应的两个特征提取的网络模型;S4:输入音频的原始波形序列和声谱图分别至对应的两个网络模型,提取得到对应的特征;S5:输入两类特征至多核支持向量机,构建基于特征融合模型的核函数,进行音频分类。2.如权利要求1所述的一种基于卷积神经网络和多核学习SVM的关键音频检测方法,其特征在于,所述步骤S3具体实施步骤如下:S3.1:音频原始波形序列输入至一维卷积神经网络中,输出该波形对应于各个音频类别的可能性,随着网络输入端...

【专利技术属性】
技术研发人员:朱宸都应娜李怡菲蔡哲栋刘兆森杨鹏
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1