音频监控中基于深度随机森林的声音事件分类方法技术

技术编号：23364283 阅读：33 留言：0更新日期：2020-02-18 17:50

本发明专利技术涉及一种音频监控中基于深度随机森林的声音事件分类方法，包括以下步骤：步骤S1：从监控的音频文件中提取梅尔能量特征，并将其处理成特征序列；步骤S2:对每一类声音事件训练一个深度随机森林分类器,通过组合多个二分类模型，形成最终的深度随机森林声音事件分类模型；步骤S3:使用最终的深度随机森林声音事件分类模型对声音事件进行预测，得到声音事件的预测概率;步骤S4:根据得到的预测概率，进行事件分类后处理,得到声音事件分类结果。本发明专利技术基于随机森林的音频事件浅层检测方法和深度结构相结合，能够有效的对重叠声音事件进行检测并快速分类。

Audio event classification method based on depth random forest in audio monitoring

全部详细技术资料下载

【技术实现步骤摘要】
音频监控中基于深度随机森林的声音事件分类方法
本专利技术涉及监控系统中音频信号处理方法，具体涉及一种音频监控中基于深度随机森林的声音事件分类方法。
技术介绍
随着移动互联网技术的快速发展，人们可获取的音频数据呈爆炸式增长。如何从庞大、杂乱的音频数据中找出感兴趣的音频信息，是目前许多研究者关注的焦点。音频事件分类与检测是音频信息检索的重要基础，可以帮助解决感兴趣音频事件检出、分类等问题。安全监控系统是维护社会秩序、打击犯罪的强有力手段。传统的安全监控主要是基于视频图像。虽然城市中摄像头越来越多，但是安全保障还有待进一步提升。传统视频监控不能对某些异常情况及时地发出警报，而且需要一定的外部条件如光照、目标物体、清晰度等。基于音频事件检测的音频监控能够实时检测现场的声音，对一些异常音频事件如尖叫声、枪声进行监测，弥补视频监控的不足。因此，音频监控可以辅助视频监控，结合两者的优势组成多模安全监控系统，音频事件检测是音频监控的核心模块。
技术实现思路
有鉴于此，本专利技术的目的在于提供一种音频监控中基于深度随机森林的声音事件分类方法，能够有效的对重叠声音事件进行检测并快速分类。为实现上述目的，本专利技术采用如下技术方案：一种音频监控中基于深度随机森林的声音事件分类方法，包括以下步骤：步骤S1：从监控的音频文件中提取梅尔能量特征，并将其处理成特征序列；步骤S2:对每一类声音事件训练一个深度随机森林分类器,通过组合多个二分类模型，形成最终的深度随机森林声音事件分类模型；;...

【技术保护点】
1.一种音频监控中基于深度随机森林的声音事件分类方法，其特征在于，包括以下步骤：/n步骤S1：从监控的音频文件中提取梅尔能量特征，并将其处理成特征序列；/n步骤S2:对每一类声音事件训练一个深度随机森林分类器,通过组合多个二分类模型，形成最终的深度随机森林声音事件分类模型；;/n步骤S3:使用最终的深度随机森林声音事件分类模型对声音事件进行预测，得到声音事件的预测概率;/n步骤S4:根据得到的预测概率，进行事件分类后处理,得到声音事件分类结果。/n

【技术特征摘要】
1.一种音频监控中基于深度随机森林的声音事件分类方法，其特征在于，包括以下步骤：
步骤S1：从监控的音频文件中提取梅尔能量特征，并将其处理成特征序列；
步骤S2:对每一类声音事件训练一个深度随机森林分类器,通过组合多个二分类模型，形成最终的深度随机森林声音事件分类模型；;
步骤S3:使用最终的深度随机森林声音事件分类模型对声音事件进行预测，得到声音事件的预测概率;
步骤S4:根据得到的预测概率，进行事件分类后处理,得到声音事件分类结果。

2.根据权利要求1所述的音频监控中基于深度随机森林的声音事件分类方法，其特征在于，所述步骤S1具体为：
步骤S11:将音频监控文件使用时长1.2秒，每隔0.02秒的滑动窗口进行切分，得到N个音频片;
步骤S12:将切分得到的每个音频片段内，按照帧长40ms，帧移20ms进行划分，得到61个音频帧；
步骤S13:对每个音频帧计算梅尔能量特征，得到每帧123维特征；
步骤S14:将61帧合成一个数据，最终得到N*61*123的特征，将得到的特征数据处理成N*7503维序列格式，构成特征序列。

3.根据权利要求2所述的音频监控中基于深度随机森林的声音事件分类方法，其特征在于，所述训练深度随机森林分类器,具体为：
步骤S21:对于级联森林中第一层级联层，输入7503维原始特征；通过对森...

【专利技术属性】
技术研发人员：余春艳，刘煌，李明达，
申请(专利权)人：福州大学，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人