基于声音识别的监控方法、装置及系统制造方法及图纸

技术编号：16920930 阅读：54 留言：0更新日期：2017-12-31 15:50

本发明专利技术提供了一种基于声音识别的监控方法、装置及系统，方法包括以下步骤：S1：进行预先采集若干种特定声音进行声音模型训练，得到训练后的声音模型；S2：采集现场声音，对采集的声音进行与所述若干种特定声音对应的特征提取；S3：将提取的特征与所述声音模型进行匹配分类，得到现场声音的分类结果；S4：根据所述分类结果判断是否需要报警。本发明专利技术可弥补传统视频监控的不足，声音配合视频能更好的对复杂环境进行实时的监控。且能够提高预防和打击犯罪活动的效率，确保监控系统对不安全事件监控的主动性和及时性。

全部详细技术资料下载

【技术实现步骤摘要】
基于声音识别的监控方法、装置及系统
本专利技术涉及信号处理、语音识别和模式识别
，特别涉及一种基于声音识别的监控方法、装置及系统。
技术介绍
在公共场合中多采用传统的视频监控手段，视频监控相对有效的防范了一些违法犯罪活动。但是视频监控存在以下两个缺点：由于监控人员的疏忽，会错过监控画面捕捉到的不安全事件；由于视频画面的二维性，画面很容易被干扰物所阻挡。虽然在案件发生以后，可以采集案发现场的监控视频，帮助调查取证。但如果错过了最佳的营救时间则会导致案件的恶化。所以传统的视频监控系统很难及时有效的发现一些暴力事件或者是恐怖袭击。其次，声音监控中对声音的分类不能简单的对振幅或者其他特征进行分类，需要结合监控场景实际情况对声音不同的特征进行分类，以使声音监控真正的应用到生活当中。所以设计一款突破传统监控障碍的新型智能化监控系统迫在眉睫。在视频监控的基础上添加三种类型声音监控来辅助，会极大的提高监控效率，减少悲剧的发生，对现实生活具有重要意义。
技术实现思路
本专利技术的目的在于提供一种基于声音识别的监控方法、装置及系统，以解决现有的视频监控功能单一，监控效率较低的问题。为实现上述目的，本专利技术提供了一种基于声音识别的监控方法，包括以下步骤：S1：进行预先采集若干种特定声音进行声音模型训练，得到训练后的声音模型；S2：采集现场声音，对采集的声音进行与所述若干种特定声音对应的特征提取；S3：将提取的特征与所述声音模型进行匹配分类，得到现场声音的分类结果；S4：根据所述分类结果判断是否需要报警。较佳地，所述特定声音包括非语音的异常声音、带情感的语音以及敏感词语音，相...
基于声音识别的监控方法、装置及系统

【技术保护点】
一种基于声音识别的监控方法，其特征在于，包括以下步骤：S1：进行预先采集若干种特定声音进行声音模型训练，得到训练后的声音模型；S2：采集现场声音，对采集的声音进行与所述若干种特定声音对应的特征提取；S3：将提取的特征与所述声音模型进行匹配分类，得到现场声音的分类结果；S4：根据所述分类结果判断是否需要报警。

【技术特征摘要】
1.一种基于声音识别的监控方法，其特征在于，包括以下步骤：S1：进行预先采集若干种特定声音进行声音模型训练，得到训练后的声音模型；S2：采集现场声音，对采集的声音进行与所述若干种特定声音对应的特征提取；S3：将提取的特征与所述声音模型进行匹配分类，得到现场声音的分类结果；S4：根据所述分类结果判断是否需要报警。2.根据权利要求1所述的基于声音识别的监控方法，其特征在于，所述特定声音包括非语音的异常声音、带情感的语音以及敏感词语音，相应地，所述步骤S2中提取特征时，提取的特征分别为：针对异常声音监控的非语音声音特征；针对人群情绪监控的人群语音情感特征；以及针对人群话语所带敏感词汇监控而提取的语音转文字所需的特征。3.根据权利要求2所述的基于声音识别的监控方法，其特征在于，当提取非语音声音特征时，采用基于D-ESMD的异常声音特征提取方法，具体包括以下步骤：①设定T分布随机噪声的次数K；②采集现场的声音信号s，并将T分布随机噪声添加至所述声音信号s中,得到加噪信号Si，其中，i为加噪信号的个数；③对所述加噪信号Si利用对称中点插值的ESMD的方法进行分解,得到模态分量④计算所述模态分量的排列熵值H,并通过现场试验确定阈值；⑤若所述排列熵值H大于所述阈值，则所述模态分量为有用信号模态分量，进入步骤⑥，否则所述模态分量为噪声；⑥将作为输入信号，重复③～⑤，直到分解得到的n阶模态分量为噪声为止,其中，n为正整数；⑦如果i<K,则令i＝i+1,重复②～⑥，直到i＝K为止，得到所有的模态分量，并求其总体平均值将总体平均值作为分解信号的最终模态分量；⑧计算各阶模态分量相对于原始的声音信号s的能量比，并组合成特征向量进行归一化处理，作为原始信号的特征向量。4.根据权利要求2所述的基于声音识别的监控方法，其特征在于，当提取人群语音情感特征时，采用基于语音情感识别的特征提取方法，具体为：使用国际语音情感挑战赛中使用的特征集进行特征向量的表示。5.根据权利要求2所述的基于声音识别的监控方法，其特征在于，当提取语音转文字所需特征时，采用基于Gammatone的语音特征提取方法，具体包括以下步骤：①采集的现场的声音信号为x(n),对其进行预加重，设预加重系数为α，预加重之后的声音信号为y(n)＝x(n)-α*x(n-1)，其中，n为现场采集的声音信号的个数；②对预加重之后的声音信号y(n)进行分帧，帧长为N个采样点，其中，N为...

【专利技术属性】
技术研发人员：台龙飞，曹瑞林，林伟，
申请(专利权)人：上海应用技术大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人