基于对事件子部分的序列的建模的声音事件检测制造技术

技术编号：21609022 阅读：22 留言：0更新日期：2019-07-13 19:27

本公开涉及基于对事件子部分的序列的建模的声音事件检测。提供了用于声音事件检测的技术。根据实施例的实现该技术的方法包括从接收到的音频信号提取声音特征。声音特征可以包括例如，音频信号的一个或多个短期傅里叶变换帧或其他频谱能量特性。该方法还包括对所提取的声音特征应用受训分类器以识别并标记音频信号的声音事件子部分并生成与这些子部分相关联的分数。该方法还包括执行声音事件子部分和相关联的分数的序列解码，以基于事件子部分的分数和时间排序来检测感兴趣的目标声音事件。在通过对包括目标声音事件的训练数据应用的无监督子空间聚类技术生成的声音事件子部分上训练分类器。

Sound Event Detection Based on Modeling Sequences of Subparts of Events

全部详细技术资料下载

【技术实现步骤摘要】
基于对事件子部分的序列的建模的声音事件检测
本文的实施例一般地涉及基于对事件子部分的序列的建模的声音事件检测。
技术介绍
声音事件检测在与物联网(IoT)、智能家居技术、以及数字监控系统有关的应用中扮演越来越重要的角色。通常有用的是，检测/辨认系统能够对所选择的感兴趣的声音事件(例如，射击、打碎玻璃、哭泣的婴儿、或者指示可能需要相关方关注的情况的其他声音)做出响应。现有的辨认系统一般需要在包含感兴趣的事件类型的声音训练数据序列上进行训练。需要对这些事件进行标记并且必须提供这些事件在数据序列中的位置，这通常是一项耗时且昂贵的任务。另外，这些现有的系统通常不能提供这些应用中的一些应用所必需的、期望等级的精确度(例如，在检测率和错误警报率方面)。
技术实现思路
根据本公开的一方面，提供了一种处理器实现的用于检测声音事件的方法，所述方法包括：由基于处理器的系统从音频信号提取一个或多个声音特征；由所述基于处理器的系统向所提取的一个或多个声音特征应用受训分类器，以识别所述音频信号的声音事件子部分并生成与所述子部分相关联的分数；以及由所述基于处理器的系统执行所述声音事件子部分和相关联的分数的序列解码，以检测声音事件。根据本公开的另一方面，提供了一种用于声音事件检测的系统，所述系统包括：特征提取电路，其从音频信号提取声音特征；分类器电路，其基于所提取的声音特征识别所述音频信号的声音事件子部分，并生成与所述子部分相关联的分数；以及序列解码器电路，其执行所述声音事件子部分和相关联的分数的序列解码以检测声音事件。根据本公开的又一方面，提供了至少一种非暂态计算机可读存储介质，其上编码...

【技术保护点】
1.一种处理器实现的用于检测声音事件的方法，所述方法包括：由基于处理器的系统从音频信号提取一个或多个声音特征；由所述基于处理器的系统向所提取的一个或多个声音特征应用受训分类器，以识别所述音频信号的声音事件子部分并生成与所述子部分相关联的分数；以及由所述基于处理器的系统执行所述声音事件子部分和相关联的分数的序列解码，以检测声音事件。

【技术特征摘要】
2017.12.07 US 15/834,8381.一种处理器实现的用于检测声音事件的方法，所述方法包括：由基于处理器的系统从音频信号提取一个或多个声音特征；由所述基于处理器的系统向所提取的一个或多个声音特征应用受训分类器，以识别所述音频信号的声音事件子部分并生成与所述子部分相关联的分数；以及由所述基于处理器的系统执行所述声音事件子部分和相关联的分数的序列解码，以检测声音事件。2.如权利要求1所述的方法，其中，所述序列解码基于所述声音事件子部分的时间排序和对所述相关联的分数与阈值分数值的比较。3.如权利要求1所述的方法，还包括：在通过对训练数据应用的子空间聚类生成的声音事件子部分上训练所述分类器，所述训练数据包括目标声音事件。4.如权利要求3所述的方法，其中，所述子空间聚类是基于k-means聚类、高斯混合模型聚类、以及DenStream聚类中的至少一者的无监督子空间聚类。5.如权利要求3所述的方法，还包括：至少针对包括目标声音事件的所述训练数据的子集生成参考注释，所述参考注释指示所述目标声音事件的子部分，并且其中，所述子空间聚类是基于约束k-means聚类、播种k-means聚类、以及高斯混合模型聚类和DenStream聚类的半监督变体中的至少一者的半监督子空间聚类。6.如权利要求1-5中任一项所述的方法，其中，所述序列解码基于加权有限状态转换器、循环神经网络(RNN)、以及长短期记忆RNN中的至少一者。7.如权利要求1-5中任一项所述的方法，其中，所提取的一个或多个声音特征包括表示所述音频信号的至少一部分的短期傅里叶变换、表示所述音频信号的至少一部分的滤波器组特征、表示所述音频信号的至少一部分的梅尔频率倒谱系数、以及表示所述音频信号的至少一部分的频谱形状描述符中的至少一者。8.如权利要求1-5中任一项所述的方法，其中，所述分类器是深度神经网络、支持向量机、决策树分类器、k最近邻分类器、随机森林分类器、梯度提升分类器、以及基于逻辑回归的分类器中的至少一者。9.一种用于声音事件检测的系统，所述系统包括：特征提取电路，其从音频信号提取声音特征；分类器电路，其基于所提取的声音特征识别所述音频信号的声音事件子部分，并生成与所述子部分相关联的分数；以及序列解码器电路，其执行所述声音事件子部分和相关联的分数的序列解码以检测声音事件。10.如权利要求9所述的系统，其中，所述序列解码基于所述声音事件子部分的时间排序和对所述相关联的分数与阈值分数值的比较。11.如权利要求9所述的系统，还包括：分类器训练电路，其在通过对训练数据应用的子空间聚类生成的声音事件子部分上训练所述分类器，所述训练数据包括目标声音事件。12.如权利要求11所述的系统，其中，所述子空间聚类是基于k-means聚类、高斯混合模型聚类、以及DenStream聚类中的至少一者的无监督子空间聚类。13.如权利要求11所述的系统，其中，所述训练数据的至少一个子集包括目标声音事件和相关联的参考注释，所述参考注释指示所述目标声音事件的子部...

【专利技术属性】
技术研发人员：库巴·洛帕特卡，托比亚斯·博克雷，马特乌什·考特瑞斯基，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人