【技术实现步骤摘要】
本专利技术涉及声音事件检测与深度学习领域,特别涉及一种基于深度学习的哭声检测方法及系统。
技术介绍
1、现代社会由于生活、工作等的压力,很多人特别是婴幼儿有时候仅能藉由哭泣方式表达情绪与需求,因此,对于哭声的检测存在很大市场需求。
2、通常地,现有的语音信号识别系统通常是由语音信号预处理,特征提取和分类等各部分组成,其中,特征提取是最重要的部分,它的好坏直接影响识别结果;因此,对于如何对语音信号的特征进行识别,以及设计特征提取的模型是至关重要的一个关键技术难题。
3、现有研究者提出的婴儿哭声检测方法大多无法判断具体哭声发生时段。如公开号为cn111326179a的中国专利技术申请公开了一种婴儿哭声检测深度学习方法,该方法:建立基于卷积网络和长短时记忆递归神经网络的深度学习分类器;并将提取到的相邻n帧耳蜗语音特征输入深度学习分类器中,得到n帧分类结果,运用多数优先投票原则对n帧分类结果进行投票,得到最终婴儿哭声检测结果。该方法使用的多数优先投票机制不能处理哭声成分较少的样本,且只能判断片段是否包含哭声,而无法得到具
...【技术保护点】
1.一种基于深度学习的哭声检测方法,包括:
2.根据权利要求1所述基于深度学习的哭声检测方法,其特征在于,所述哭声检测模型,包括:卷积神经网络、帧级注意力机制、循环神经网络和分类器;其中,
3.根据权利要求1所述基于深度学习的哭声检测方法,其特征在于,所述帧级注意力机制模块,包括:AvgPooling层、压缩线性层、ReLU和还原线性层;其中,
4.根据权利要求1所述基于深度学习的哭声检测方法,其特征在于,采用弱监督训练方法训练哭声检测模型,包括:
5.根据权利要求2所述基于深度学习的哭声检测方法,其特征在于,所述哭声检
...【技术特征摘要】
1.一种基于深度学习的哭声检测方法,包括:
2.根据权利要求1所述基于深度学习的哭声检测方法,其特征在于,所述哭声检测模型,包括:卷积神经网络、帧级注意力机制、循环神经网络和分类器;其中,
3.根据权利要求1所述基于深度学习的哭声检测方法,其特征在于,所述帧级注意力机制模块,包括:avgpooling层、压缩线性层、relu和还原线性层;其中,
4.根据权利要求1所述基于深度学习的哭声检测方法,其特征在于,采用弱监督训练方法...
【专利技术属性】
技术研发人员:黎塔,冯宇,吴愁,张鹏远,
申请(专利权)人:中国科学院声学研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。