婴儿哭声和咳嗽声检测方法、装置、存储介质及终端设备制造方法及图纸

技术编号:35899284 阅读:54 留言:0更新日期:2022-12-10 10:34
本申请属于人工智能技术领域,尤其涉及一种婴儿哭声和咳嗽声检测方法、装置、计算机可读存储介质及终端设备。方法包括:获取待检测的目标声音;提取目标声音的对数梅尔谱;使用预设的婴儿哭声和咳嗽声检测模型对目标声音的对数梅尔谱进行检测,得到目标声音的检测结果;其中,婴儿哭声和咳嗽声检测模型为基于MobileNetV2网络模型改进,且经过预设的声音样本集训练得到的深度卷积神经网络模型;声音样本集中包括各种婴儿哭声样本、婴儿咳嗽声样本和其他声音样本,其他声音为非婴儿哭声且非婴儿咳嗽声的声音。通过本申请,引入深度卷积神经网络模型来进行婴儿哭声和咳嗽声检测,可以挖掘到声音中更深层次的特征,有效提升了检测结果的准确率。测结果的准确率。测结果的准确率。

【技术实现步骤摘要】
婴儿哭声和咳嗽声检测方法、装置、存储介质及终端设备


[0001]本申请属于人工智能
,尤其涉及一种婴儿哭声和咳嗽声检测方法、装置、计算机可读存储介质及终端设备。

技术介绍

[0002]随着各类终端设备的智能化程度越来越高,可以在终端设备中嵌入各种复杂功能,例如,通过在终端设备中嵌入婴儿看护功能,能及时发现婴儿哭闹、咳嗽,并向相关看护人员发出警报,避免婴儿独处时发生危险,具有较大的市场应用价值。
[0003]但在现有技术中,主要是通过矢量量化(Vector Quantization,VQ)、动态时间归整(Dynamic Time Warping,DTW)、高斯混合模型(Gaussian Mixed Model,GMM)、隐含马尔柯夫模型(Hidden Markov Model,HMM)、随机森林分类器(Random Forest Classifier,RFC)、支持向量机(Support Vector Machine,SVM)、人工神经网络(Artificial Neural Network,ANN)等方法来建立声学模型进行声音检测,这些方法一般只能使用到声音中的底层特征,检测结果的准确率较低。

技术实现思路

[0004]有鉴于此,本申请实施例提供了一种婴儿哭声和咳嗽声检测方法、装置、计算机可读存储介质及终端设备,以解决现有的婴儿哭声和咳嗽声检测方法存在的检测结果准确率较低的问题。
[0005]本申请实施例的第一方面提供了一种婴儿哭声和咳嗽声检测方法,可以包括:
[0006]获取待检测的目标声音;
[0007]提取所述目标声音的对数梅尔谱;
[0008]使用预设的婴儿哭声和咳嗽声检测模型对所述目标声音的对数梅尔谱进行检测,得到所述目标声音的检测结果;
[0009]其中,所述婴儿哭声和咳嗽声检测模型为基于MobileNetV2网络模型改进,且经过预设的声音样本集训练得到的深度卷积神经网络模型;所述声音样本集中包括各种婴儿哭声样本、婴儿咳嗽声样本和其他声音样本,所述其他声音为非婴儿哭声且非婴儿咳嗽声的声音。
[0010]在第一方面的一种具体实现方式中,所述婴儿哭声和咳嗽声检测模型的训练过程可以包括:
[0011]提取所述声音样本集中的各个声音样本的对数梅尔谱;
[0012]使用初始的婴儿哭声和咳嗽声检测模型分别对各个声音样本的对数梅尔谱进行婴儿哭声和咳嗽声检测,得到各个声音样本的实际检测结果;
[0013]根据所述实际检测结果和预设的期望检测结果计算训练损失;
[0014]根据所述训练损失对婴儿哭声和咳嗽声检测模型进行模型训练,直至满足预设的训练停止条件,得到训练后的婴儿哭声和咳嗽声检测模型。
[0015]在第一方面的一种具体实现方式中,在提取所述声音样本集中各个声音样本的对数梅尔谱之前,所述方法还包括:
[0016]对所述声音样本集中的各个声音样本进行数据增强处理,得到各个增强声音样本;
[0017]将各个增强声音样本分别添加入所述声音样本集中,得到扩充后的声音样本集。
[0018]在第一方面的一种具体实现方式中,所述根据所述实际检测结果和预设的期望检测结果计算训练损失,可以包括:
[0019]根据所述实际检测结果和预设的期望检测结果,使用预设的二元交叉熵损失函数计算所述训练损失。
[0020]在第一方面的一种具体实现方式中,所述使用预设的婴儿哭声和咳嗽声检测模型对所述目标声音的对数梅尔谱进行检测,得到所述目标声音的检测结果,可以包括:
[0021]将所述目标声音的对数梅尔谱输入所述婴儿哭声和咳嗽声检测模型,并获取所述婴儿哭声和咳嗽声检测模型输出的所述目标声音分别属于各个声音类别的概率值;其中,各个声音类别包括婴儿哭声、婴儿咳嗽声和其他声音;
[0022]根据最大的概率值对应的声音类别确定所述目标声音的声音类别。
[0023]在第一方面的一种具体实现方式中,所述根据最大的概率值对应的声音类别确定所述目标声音的声音类别,可以包括:
[0024]判断最大的概率值是否大于预设的概率阈值;
[0025]若最大的概率值大于所述概率阈值,则确定所述目标声音的声音类别为最大的概率值对应的声音类别;
[0026]若最大的概率值小于或等于所述概率阈值,则确定所述目标声音的声音类别为其他声音。
[0027]在第一方面的一种具体实现方式中,所述婴儿哭声和咳嗽声检测模型对MobileNetV2网络模型的改进可以包括:增加两个输入卷积层;增加最大池化层;将单个线性层替换为两个线性层。
[0028]本申请实施例的第二方面提供了一种婴儿哭声和咳嗽声检测装置,可以包括:
[0029]目标声音获取模块,用于获取待检测的目标声音;
[0030]目标声音特征提取模块,用于提取所述目标声音的对数梅尔谱;
[0031]婴儿哭声和咳嗽声检测模块,用于使用预设的婴儿哭声和咳嗽声检测模型对所述目标声音的对数梅尔谱进行检测,得到所述目标声音的检测结果;
[0032]其中,所述婴儿哭声和咳嗽声检测模型为基于MobileNetV2网络模型改进,且经过预设的声音样本集训练得到的深度卷积神经网络模型;所述声音样本集中包括各种婴儿哭声样本、婴儿咳嗽声样本和其他声音样本,所述其他声音为非婴儿哭声且非婴儿咳嗽声的声音。
[0033]在第二方面的一种具体实现方式中,所述婴儿哭声和咳嗽声检测装置还可以包括:
[0034]样本特征提取模块,用于提取所述声音样本集中的各个声音样本的对数梅尔谱;
[0035]训练检测模块,用于使用初始的婴儿哭声和咳嗽声检测模型分别对各个声音样本的对数梅尔谱进行婴儿哭声和咳嗽声检测,得到各个声音样本的实际检测结果;
[0036]训练损失计算模块,用于根据所述实际检测结果和预设的期望检测结果计算训练损失;
[0037]模型训练模块,用于根据所述训练损失对婴儿哭声和咳嗽声检测模型进行模型训练,直至满足预设的训练停止条件,得到训练后的婴儿哭声和咳嗽声检测模型。
[0038]在第二方面的一种具体实现方式中,所述婴儿哭声和咳嗽声检测装置还可以包括:
[0039]数据增强模块,用于对所述声音样本集中的各个声音样本进行数据增强处理,得到各个增强声音样本;将各个增强声音样本分别添加入所述声音样本集中,得到扩充后的声音样本集。
[0040]在第二方面的一种具体实现方式中,所述训练损失计算模块可以具体用于:根据所述实际检测结果和预设的期望检测结果,使用预设的二元交叉熵损失函数计算所述训练损失。
[0041]在第二方面的一种具体实现方式中,所述婴儿哭声和咳嗽声检测模块可以包括:
[0042]概率值获取单元,用于将所述目标声音的对数梅尔谱输入所述婴儿哭声和咳嗽声检测模型,并获取所述婴儿哭声和咳嗽声检测模型输出的所述目标声音分别属于各个声音类别的概率值;其中,各个声音类别包括婴儿哭声、婴儿咳本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种婴儿哭声和咳嗽声检测方法,其特征在于,包括:获取待检测的目标声音;提取所述目标声音的对数梅尔谱;使用预设的婴儿哭声和咳嗽声检测模型对所述目标声音的对数梅尔谱进行检测,得到所述目标声音的检测结果;其中,所述婴儿哭声和咳嗽声检测模型为基于MobileNetV2网络模型改进,且经过预设的声音样本集训练得到的深度卷积神经网络模型;所述声音样本集中包括各种婴儿哭声样本、婴儿咳嗽声样本和其他声音样本,所述其他声音为非婴儿哭声且非婴儿咳嗽声的声音。2.根据权利要求1所述的婴儿哭声和咳嗽声检测方法,其特征在于,所述婴儿哭声和咳嗽声检测模型的训练过程包括:提取所述声音样本集中的各个声音样本的对数梅尔谱;使用初始的婴儿哭声和咳嗽声检测模型分别对各个声音样本的对数梅尔谱进行婴儿哭声和咳嗽声检测,得到各个声音样本的实际检测结果;根据所述实际检测结果和预设的期望检测结果计算训练损失;根据所述训练损失对婴儿哭声和咳嗽声检测模型进行模型训练,直至满足预设的训练停止条件,得到训练后的婴儿哭声和咳嗽声检测模型。3.根据权利要求2所述的婴儿哭声和咳嗽声检测方法,其特征在于,在提取所述声音样本集中各个声音样本的对数梅尔谱之前,还包括:对所述声音样本集中的各个声音样本进行数据增强处理,得到各个增强声音样本;将各个增强声音样本分别添加入所述声音样本集中,得到扩充后的声音样本集。4.根据权利要求2所述的婴儿哭声和咳嗽声检测方法,其特征在于,所述根据所述实际检测结果和预设的期望检测结果计算训练损失,包括:根据所述实际检测结果和预设的期望检测结果,使用预设的二元交叉熵损失函数计算所述训练损失。5.根据权利要求1所述的婴儿哭声和咳嗽声检测方法,其特征在于,所述使用预设的婴儿哭声和咳嗽声检测模型对所述目标声音的对数梅尔谱进行检测,得到所述目标声音的检测结果,包括:将所述目标声音的对数梅尔谱输入所述婴儿哭声和咳嗽声检测模型,并获取所述婴儿哭声和咳嗽声检测模型...

【专利技术属性】
技术研发人员:颜霖煌黄东延杨显杰郑泽鸿丁万
申请(专利权)人:深圳市优必选科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1