婴儿哭声和咳嗽声检测方法、装置、存储介质及终端设备制造方法及图纸

技术编号：35899284 阅读：54 留言：0更新日期：2022-12-10 10:34

本申请属于人工智能技术领域，尤其涉及一种婴儿哭声和咳嗽声检测方法、装置、计算机可读存储介质及终端设备。方法包括：获取待检测的目标声音；提取目标声音的对数梅尔谱；使用预设的婴儿哭声和咳嗽声检测模型对目标声音的对数梅尔谱进行检测，得到目标声音的检测结果；其中，婴儿哭声和咳嗽声检测模型为基于MobileNetV2网络模型改进，且经过预设的声音样本集训练得到的深度卷积神经网络模型；声音样本集中包括各种婴儿哭声样本、婴儿咳嗽声样本和其他声音样本，其他声音为非婴儿哭声且非婴儿咳嗽声的声音。通过本申请，引入深度卷积神经网络模型来进行婴儿哭声和咳嗽声检测，可以挖掘到声音中更深层次的特征，有效提升了检测结果的准确率。测结果的准确率。测结果的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
婴儿哭声和咳嗽声检测方法、装置、存储介质及终端设备

[0001]本申请属于人工智能
，尤其涉及一种婴儿哭声和咳嗽声检测方法、装置、计算机可读存储介质及终端设备。

技术介绍

[0002]随着各类终端设备的智能化程度越来越高，可以在终端设备中嵌入各种复杂功能，例如，通过在终端设备中嵌入婴儿看护功能，能及时发现婴儿哭闹、咳嗽，并向相关看护人员发出警报，避免婴儿独处时发生危险，具有较大的市场应用价值。
[0003]但在现有技术中，主要是通过矢量量化(Vector Quantization，VQ)、动态时间归整(Dynamic Time Warping，DTW)、高斯混合模型(Gaussian Mixed Model，GMM)、隐含马尔柯夫模型(Hidden Markov Model，HMM)、随机森林分类器(Random Forest Classifier，RFC)、支持向量机(Support Vector Machine，SVM)、人工神经网络(Artificial Neural Network，ANN)等方法来建立声学模型进行声音检测，这些方法一般只能使用到声音中的底层特征，检测结果的准确率较低。

技术实现思路

[0004]有鉴于此，本申请实施例提供了一种婴儿哭声和咳嗽声检测方法、装置、计算机可读存储介质及终端设备，以解决现有的婴儿哭声和咳嗽声检测方法存在的检测结果准确率较低的问题。
[0005]本申请实施例的第一方面提供了一种婴儿哭声和咳嗽声检测方法，可以包括：
[0006...

【技术保护点】

【技术特征摘要】
1.一种婴儿哭声和咳嗽声检测方法，其特征在于，包括：获取待检测的目标声音；提取所述目标声音的对数梅尔谱；使用预设的婴儿哭声和咳嗽声检测模型对所述目标声音的对数梅尔谱进行检测，得到所述目标声音的检测结果；其中，所述婴儿哭声和咳嗽声检测模型为基于MobileNetV2网络模型改进，且经过预设的声音样本集训练得到的深度卷积神经网络模型；所述声音样本集中包括各种婴儿哭声样本、婴儿咳嗽声样本和其他声音样本，所述其他声音为非婴儿哭声且非婴儿咳嗽声的声音。2.根据权利要求1所述的婴儿哭声和咳嗽声检测方法，其特征在于，所述婴儿哭声和咳嗽声检测模型的训练过程包括：提取所述声音样本集中的各个声音样本的对数梅尔谱；使用初始的婴儿哭声和咳嗽声检测模型分别对各个声音样本的对数梅尔谱进行婴儿哭声和咳嗽声检测，得到各个声音样本的实际检测结果；根据所述实际检测结果和预设的期望检测结果计算训练损失；根据所述训练损失对婴儿哭声和咳嗽声检测模型进行模型训练，直至满足预设的训练停止条件，得到训练后的婴儿哭声和咳嗽声检测模型。3.根据权利要求2所述的婴儿哭声和咳嗽声检测方法，其特征在于，在提取所述声音样本集中各个声音样本的对数梅尔谱之前，还包括：对所述声音样本集中的各个声音样本进行数据增强处理，得到各个增强声音样本；将各个增强声音样本分别添加入所述声音样本集中，得到扩充后的声音样本集。4.根据权利要求2所述的婴儿哭声和咳嗽声检测方法，其特征在于，所述根据所述实际检测结果和预设的期望检测结果计算训练损失，包括：根据所述实际检测结果和预设的期望检测结果，使用预设的二元交叉熵损失函数计算所述训练损失。5.根据权利要求1所述的婴儿哭声和咳嗽声检测方法，其特征在于，所述使用预设的婴儿哭声和咳嗽声检测模型对所述目标声音的对数梅尔谱进行检测，得到所述目标声音的检测结果，包括：将所述目标声音的对数梅尔谱输入所述婴儿哭声和咳嗽声检测模型，并获取所述婴儿哭声和咳嗽声检测模型...

【专利技术属性】
技术研发人员：颜霖煌，黄东延，杨显杰，郑泽鸿，丁万，
申请(专利权)人：深圳市优必选科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人