一种婴儿声音检测方法、装置和存储介质制造方法及图纸

技术编号：36500302 阅读：16 留言：0更新日期：2023-02-01 15:21

本发明专利技术公开了一种婴儿声音检测方法、装置和存储介质，其中方法包括以下步骤：获取音频片段；根据当前计算资源的负载情况，对所述音频片段进行缓冲处理，获得缓存音频片段；根据所述缓存音频片段进行啼哭检测，并将检测结果保存至检测队列；根据检测队列中的多次检测结果进行投票处理，获得最终的检测结果。本发明专利技术通过考虑当前计算资源的负载情况，对音频数据进行缓冲处理，能够提高检测的精准度。本发明专利技术可广泛应用于婴儿声音分析技术领域。可广泛应用于婴儿声音分析技术领域。可广泛应用于婴儿声音分析技术领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种婴儿声音检测方法、装置和存储介质

[0001]本专利技术涉及婴儿声音分析
，尤其涉及一种婴儿声音检测方法、装置和存储介质。

技术介绍

[0002]现今婴儿看护是年轻父母的一个重要关注问题，而婴儿尚未学会说话，通常只能通过啼哭表达不适感和需求，当婴儿被单独放置在婴儿床、婴儿车休息或玩耍时，看护人不在身边，无法对婴儿哭声做出及时发现和检测，可能会导致无法意料的后果。近年来，智能家居已逐渐走入人们的生活，给大家的日常起居带来了方便。其中，各种带有婴儿声音检测的装置能够识别婴儿的哭声，并通过各种方法通知其监护人，以便于监护人能更快地发现宝宝的需求，保护宝宝健康茁壮成长。这些装置通常可以集成在婴儿床、婴儿车等产品或者安置在婴儿房中，及时检测婴儿啼哭并提醒看护人。
[0003]然而，现有的婴儿声音检测方法都存在一些不足：在检测方式上，基于简单的模拟电路或仅基于梅尔频谱的检测算法通常准确率不够高，存在漏检或误检的问题；现有基于深度学习的方法在训练和部署上较为复杂，计算成本要求较高，难以在边端实现部署和实时监测。在检测算法运行的设备上，基于云端识别的方案依赖稳定网络，可靠性较低；本地识别方案则受限于部署设备的运算能力，在与其他智能算法共享计算资源时，可能会因为资源争用导致实时性不足，导致提醒不及时，甚至准确度下降。因此需要设计一种准确率更高，且能自动适应所能使用的计算资源，在物联网万物互联的趋势下能灵活调度的实时婴儿声音检测方法。

技术实现思路

[0004]为至少一定程度上解决现有技术中存在的技术问...

【技术保护点】

【技术特征摘要】
1.一种婴儿声音检测方法，其特征在于，包括以下步骤：获取音频片段；根据当前计算资源的负载情况，对所述音频片段进行缓冲处理，获得缓存音频片段；根据所述缓存音频片段进行啼哭检测，并将检测结果保存至检测队列；根据检测队列中的多次检测结果进行投票处理，获得最终的检测结果。2.根据权利要求1所述的一种婴儿声音检测方法，其特征在于，所述获取音频片段，包括：采用驱动程序，从麦克风设备中读取音频片段；其中，所述驱动程序部署在Linux操作系统中。3.根据权利要求2所述的一种婴儿声音检测方法，其特征在于，所述采用驱动程序，从麦克风设备中读取音频片段，包括：调用Linux操作系统的ALSA驱动接口，初始化麦克风设备；从ALSA中获取声卡硬件的时间戳，以及读取音频波形数据；通过消息队列将音频波形数据和时间戳、采样率进行打包，获得音频片段。4.根据权利要求3所述的一种婴儿声音检测方法，其特征在于，所述根据当前计算资源的负载情况，对所述音频片段进行缓冲处理，获得缓存音频片段，包括：从消息队列中读取音频消息；将读取到的音频消息的时间戳和当前时间进行比对，若时间相差超过预设阈值，判定目前检测延迟过高，丢弃所有时间戳在n秒前的未处理的数据包；其中，n为预设的检测窗口长度；根据时间戳判断当前音频片段是否和之前缓冲的内容连续，若不连续，清空缓冲和检测队列；将当前音频消息中的音频波形数据加入缓冲；当缓冲中的音频波形数据达到或超过n秒后，将缓冲中的音频波形数据拼接，作为缓存音频片段。5.根据权利要求1所述的一种婴儿声音检测方法，其特征在于，所述根据所述缓存音频片段进行啼哭检测，包括：对所述缓存音频片段进行特征提取，根据提取的特征和预设的支持向量机进行分类识别，获得识别结果；所...

【专利技术属性】
技术研发人员：谭明奎，胡玮文，游增，陈耀佛，连梓豪，杜卿，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人