一种婴儿声音检测方法、装置和存储介质制造方法及图纸

技术编号:36500302 阅读:16 留言:0更新日期:2023-02-01 15:21
本发明专利技术公开了一种婴儿声音检测方法、装置和存储介质,其中方法包括以下步骤:获取音频片段;根据当前计算资源的负载情况,对所述音频片段进行缓冲处理,获得缓存音频片段;根据所述缓存音频片段进行啼哭检测,并将检测结果保存至检测队列;根据检测队列中的多次检测结果进行投票处理,获得最终的检测结果。本发明专利技术通过考虑当前计算资源的负载情况,对音频数据进行缓冲处理,能够提高检测的精准度。本发明专利技术可广泛应用于婴儿声音分析技术领域。可广泛应用于婴儿声音分析技术领域。可广泛应用于婴儿声音分析技术领域。

【技术实现步骤摘要】
一种婴儿声音检测方法、装置和存储介质


[0001]本专利技术涉及婴儿声音分析
,尤其涉及一种婴儿声音检测方法、装置和存储介质。

技术介绍

[0002]现今婴儿看护是年轻父母的一个重要关注问题,而婴儿尚未学会说话,通常只能通过啼哭表达不适感和需求,当婴儿被单独放置在婴儿床、婴儿车休息或玩耍时,看护人不在身边,无法对婴儿哭声做出及时发现和检测,可能会导致无法意料的后果。近年来,智能家居已逐渐走入人们的生活,给大家的日常起居带来了方便。其中,各种带有婴儿声音检测的装置能够识别婴儿的哭声,并通过各种方法通知其监护人,以便于监护人能更快地发现宝宝的需求,保护宝宝健康茁壮成长。这些装置通常可以集成在婴儿床、婴儿车等产品或者安置在婴儿房中,及时检测婴儿啼哭并提醒看护人。
[0003]然而,现有的婴儿声音检测方法都存在一些不足:在检测方式上,基于简单的模拟电路或仅基于梅尔频谱的检测算法通常准确率不够高,存在漏检或误检的问题;现有基于深度学习的方法在训练和部署上较为复杂,计算成本要求较高,难以在边端实现部署和实时监测。在检测算法运行的设备上,基于云端识别的方案依赖稳定网络,可靠性较低;本地识别方案则受限于部署设备的运算能力,在与其他智能算法共享计算资源时,可能会因为资源争用导致实时性不足,导致提醒不及时,甚至准确度下降。因此需要设计一种准确率更高,且能自动适应所能使用的计算资源,在物联网万物互联的趋势下能灵活调度的实时婴儿声音检测方法。

技术实现思路

[0004]为至少一定程度上解决现有技术中存在的技术问题之一,本专利技术的目的在于提供一种婴儿声音检测方法、装置和存储介质。
[0005]本专利技术所采用的技术方案是:
[0006]一种婴儿声音检测方法,包括以下步骤:
[0007]获取音频片段;
[0008]根据当前计算资源的负载情况,对所述音频片段进行缓冲处理,获得缓存音频片段;
[0009]根据所述缓存音频片段进行啼哭检测,并将检测结果保存至检测队列;
[0010]根据检测队列中的多次检测结果进行投票处理,获得最终的检测结果。
[0011]进一步地,所述获取音频片段,包括:
[0012]采用驱动程序,从麦克风设备中读取音频片段;
[0013]其中,所述驱动程序部署在Linux操作系统中。
[0014]进一步地,所述采用驱动程序,从麦克风设备中读取音频片段,包括:
[0015]调用Linux操作系统的ALSA驱动接口,初始化麦克风设备;
[0016]从ALSA中获取声卡硬件的时间戳,以及读取音频波形数据;
[0017]通过消息队列将音频波形数据和时间戳、采样率进行打包,获得音频片段。
[0018]进一步地,所述根据当前计算资源的负载情况,对所述音频片段进行缓冲处理,获得缓存音频片段,包括:
[0019]从消息队列中读取音频消息;
[0020]将读取到的音频消息的时间戳和当前时间进行比对,若时间相差超过预设阈值,判定目前检测延迟过高,丢弃所有时间戳在n秒前的未处理的数据包;其中,n为预设的检测窗口长度;
[0021]根据时间戳判断当前音频片段是否和之前缓冲的内容连续,若不连续,清空缓冲和检测队列;
[0022]将当前音频消息中的音频波形数据加入缓冲;
[0023]当缓冲中的音频波形数据达到或超过n秒后,将缓冲中的音频波形数据拼接,作为缓存音频片段。
[0024]进一步地,所述根据所述缓存音频片段进行啼哭检测,包括:
[0025]对所述缓存音频片段进行特征提取,根据提取的特征和预设的支持向量机进行分类识别,获得识别结果;
[0026]所述支持向量机通过以下方式获得;
[0027]获取数据集,对数据集进行重采样,并进行特征提取;其中,提取的特征包括梅尔频率倒谱系数、频谱滚降点、频谱质心、过零率、频谱频宽、均方根能量;
[0028]根据提取的特征拟合获得支持向量机。
[0029]进一步地,所述频谱质心定义如下:
[0030]C=Σ
k
S
k
f
k

k
S
k
[0031]频谱频宽为二阶频谱频宽,定义如下:
[0032][0033]其中,S
k
表示第k个窗口的频谱,f
k
表示频谱第k个数据点对应的频率。
[0034]进一步地,所述根据检测队列中的多次检测结果进行投票处理,获得最终的检测结果,包括:
[0035]当检测到检测队列中存储的检测结果达到或超过m次,且最近m次中超过半数的检测结果相同,将该检测结果作为最终的检测结果;其中,m为预设的滤波窗口大小。
[0036]进一步地,所述将该检测结果作为最终的检测结果,包括:
[0037]若检测结果为婴儿正在啼哭,触发预设的报警信息。
[0038]本专利技术所采用的另一技术方案是:
[0039]一种婴儿声音检测装置,包括:
[0040]至少一个处理器;
[0041]至少一个存储器,用于存储至少一个程序;
[0042]当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上所述方法。
[0043]本专利技术所采用的另一技术方案是:
[0044]一种计算机可读存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于执行如上所述方法。
[0045]本专利技术的有益效果是:本专利技术通过考虑当前计算资源的负载情况,对音频数据进行缓冲处理,能够提高检测的精准度。
[0046]另外,基于消息列队和检测列队,在部署时读取音频数据的部分和识别部分分别部署于两个容器之中,使得部署高度模块化,具有更高的灵活性。
附图说明
[0047]为了更清楚地说明本专利技术实施例或者现有技术中的技术方案,下面对本专利技术实施例或者现有技术中的相关技术方案附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本专利技术的技术方案中的部分实施例,对于本领域的技术人员而言,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
[0048]图1是本专利技术实施例中一种动态婴儿啼哭检测方法的步骤流程图。
具体实施方式
[0049]下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
[0050]在本专利技术的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种婴儿声音检测方法,其特征在于,包括以下步骤:获取音频片段;根据当前计算资源的负载情况,对所述音频片段进行缓冲处理,获得缓存音频片段;根据所述缓存音频片段进行啼哭检测,并将检测结果保存至检测队列;根据检测队列中的多次检测结果进行投票处理,获得最终的检测结果。2.根据权利要求1所述的一种婴儿声音检测方法,其特征在于,所述获取音频片段,包括:采用驱动程序,从麦克风设备中读取音频片段;其中,所述驱动程序部署在Linux操作系统中。3.根据权利要求2所述的一种婴儿声音检测方法,其特征在于,所述采用驱动程序,从麦克风设备中读取音频片段,包括:调用Linux操作系统的ALSA驱动接口,初始化麦克风设备;从ALSA中获取声卡硬件的时间戳,以及读取音频波形数据;通过消息队列将音频波形数据和时间戳、采样率进行打包,获得音频片段。4.根据权利要求3所述的一种婴儿声音检测方法,其特征在于,所述根据当前计算资源的负载情况,对所述音频片段进行缓冲处理,获得缓存音频片段,包括:从消息队列中读取音频消息;将读取到的音频消息的时间戳和当前时间进行比对,若时间相差超过预设阈值,判定目前检测延迟过高,丢弃所有时间戳在n秒前的未处理的数据包;其中,n为预设的检测窗口长度;根据时间戳判断当前音频片段是否和之前缓冲的内容连续,若不连续,清空缓冲和检测队列;将当前音频消息中的音频波形数据加入缓冲;当缓冲中的音频波形数据达到或超过n秒后,将缓冲中的音频波形数据拼接,作为缓存音频片段。5.根据权利要求1所述的一种婴儿声音检测方法,其特征在于,所述根据所述缓存音频片段进行啼哭检测,包括:对所述缓存音频片段进行特征提取,根据提取的特征和预设的支持向量机进行分类识别,获得识别结果;所...

【专利技术属性】
技术研发人员:谭明奎胡玮文游增陈耀佛连梓豪杜卿
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1