基于振动频谱对比的婴儿哭声类别检测方法、装置及设备制造方法及图纸

技术编号:38577659 阅读:14 留言:0更新日期:2023-08-26 23:24
本发明专利技术属于语音识别技术领域,解决了现有技术通过语音识别判断婴儿哭声,存在准确性低的技术问题,提供了一种基于振动频谱对比的婴儿哭声类别检测方法、装置及设备。该方法包括:获取各婴儿哭声类别对应的阈值;将采集的婴儿啼哭时与婴儿声带振动相对应的电信号对应的振动频谱与数据库中的标准振动频谱进行对比,得到此时哭声与各哭声类别的相似度值,找出最大相似度值对应的哭声类别,将所述最大相似度值与表征所述最大相似度值对应的哭声类别的阈值进行对比,输出哭声类别。本发明专利技术还包括用于执行上述方法的装置及设备。本发明专利技术能够准确检测婴儿个体差异造成的发声差异,提高基于振动频谱对比的婴儿哭声类别检测的准确性。动频谱对比的婴儿哭声类别检测的准确性。动频谱对比的婴儿哭声类别检测的准确性。

【技术实现步骤摘要】
基于振动频谱对比的婴儿哭声类别检测方法、装置及设备
[0001]本申请是2021年2月26日提交、专利技术名称为“婴儿哭声类别识别方法、装置及设备”申请号为202110218126.6的专利技术专利申请的分案申请。


[0002]本专利技术涉及语音识别
,尤其涉及一种基于振动频谱对比的婴儿哭声类别检测方法、装置及设备。

技术介绍

[0003]随着语音识别技术的发展,将语音识别应用到越来越多的领域,比如识别婴儿各种类别的哭声,以确定婴儿对应的各种状况。针对婴儿哭声的识别,现有技术中一般采用的方法为:采用语音采集技术采集哭声,将采集得到的哭声与已设置的婴儿哭声相匹配,确定是否为婴儿哭声,再将确认的婴儿哭声与已设置的哭声类别相匹配,匹配成功后,就可以确认采集的哭声对应的哭声类别,最终确认婴儿哭声的具体含义。但是,由于婴儿个体之间存在差异,通常相同哭声表达的不同的需求,特别是在婴儿发声异常时,如声音沙哑,此时采集的音频信息明显无法判断出婴儿的哭声类别;因此,采用语音识别技术识别婴儿哭声时,准确度和精准度不高,导致用户体验度不高。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供了一种基于振动频谱对比的婴儿哭声类别检测方法、装置及设备,用以解决通过语音识别判断婴儿哭声,存在准确性低的技术问题。
[0005]本专利技术采用的技术方案是:
[0006]本专利技术提供了一种基于振动频谱对比的婴儿哭声类别检测方法,其特征在于,所述方法包括:
[0007]获取各婴儿哭声类别对应的阈值;
[0008]将采集的婴儿啼哭时与婴儿声带振动相对应的电信号对应的振动频谱与数据库中的标准振动频谱进行对比,得到此时哭声与各哭声类别的相似度值,将所有相似度值作为一个相似度值组;
[0009]从所述相似度值组中找出最大相似度值对应的哭声类别,将所述最大相似度值与表征所述最大相似度值对应的哭声类别的阈值进行对比,输出哭声类别。
[0010]优选地,在所述将采集的婴儿啼哭时与婴儿声带振动相对应的电信号对应的振动频谱与数据库中的标准振动频谱进行对比之前还包括:
[0011]获取婴儿啼哭时与婴儿声带振动相对应的电信号;
[0012]对所述电信号按预设时长进行分段,得到多个连续的电信号片段;
[0013]对多个连续的所述电信号片段进行短时傅里叶变换,输出所述振动频谱;
[0014]优选地,在所述获取婴儿啼哭时与婴儿声带振动相对应的电信号之前还包括:
[0015]获取检测到的音频信号;
[0016]对所述音频信号进行处理,提取所述音频信号的MFCC特征;
[0017]将所述MFCC特征输入预设的婴儿哭声识别模型,确定所述婴儿当前是否在啼哭。
[0018]优选地,所述对所述音频信号进行处理,提取所述音频信号的MFCC特征包括:
[0019]对采集的每一帧音频进行傅里叶变换得到音频信号的带宽,确定目标带宽;
[0020]按目标带宽进行滤波处理,得到梅尔频率倒谱系数;
[0021]对所述梅尔频率倒谱系数进行对数变换进行放大,利用离散余弦变化提取梅尔频率倒谱系数的离散值作为梅尔频率倒谱系数(MFCC)特征。
[0022]优选地,所述将采集的婴儿啼哭时与婴儿声带振动相对应的电信号对应的振动频谱与数据库中的标准振动频谱进行对比,得到此时哭声与各哭声类别的相似度值,将所有相似度值作为一个相似度值组包括:
[0023]根据公式对所述振动频谱与各所述标准振动频谱进行对比,输出所述相似度值组;
[0024]其中,X为振动频谱,Y为数据库中的标准振动频谱,Xi为振动频谱的第i个信号片段的值,Yi为标准振动频谱的第i个信号片段的值;μ_x和μ_y分别为X中各电信号片段和Y中各电信号片段的均值,σ_x和σ_y分别为X中各电信号片段和Y中各电信号片段的标准差,Q为采集声带振动对应的电信号长度。
[0025]优选地,所述从所述相似度值组中找出最大相似度值对应的哭声类别,将所述最大相似度值与表征所述最大相似度值对应的哭声类别的阈值进行对比,输出哭声类别包括:
[0026]将所述最大相似度值与表征所述最大相似度值对应的哭声类别的阈值进行对比;
[0027]对最大相似度值大于哭声类别阈值进行计数,若连续k次最大相似度值均大于哭声类别阈值,则输出该哭声类别。
[0028]优选地,所述从所述相似度值组中找出最大相似度值对应的哭声类别,将所述最大相似度值与表征所述最大相似度值对应的哭声类别的阈值进行对比,输出哭声类别还包括:
[0029]若后一最大相似度值对应的哭声类别不同,则计数清零;
[0030]若计数过程中出现最大相似度值小于哭声类别阈值,则计数清零。
[0031]本专利技术还提供了一种基于振动频谱对比的婴儿哭声类别检测装置,其特征在于,包括:
[0032]哭声类别阈值获取模块,用于获取各婴儿哭声类别对应的阈值;
[0033]振动频谱对比分析模块,用于将采集的婴儿啼哭时与婴儿声带振动相对应的电信号对应的振动频谱与数据库中的标准振动频谱进行对比,得到此时哭声与各哭声类别的相似度值,将所有相似度值作为一个相似度值组;
[0034]哭声类别输出模块,用于从所述相似度值组中找出最大相似度值对应的哭声类别,将所述最大相似度值与表征所述最大相似度值对应的哭声类别的阈值进行对比,输出哭声类别。
[0035]本专利技术还提供了一种电子设备,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现上述任一项所述的方法。
[0036]本专利技术还提供了一种介质,其上存储有计算机程序指令,当所述计算机程序指令被处理器执行时实现上述任一项所述的方法。
[0037]综上所述,本专利技术的有益效果如下:
[0038]本专利技术提供的一种基于振动频谱对比的婴儿哭声类别检测方法、装置及设备,通过获取婴儿啼哭时声带振动的电信号,将该电信号转换为对应的振动频谱,将振动频谱与数据库的标准振动频谱进行对比;得到与振动频谱对应的哭声类别。利用婴儿声带振动的振动频谱判断婴儿哭声类型;能够准确检测婴儿个体差异造成的发声差异,或婴儿声音沙哑等异常时造成的哭声异常,提高基于振动频谱对比的婴儿哭声类别检测的准确性。
附图说明
[0039]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,这些均在本专利技术的保护范围内。
[0040]图1为本专利技术实施方式一的实施例1中基于振动频谱对比的婴儿哭声类别检测方法的流程示意图;
[0041]图2为本专利技术实施方式一的实施例1中获取振动频谱的流程示意图;
[0042]图3为本专利技术实施方式一的实施例1中通过傅里叶变换获取振动频谱的流程示意图;
[0043]图4本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于振动频谱对比的婴儿哭声类别检测方法,其特征在于,所述方法包括:获取各婴儿哭声类别对应的阈值;将采集的婴儿啼哭时与婴儿声带振动相对应的电信号对应的振动频谱与数据库中的标准振动频谱进行对比,得到此时哭声与各哭声类别的相似度值,将所有相似度值作为一个相似度值组;从所述相似度值组中找出最大相似度值对应的哭声类别,将所述最大相似度值与表征所述最大相似度值对应的哭声类别的阈值进行对比,输出哭声类别。2.根据权利要求1所述的基于振动频谱对比的婴儿哭声类别检测方法,其特征在于,在所述将采集的婴儿啼哭时与婴儿声带振动相对应的电信号对应的振动频谱与数据库中的标准振动频谱进行对比之前还包括:获取婴儿啼哭时与婴儿声带振动相对应的电信号;对所述电信号按预设时长进行分段,得到多个连续的电信号片段;对多个连续的所述电信号片段进行短时傅里叶变换,输出所述振动频谱。3.根据权利要求2所述的基于振动频谱对比的婴儿哭声类别检测方法,其特征在于,在所述获取婴儿啼哭时与婴儿声带振动相对应的电信号之前还包括:获取检测到的音频信号;对所述音频信号进行处理,提取所述音频信号的MFCC特征;将所述MFCC特征输入预设的婴儿哭声识别模型,确定所述婴儿当前是否在啼哭。4.根据权利要求3所述的基于振动频谱对比的婴儿哭声类别检测方法,其特征在于,所述对所述音频信号进行处理,提取所述音频信号的MFCC特征包括:对采集的每一帧音频进行傅里叶变换得到音频信号的带宽,确定目标带宽;按目标带宽进行滤波处理,得到梅尔频率倒谱系数;对所述梅尔频率倒谱系数进行对数变换进行放大,利用离散余弦变化提取梅尔频率倒谱系数的离散值作为梅尔频率倒谱系数(MFCC)特征。5.根据权利要求1所述的基于振动频谱对比的婴儿哭声类别检测方法,其特征在于,所述将采集的婴儿啼哭时与婴儿声带振动相对应的电信号对应的振动频谱与数据库中的标准振动频谱进行对比,得到此时哭声与各哭声类别的相似度值,将所有相似度值作为一个相似度值组包括:根据公式对所述振动频谱与各所述标准振动频谱进行对比,输出所述相似度值组;其中,X为振动频谱,Y为数据库中的标准振动频谱,Xi为振动频谱...

【专利技术属性】
技术研发人员:陈辉张智雷奇文艾伟胡国湖
申请(专利权)人:武汉星巡智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1