一种基于神经网络的婴儿哭声识别方法技术

技术编号:32572663 阅读:72 留言:0更新日期:2022-03-09 17:00
本发明专利技术涉及一种基于神经网络的婴儿哭声识别方法,首先获取不同类型的婴儿哭声音频和非婴儿哭声音频数据,并进行预处理;然后进行fbank特征提取;采用长短时特征融合的方法得到训练模型;将所有训练模型放置到神经网络中进行训练,通过模型综合投票技术将不同训练模型加权平均得到最终的预测模型;将预测模型由浮点模型转为定点模型,以便于嵌入式移植;利用拾音器采集环境音频数据,并判断环境音频数据是否为静音,如果不是静音则对其进行特征提取,然后利用步骤七得到的定点模型进行判断是否有婴儿哭声,若有婴儿哭声,则利用定点模型判断出婴儿哭声种类;根据不同种类婴儿哭声进行不同方式的安抚。本哭声识别方法具有简单可靠的优点。靠的优点。靠的优点。

【技术实现步骤摘要】
一种基于神经网络的婴儿哭声识别方法


[0001]本专利技术涉及声音检测领域,具体地讲,涉及一种基于神经网络的婴儿哭声识别方法。

技术介绍

[0002]婴儿的监护人总是希望能更好地掌握儿童的精神状态,而婴儿因为语言能力较弱,主要是用哭声来表达自己的不适,比如恐惧、孤独等感情和饥饿、疼痛等身体感受,所以如果能够及时通过获悉婴儿的哭声来了解其精神状态,就可以更好地照顾安抚婴儿,使其健康成长。然而,由于监护人不是时刻都能在婴儿身边,比如需要工作、做家务,准备食物等的时候,经常将婴儿哄睡或者放在安全的区域内玩耍。然而婴儿的哭声可能会因为背景噪声等原因无法被监护人听到,有鉴于此,如果有一种方法能够准确快速地识别婴儿哭声,就可以通过婴儿监护器或类似的简易声音传输设备让监护人即刻了解到婴儿的需求。
[0003]传统的婴儿哭声识别,主要是基于不同声音的音质、频率等性质,在滤波之后进行声音的分类或识别,在背景噪声复杂的情况下很难做到准确快速的区分,容易受到环境的影响而漏报误报。有鉴于此,目前有些研究者采用了深度学习的方法来训练识别系统智能地分析声音的特质,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络的婴儿哭声识别方法,其特征在于:步骤如下:步骤一:获取不同类型的婴儿哭声音频和不同类型的非婴儿哭声音频;步骤二:设定婴儿哭声音频为正样本,非婴儿哭声音频为负样本,将正样本和负样本音频数据进行预处理;步骤三:对预处理后的正样本和负样本音频进行fbank特征提取;步骤四:对每一种类型的音频在fbank特征提取过程中,将特征的时域维度和频域维度随机置零,以对音频进行增强操作;步骤五:长短时特征融合:对每一种类型的音频取不同时长的音频片段进行特征数据提取,将各个时长对应的特征数据进行融合后得到训练模型;步骤六:将所有训练模型放置到神经网络中进行训练,通过模型综合投票技术将不同训练模型加权平均得到最终的预测模型;步骤七:将预测模型由浮点模型转为定点模型,以便于嵌入式移植;步骤八:利用拾音器采集环境音频数据,并判断环境音频数据是否为静音,如果不是静音则对其进行特征提取,然后利用步骤七得到的定点模型进行判断是否有婴儿哭声,若有婴儿哭声,则利用定点模型判断出婴儿哭声种类;步骤九:根据不同种类婴儿哭声进行不同方式的安抚。2.根据权利要求1所述的基于神经网络的婴儿哭声识别方法,其特征在于:在所述步骤二中,预处理是指将正样本和负样本音频数据统一为:wav格式、单声...

【专利技术属性】
技术研发人员:王全强邢宇航王权泳
申请(专利权)人:杭州七格智联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1