哭声检测模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33631989 阅读:22 留言:0更新日期:2022-06-02 01:37
本发明专利技术适用于音频处理技术领域,提供了一种哭声检测模型的训练方法、装置、电子设备及存储介质,该方法包括:获取训练数据集,训练数据集中包括每个训练样本对应的音频级别的标签、段级别的标签以及音频特征,使用训练数据集对预先构建好的哭声检测模型进行训练,得到训练好的哭声检测模型,从而通过双标签联合训练哭声检测模型,在兼顾数据集不足的同时,提高了哭声检测模型的训练效果。高了哭声检测模型的训练效果。高了哭声检测模型的训练效果。

【技术实现步骤摘要】
哭声检测模型的训练方法、装置、电子设备及存储介质


[0001]本专利技术属于音频处理
,尤其涉及一种哭声检测模型的训练方法、装置、电子设备及存储介质。

技术介绍

[0002]对于普通家庭来说,婴儿看护需要消耗大量的人力、物力和财力,智能婴儿看护设备的出现,能有效减少看护家长的负担。
[0003]现有的智能监护设备,其声音检测模型在训练过程中,一方面由于哭声开源数据集较少,声音数量有限,收集较为困难,另一方面由于实际环境中噪音的不确定性和不稳定性导致婴儿哭声检测准确率和精度并不高。

技术实现思路

[0004]本专利技术的目的在于提供一种哭声检测模型的训练方法、装置、电子设备及存储介质,旨在解决由于现有技术中基于少量数据集训练出的声音检测模型检测性能不够高的问题。
[0005]一方面,本专利技术提供一种哭声检测模型的训练方法,所述方法包括下述步骤:
[0006]获取训练数据集,所述训练数据集中包括每个训练样本对应的音频级别的标签、段级别的标签以及音频特征;
[0007]使用所述训练数据集对预先构本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种哭声检测模型的训练方法,其特征在于,所述方法包括下述步骤:获取训练数据集,所述训练数据集中包括每个训练样本对应的音频级别的标签、段级别的标签以及音频特征;使用所述训练数据集对预先构建好的哭声检测模型进行训练,得到训练好的哭声检测模型。2.如权利要求1所述的方法,其特征在于,获取训练数据集的步骤,包括:生成每个所述训练样本的双标签,并提取每个所述训练样本的音频特征,所述双标签包括所述音频级别的标签和所述段级别的标签;生成每个所述训练样本的双标签的步骤,包括:根据所述训练样本中是否包含哭声生成所述音频级别的标签;根据预设的语音分帧参数、预设的输入特征维度下采样倍数以及所述训练样本的预设长度,获取每个段级别标签对应的音频段,基于每个所述音频段中哭声对应的音频采样点数量与预设的采样点数量阈值的比较结果,生成所述段级别的标签。3.如权利要求2所述的方法,其特征在于,提取每个所述训练样本的音频特征的步骤之前,还包括:对每个所述训练样本进行数据增广;提取每个所述训练样本的音频特征的步骤,还包括:提取数据增广后的每个训练样本的音频特征,所述音频特征为Fbank特征。4.如权利要求1所述的方法,其特征在于,所述哭声检测模型包括依次连接的主干网络和双标签网络,所述双标签网络包括依次连接的段级别网络和音频级别网络,所述段级别网络包括依次连接的一维卷积层和激活层,所述音频级别网络包括池化层。5.如权利要求4所述的方法,其特征在于,对预先构建好的哭声检测模型进行训练的步骤,包括:对所述主干网络提取的特征图进行掩膜处理,基于掩膜处理后的特征图对所述哭声检测模型进行训练;对所述主干网络提取的特征图进行掩膜处理的步骤,包括:根据预设的第一概...

【专利技术属性】
技术研发人员:沙露露
申请(专利权)人:珠海亿智电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1