一种信号分类方法、装置、设备及存储介质制造方法及图纸

技术编号:27848342 阅读:29 留言:0更新日期:2021-03-30 13:04
本发明专利技术实施例提供一种信号分类方法、装置、设备及存储介质,该方法包括:从第一音频信号中提取第一LogMel频率特征向量,将第一LogMel频率特征向量输入到预先训练好的第一DNN模型中,得到第一音频信号对应的第一预测类别;其中,第一DNN模型是基于预先训练好的降噪自编码器模型,使用训练数据集中的第一标签信息训练得到的DNN模型。因此,本发明专利技术提高了信号分类的准确性。号分类的准确性。号分类的准确性。

【技术实现步骤摘要】
一种信号分类方法、装置、设备及存储介质


[0001]本专利技术涉及计算机领域,尤其涉及一种信号分类方法、装置、设备及存储介质。

技术介绍

[0002]儿童哭声种类有很多种,如何区分这些种类是一个很重要的问题。
[0003]现有技术中,可以采用经验判断法来区分儿童哭声的不同种类。比如:先将音频信号进行FFT(Fast Fourier Transform,快速傅里叶变换)后统计基频频率、能量波形、音调、音量等;再人工设置阈值,以及将基频频率值、波形能量值、音调值、音量值和对应的阈值进行比较,并通过是否大于阈值来对儿童哭声进行分类。
[0004]但是,上述经验判断法中设计到的阈值会主要靠经验和小范围的实验来确定,使得分类结果主观性较强,准确性较低。

技术实现思路

[0005]针对现有技术存在的问题,本专利技术实施例提供一种信号分类方法、装置、设备及存储介质。
[0006]第一方面,本专利技术实施例提供一种信号分类方法,包括:
[0007]确定待分类的第一音频信号;
[0008]从所述第一音频信号本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种信号分类方法,其特征在于,包括:确定待分类的第一音频信号;从所述第一音频信号中提取第一对数梅尔LogMel频率特征向量;将所述第一LogMel频率特征向量输入到预先训练好的第一深度神经网络DNN模型中,得到所述第一音频信号对应的第一预测类别;其中,所述第一DNN模型是基于预先训练好的降噪自编码器模型,使用训练数据集中的第一标签信息训练得到的DNN模型。2.根据权利要求1所述的信号分类方法,其特征在于,还包括:获取训练数据集,所述训练数据集包括用于训练的第二音频信号和所述第一标签信息,所述第一标签信息用于表征所述第二音频信号所属的类别;从所述第二音频信号中提取第二LogMel频率特征向量;利用所述第二LogMel频率特征向量进行降噪自编码器训练,得到所述降噪自编码器模型。3.根据权利要求2所述的信号分类方法,其特征在于,所述从所述第二音频信号中提取第二LogMel频率特征向量,包括:对所述第二音频信号进行分帧、加窗和傅里叶变换,得到所述第二音频信号的声谱图;从所述第二音频信号的声谱图中提取所述第二LogMel频率特征向量。4.根据权利要求3所述的信号分类方法,其特征在于,所述从所述第二音频信号的声谱图中提取所述第二LogMel频率特征向量,包括:从所述第二音频信号的声谱图的每一帧中提取第三LogMel频率特征向量;计算所有帧的所述第三LogMel频率特征向量的平均值,所述平均值为所述第二LogMel频率特征向量。5.根据权利要求2所述的信号分类方法,其特征在于,还包括:基于所述降噪自编码器模型构造第二DNN模型;利用所述第二LogMel频率特征向量和所述第一标签信息,对所述第二DN...

【专利技术属性】
技术研发人员:周建超付上海胡斌周冰李琳
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1