音频分类模型的训练方法、音频分类方法、装置及设备制造方法及图纸

技术编号:24760235 阅读:35 留言:0更新日期:2020-07-04 10:06
本申请提供一种音频分类模型的训练方法、音频分类方法、装置及设备,属于音频处理技术领域。音频分类模型的训练方法包括:获取音频样本,音频样本包括:语音音频样本、音乐音频样本;对各音频样本进行分帧,并提取帧特征;采用预设窗函数,提取各音频样本中每帧的窗特征,并根据帧特征获取组合特征,其中,组合特征标记语音标签或音乐标签;采用组合特征和预设神经网络,训练获取音频分类模型。本申请可以将复杂程度较高的音乐音频和语音音频进行分类,进而提高分类结果的准确性。

Training method, audio classification method, device and equipment of audio classification model

【技术实现步骤摘要】
音频分类模型的训练方法、音频分类方法、装置及设备
本申请涉及音频处理
,具体而言,涉及一种音频分类模型的训练方法、音频分类方法、装置及设备。
技术介绍
音乐和语音是音频中重要的两类数据,而在音频的现实应用中,音乐和语音很多时候是混在一起的,即有的时间段是音乐,有的时间段是语音,有的时候两者混叠在一起。为了将音乐和语音区分开来,相关技术人员通常是基于相关性的后验决策方法对贝叶斯最大后验分类器的结果进行了处理来实现语音和音乐的分类。或者,采用的盲分离技术,将混在一起的背景音乐与人声分离开来,分别采用不同的技术进行后处理。然而,上述现有技术主要是根据统计得到的音频数据的数据特征和专家的经验来进行分类,分类的准确性不高。
技术实现思路
本申请的目的在于提供一种音频分类模型的训练方法、音频分类方法、装置及设备,可以提高音频分类结果的准确性。本申请的实施例是这样实现的:本申请实施例的一方面,提供一种音频分类模型的训练方法,该方法包括:获取音频样本,音频样本包括:语音音频样本、音乐音频样本;<本文档来自技高网...

【技术保护点】
1.一种音频分类模型的训练方法,其特征在于,包括:/n获取音频样本,所述音频样本包括:语音音频样本、音乐音频样本;/n对各所述音频样本进行分帧,并提取帧特征;/n采用预设窗函数,提取各所述音频样本中每帧的窗特征,并根据所述帧特征获取组合特征,其中,所述组合特征标记语音标签或音乐标签;/n采用所述组合特征和预设神经网络,训练获取音频分类模型。/n

【技术特征摘要】
1.一种音频分类模型的训练方法,其特征在于,包括:
获取音频样本,所述音频样本包括:语音音频样本、音乐音频样本;
对各所述音频样本进行分帧,并提取帧特征;
采用预设窗函数,提取各所述音频样本中每帧的窗特征,并根据所述帧特征获取组合特征,其中,所述组合特征标记语音标签或音乐标签;
采用所述组合特征和预设神经网络,训练获取音频分类模型。


2.如权利要求1所述的方法,其特征在于,所述采用所述组合特征和预设神经网络,训练获取音频分类模型,包括:
将所述组合特征代入所述预设神经网络进行前向运算,并根据损失函数获取每次迭代的梯度值;
根据所述梯度值调整所述预设神经网络中的参数后,继续训练,直到满足收敛条件,获取所述音频分类模型。


3.如权利要求1所述的方法,其特征在于,所述采用预设窗函数,提取各所述音频样本中每帧的窗特征,并根据所述帧特征获取组合特征之后,还包括:
将所述组合特征划分为训练样本集和测试样本集。


4.如权利要求3所述的方法,其特征在于,所述采用所述组合特征和预设神经网络,训练获取音频分类模型,包括:
采用所述训练样本集和预设神经网络,训练获取音频分类模型。


5.如权利要求3所述的方法,其特征在于,所述采用所述组合特征和预设神经网络,训练获取音频分类模型之后,还包括:
将所述测试样本集代入所述音频分类模型,获取测试分类结果;
根据所述测试分类结果以及所述测试样本集中组合特征的标签,判断所述音频分类模型是否合格。


6.一种音频分类方法,其特征在于,包括:
对待识别音频信号进行分帧,并提取各帧的帧特征;
采用预设窗函数,提取各所述帧的窗特征,并根据所述帧特征获取组合特征;
将所述组合特征代入音频分类模型,将所述待识别音频信号的音乐信号和语音信号分离,其中,所述音频...

【专利技术属性】
技术研发人员:邓菁王秋明
申请(专利权)人:北京远鉴信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1