一种音频数据分类方法、装置、设备及介质制造方法及图纸

技术编号:37606458 阅读:26 留言:0更新日期:2023-05-18 11:58
本申请实施例提供了一种音频数据分类方法、装置、设备及介质,在该方法中,获取音频数据集;将音频数据集输入到基础分类器,基于基础分类器,确定音频数据集的基类权重矩阵;将音频数据集输入到新类分类器,基于新类分类器,确定音频数据集的新类权重矩阵;根据基类权重矩阵和新类权重矩阵,确定音频数据集的分类结果。在该方法中,基础分类器可以确定音频数据集的基类权重矩阵,新类分类器可以确定音频数据集的新类权重矩阵,然后根据基类权重矩阵和新类权重矩阵确定音频数据集的分类结果,既适用于固定类别词汇表的场景,又适用于动态变换或者先验未知的场景,因此可以提高不同场景中的识别能力,提高音频分类精度。提高音频分类精度。提高音频分类精度。

【技术实现步骤摘要】
一种音频数据分类方法、装置、设备及介质


[0001]本专利技术涉及深度学习
,尤其涉及一种音频数据分类方法、装置、设备及介质。

技术介绍

[0002]数据时代下企业变革和数字化转型的重点已从“数据”升级为“数据资产”,作为企业数字化流程中不可或缺的音频数据逐渐成为关注重点。而数据分类分级作为数据资产梳理的关键步骤,其准确性对差异化安全防护和精细化安全管控具有重要指导意义。随着计算机听觉技术的发展,深度学习在音频数据分类分级中发挥了重要作用。
[0003]然而,深度神经网络在训练过程中容易出现过拟合问题且对于数据量的要求比较高,而收集大规模的有效音频数据用以模型训练并不现实,导致模型识别音频的难度大,精度低。
[0004]因此,相关技术中的音频数据分类模型中通常基于固定的类别词汇表来实现高精度的分类,但是这对于动态变换或者先验未知场景中的识别能力有限,在这些场景下的音频分类精度较低。

技术实现思路

[0005]本申请实施例提供了一种音频数据分类方法、装置、设备及介质,用以解决现有技术中音频分类精度较低的问题。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种音频数据分类方法,其特征在于,所述方法包括:获取音频数据集;将所述音频数据集输入到基础分类器,基于所述基础分类器,确定所述音频数据集的基类权重矩阵;将所述音频数据集输入到新类分类器,基于所述新类分类器,确定所述音频数据集的新类权重矩阵;根据所述基类权重矩阵和所述新类权重矩阵,确定所述音频数据集的分类结果。2.如权利要求1所述的方法,其特征在于,所述获取音频数据集包括:对原始音频数据集进行第一数据增强,所述第一数据增强包括以下一种或多种数据增强处理:音频旋转、音频调音、音频变调、或加噪处理;将第一数据增强后的所述原始音频数据集转化为梅尔声谱图;计算所述梅尔声谱图中的平均值;采用所述平均值对所述梅尔声谱图中选择的行数据和/或列数据进行替换,得到第二数据增强后的所述梅尔声谱图;根据所述原始音频数据集和所述第二数据增强后的梅尔声谱图,确定所述音频数据集。3.如权利要求1或2所述的方法,其特征在于,所述基础分类器中最后一个卷积层之后连接有全局时间池化层。4.如权利要求1或2所述的方法,其特征在于,所述方法还包括:在基类中确定用于训练所述新类分类器的伪新类,并确定所述伪新类的多个标记数据以及每个标记数据属于所述伪新类的权重;将所述多个标记数据、所述每个标记数据属于所述伪新类的权重、以及所述基础分类器输出的基类权重向量输入所述新类分类器;基于所述新类分类器,根据所述多个标记数据以及所述每个标记数据属于所述伪新类的权重,计算所述伪新类的平均特征向量;基于所述新类分类器,对所述平均特征向量和所述基类权重向量进行加权处理,得到所述伪新类的权重向量;根据所述伪新类的权重向量和所述基类权重向量,对基类权重矩阵进行更新;根据更新后的基类权重矩阵,...

【专利技术属性】
技术研发人员:周涛陈宇边占朝刘紫千
申请(专利权)人:天翼安全科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1