一种基于迁移学习的音频分类方法技术

技术编号:24251620 阅读:35 留言:0更新日期:2020-05-22 23:37
本发明专利技术公开了一种基于迁移学习的音频分类方法,包括如下步骤:人工标注音频分类数据,建立音频分类数据集;收集公开的文本分类数据,建立公开数据集;筛选出公开数据集中分类在音频分类数据集类别中的数据并与音频分类数据集组成训练集;利用训练集训练分类模型;利用分类模型对音频进行分类。不需要大量标注数据,有效降低成本,集合公开数据集和音频分类数据集,保证模型效果。

An audio classification method based on Transfer Learning

【技术实现步骤摘要】
一种基于迁移学习的音频分类方法
本专利技术具体涉及到一种基于迁移学习的音频分类方法。
技术介绍
音频分类是音频平台重要组成部分之一。音频分类首先需要人工标注一批分类数据。如果标注大量数据,标注成本高,模型效果好;如果标注少量数据,标注成本低,模型效果差,因此音频分类的方法需要进一步的改进。
技术实现思路
针对上述现有技术存在的缺陷,本专利技术要解决的技术问题是:可以不需要大量标注数的低成本情况下,达到好的模型效果。一种基于迁移学习的音频分类方法,包括如下步骤:人工标注音频分类数据,建立音频分类数据集;收集公开的文本分类数据,建立公开数据集;筛选出公开数据集中分类在音频分类数据集类别中的数据并与音频分类数据集组成训练集;利用训练集训练分类模型;利用分类模型对音频进行分类。进一步地,所述分类模型的Loss为交叉熵Loss。进一步地,所述分类模型的交叉熵Loss的公式为:L=LD+LC;Data是训练数据集合,d是其中一条样本;dc是它对应的分类,如果是二分类则dc是[0,1]或者[1,0];如果是多分类,则dc是某一维度为1,其他维度为0的k维数组,k是分类数据量;pj(d)表示模型预测的d属于第j个分类的概率。进一步地,所述LC用于区分音频的类别。进一步地,所述LD用于区分数据来自音频分类数据集还是公开数据集。与现有技术相比,本专利技术的至少包括以下有益效果:1.成本低,不需要大量标注数据;2.集合公开数据集和音频分类数据集,保证模型效果。附图说明图1为本专利技术一种基于迁移学习的音频分类方法的流程图。具体实施方式以下实施例对本专利技术进行说明,但本专利技术并不受这些实施例所限制。对本专利技术的具体实施方式进行修改或者对部分技术特征进行等同替换,而不脱离本专利技术方案的精神,其均应涵盖在本专利技术请求保护的技术方案范围当中。如图1所示,一种基于迁移学习的音频分类方法,包括如下步骤:步骤S100:人工标注音频分类数据,建立音频分类数据集,先通过人工标注定量的音频分类数据;步骤S101:收集公开的文本分类数据,建立公开数据集;步骤S102:筛选出公开数据集中分类在音频分类数据集类别中的数据并与音频分类数据集组成训练集;步骤S103:利用训练集训练分类模型;步骤S104:利用分类模型对音频进行分类。不需要大量标注数据有效降低成本,通过集合公开数据集和音频分类数据集,保证模型效果。本专利技术所述分类模型的Loss为交叉熵Loss,交叉熵Loss的公式为:L=LD+LC;Data是训练数据集合,d是其中一条样本;dc是它对应的分类,如果是二分类则dc是[0,1]或者[1,0];如果是多分类,则dc是某一维度为1,其他维度为0的k维数组,k是分类数据量;pj(d)表示模型预测的d属于第j个分类的概率。本专利技术所述LC用于区分音频的类别。本专利技术所述LD用于区分数据来自音频分类数据集还是公开数据集。以上所述的具体实施方式对本专利技术的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本专利技术的最优选实施例,并不用于限制本专利技术,凡在本专利技术的原则范围内所做的任何修改、补充和等同替换等,均应包含在本专利技术的保护范围之内。本文档来自技高网...

【技术保护点】
1.一种基于迁移学习的音频分类方法,其特征在于,包括如下步骤:/n人工标注音频分类数据,建立音频分类数据集;/n收集公开的文本分类数据,建立公开数据集;/n筛选出公开数据集中分类在音频分类数据集类别中的数据并与音频分类数据集组成训练集;/n利用训练集训练分类模型;/n利用分类模型对音频进行分类。/n

【技术特征摘要】
1.一种基于迁移学习的音频分类方法,其特征在于,包括如下步骤:
人工标注音频分类数据,建立音频分类数据集;
收集公开的文本分类数据,建立公开数据集;
筛选出公开数据集中分类在音频分类数据集类别中的数据并与音频分类数据集组成训练集;
利用训练集训练分类模型;
利用分类模型对音频进行分类。


2.根据权利要求1所述一种基于迁移学习的音频分类方法,其特征在于:所述分类模型的Loss为交叉熵Loss。


3.根据权利要求2所述一种基于迁移学习的音频分类方法,其特征在于:所述分类模型的交叉熵Loss的公式为:...

【专利技术属性】
技术研发人员:杜春河丁宁
申请(专利权)人:广州荔支网络技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1