一种基于迁移学习的音频分类方法技术

技术编号：24251620 阅读：35 留言：0更新日期：2020-05-22 23:37

本发明专利技术公开了一种基于迁移学习的音频分类方法，包括如下步骤：人工标注音频分类数据，建立音频分类数据集；收集公开的文本分类数据，建立公开数据集；筛选出公开数据集中分类在音频分类数据集类别中的数据并与音频分类数据集组成训练集；利用训练集训练分类模型；利用分类模型对音频进行分类。不需要大量标注数据，有效降低成本，集合公开数据集和音频分类数据集，保证模型效果。

An audio classification method based on Transfer Learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于迁移学习的音频分类方法
本专利技术具体涉及到一种基于迁移学习的音频分类方法。
技术介绍
音频分类是音频平台重要组成部分之一。音频分类首先需要人工标注一批分类数据。如果标注大量数据，标注成本高，模型效果好；如果标注少量数据，标注成本低，模型效果差，因此音频分类的方法需要进一步的改进。
技术实现思路
针对上述现有技术存在的缺陷，本专利技术要解决的技术问题是：可以不需要大量标注数的低成本情况下，达到好的模型效果。一种基于迁移学习的音频分类方法，包括如下步骤：人工标注音频分类数据，建立音频分类数据集；收集公开的文本分类数据，建立公开数据集；筛选出公开数据集中分类在音频分类数据集类别中的数据并与音频分类数据集组成训练集；利用训练集训练分类模型；利用分类模型对音频进行分类。进一步地，所述分类模型的Loss为交叉熵Loss。进一步地，所述分类模型的交叉熵Loss的公式为：L＝LD+LC；Data是训练数据集合，d是其中一条样本；dc是它对应的分类，如果是二分类则dc是[0,1]或者[1,0]；如果是多分类，则dc是某一维度为1，其他维度为0的k维数组，k是分类数据量；pj(d)表示模型预测的d属于第j个分类的概率。进一步地，所述LC用于区分音频的类别。进一步地，所述LD用于区分数据来自音频分类数据集还是公开数据集。与现有技术相比，本专利技术的至少包括以下有益效果：1.成...

【技术保护点】
1.一种基于迁移学习的音频分类方法，其特征在于，包括如下步骤：/n人工标注音频分类数据，建立音频分类数据集；/n收集公开的文本分类数据，建立公开数据集；/n筛选出公开数据集中分类在音频分类数据集类别中的数据并与音频分类数据集组成训练集；/n利用训练集训练分类模型；/n利用分类模型对音频进行分类。/n

【技术特征摘要】
1.一种基于迁移学习的音频分类方法，其特征在于，包括如下步骤：
人工标注音频分类数据，建立音频分类数据集；
收集公开的文本分类数据，建立公开数据集；
筛选出公开数据集中分类在音频分类数据集类别中的数据并与音频分类数据集组成训练集；
利用训练集训练分类模型；
利用分类模型对音频进行分类。

2.根据权利要求1所述一种基于迁移学习的音频分类方法，其特征在于：所述分类模型的Loss为交叉熵Loss。

3.根据权利要求2所述一种基于迁移学习的音频分类方法，其特征在于：所述分类模型的交叉熵Loss的公式为：...

【专利技术属性】
技术研发人员：杜春河，丁宁，
申请(专利权)人：广州荔支网络技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人