基于标签深度分析的音乐自动标注方法技术

技术编号：21432248 阅读：32 留言：0更新日期：2019-06-22 11:56

本发明专利技术公开了一种基于标签深度分析的音乐自动标注方法，包括以下步骤：S1、收集音乐数据并结合音乐标签体系进行数据清洗；S2、对音乐数据进行采样，转换为梅尔频谱图并进行数据切片；S3、基于一维卷积网络构建音频多层级特征提取网络，通过有监督学习进行参数预训练；S4、基于二维卷积网络进行音乐标签向量表示学习，获取音乐标签特征；S5、实现音频多层级特征与音乐标签特征的特征聚合；S6、基于聚合特征进行最终的音乐标签预测。本发明专利技术克服了传统音乐标注方式不能应用于大规模音乐数据集的困难，根据音频内容对音乐进行自动标注，减少了人工维护音乐标签库的工作量，具有很好的可用性。

全部详细技术资料下载

【技术实现步骤摘要】
基于标签深度分析的音乐自动标注方法
本专利技术涉及音乐信息研究领域，具体涉及一种基于标签深度分析的音乐自动标注方法。
技术介绍
近年来，数字音乐日益普及，用户在互联网上可访问的音乐数量已超过3000万首。另外，由于用户经常在社交媒体上发布大量原创歌曲、翻唱歌曲和其他多媒体资源，音乐的类型日益多元化。作为一种组织海量音乐数据的有效手段，丰富的音乐标注信息对于在线音乐产品有重要价值。音乐标注信息也为音乐检索、音乐发现服务提供很高的潜在经济价值。基于此，音乐自动标注作为一种有效的音乐信息丰富方法受到越来越多的关注与研究。深度神经网络已经成功应用于音乐自动标注领域。深度学习通常需要一个规模足够大的训练集，而唯一满足这个要求的只有在线音乐应用下用户标注的音乐数据集。在这些用户生成的标注元数据中，音乐标签不仅用于描述音乐本身属性如乐器、发布日期等，还用于描述用户对音乐特性的主观认识及个人观点。用户对音乐标签的组织方式也有决定性作用，比如用户可以根据个人习惯定义音乐标签结构。例如，某些用户在在线音乐流媒体上输入独特的标签，如用随机的字符序列对音乐进行标注，从而更好地管理个人音乐收藏。这些标签对其他用户没有任何意义，因此这是用户滥用音乐标注服务的一种体现。虽然这种性质的标签很容易通过启发式方法识别及去除，但用户标注数据集中其他问题并不容易解决。这些问题包括错误标注，过度使用如流派或情感类别等主观标签，以及标签分类体系异构等问题。这些问题是造成数据集中存在标签噪声的重要原因，数据集标签噪声会导致深度神经网络的学习效果较差。
技术实现思路
本专利技术的目的是针对现有技术的不足，提...

【技术保护点】
1.一种基于标签深度分析的音乐自动标注方法，其特征在于，所述方法包括以下步骤：S1、收集音乐数据并结合音乐标签体系进行数据清洗；S2、对音乐数据进行采样，转换为梅尔频谱图并进行数据切片；S3、基于一维卷积网络构建音频多层级特征提取网络，通过有监督学习进行参数预训练；S4、基于二维卷积网络进行音乐标签向量表示学习，获取音乐标签特征；S5、实现音频多层级特征与音乐标签特征的特征聚合；S6、基于聚合特征进行最终的音乐标签预测。

【技术特征摘要】
1.一种基于标签深度分析的音乐自动标注方法，其特征在于，所述方法包括以下步骤：S1、收集音乐数据并结合音乐标签体系进行数据清洗；S2、对音乐数据进行采样，转换为梅尔频谱图并进行数据切片；S3、基于一维卷积网络构建音频多层级特征提取网络，通过有监督学习进行参数预训练；S4、基于二维卷积网络进行音乐标签向量表示学习，获取音乐标签特征；S5、实现音频多层级特征与音乐标签特征的特征聚合；S6、基于聚合特征进行最终的音乐标签预测。2.根据权利要求1所述的一种基于标签深度分析的音乐自动标注方法，其特征在于，所述步骤S1具体包括以下步骤：S11、从自有曲库和互联网音乐平台收集音乐音频和音乐标签数据；S12、根据音乐标签体系对音乐标签进行清洗、规范化，过滤掉缺少标签标注的音乐数据。3.根据权利要求1所述的一种基于标签深度分析的音乐自动标注方法，其特征在于，所述步骤S2具体包括以下步骤：S21、将音乐音频数据转换为mp3格式，按照16kHz采样频率进行采样或重采样；S22、对采样音频进行梅尔频谱图转换；S23、对梅尔频谱进行对数处理，根据固定音频帧窗口大小重复随机采样，再对每个切片进行标准化和归一化。4.根据权利要求1所述的一种基于标签深度分析的音乐自动标注方法，其特征在于，所述步骤S3具体包括以下步骤：S31、将输入的音频梅尔频谱图采用一维卷积网络进行卷积，使用指数线性激活函数ELU对网络层输出进行非线性变换；S32、采用一维最大池化层对卷积网络输出结果进行池化，通过Dropout操作随机丢弃部分网络层输出结果；S33、重复步骤S31～S32，构建具有三层卷积网络堆叠的模型；S34、将最后一层卷积网络的输出进行扁平化，使用一个全连接网络进行特征提取，最终连接到具有Sigmoid激活函数的输出层；S35、使用标注数据通过...

【专利技术属性】
技术研发人员：王振宇，萧永乐，张睿，雷昶，高雨轩，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人