【技术实现步骤摘要】
【国外来华专利技术】基于音频数据标识音乐属性
技术介绍
[0001]音乐分类在理解音乐语义和音乐推荐方面发挥着重要作用
。
拥有基于较大规模音乐库的音乐推荐服务的行业,对音乐分类有着强烈的需求
。
然而,由于各种限制,常规的音乐分类技术可能无法满足这些行业的需求
。
因此,需要的是音乐分类技术的改进
。
附图说明
[0002]并入本说明书并且构成本说明书的一部分的附图图示了实施例并且与描述一起用于解释方法和系统的原理:
[0003]图1是图示用于根据本公开使用的示例系统的示意图
。
[0004]图2图示了根据本公开可以使用的音乐标注变换器的示例模型
。
[0005]图3图示了根据本公开可以使用的音乐标注变换器的示例前端
。
[0006]图
4a
至图
b
图示了根据本公开可以使用的用于噪声学生训练的示例过程
。
[0007]图5图示了根据本公开可以使用的噪声学生训练的示例伪代码
。
[0008]图6图示了根据本公开可以使用的用于训练和应用音乐标注变换器模型的示例过程
。
[0009]图7图示了根据本公开可以使用的用于训练音乐标注变换器模型的示例过程
。
[0010]图8图示了根据本公开可以使用的应用音乐标注变换器模型的示例过程
。
[0011]图9图示了根据本公开可以使用的应用音乐标注变换器模型的示例过程
。
...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.
一种方法,包括:接收一段音乐的音频数据;基于所述一段音乐的所述音频数据使用模型来确定所述一段音乐的至少一个属性;其中所述模型包括卷积神经网络和变换器;以及其中所述模型是使用训练数据被训练的,所述训练数据包括与第一多个音乐样本相关联的标记的数据以及与第二多个音乐样本相关联的未标记的数据,所述标记的数据包括所述第一多个音乐样本的音频数据和指示所述第一多个音乐样本的属性的标记信息,并且所述未标记的数据包括所述第二多个音乐样本的音频数据
。2.
根据权利要求1所述的方法,还包括:通过预处理所述一段音乐的所述音频数据来生成表示所述一段音乐的所述音频数据的图像
。3.
根据权利要求2所述的方法,其中表示所述一段音乐的所述音频数据的所述图像包括梅尔频谱图
。4.
根据权利要求2所述的方法,还包括:将所述卷积神经网络应用于表示所述一段音乐的所述音频数据的所述图像;以及输出从表示所述一段音乐的所述音频数据的所述图像中提取的特征序列
。5.
根据权利要求4所述的方法,还包括:将所述变换器应用于从表示所述一段音乐的所述音频数据的所述图像中提取的所述特征序列;以及输出对所述一段音乐的所述至少一个属性的预测
。6.
根据权利要求1所述的方法,其中所述卷积神经网络包括具有残差连接的3×3卷积滤波器
。7.
根据权利要求1所述的方法,其中所述变换器包括堆叠的多头自注意力层
。8.
根据权利要求1所述的方法,其中所述模型是使用噪声学生训练机制被训练的
。9.
根据权利要求8所述的方法,还包括:使用所述标记的数据的至少一部分来训练教师模型;以及通过将经训练的所述教师模型应用于所述未标记的数据的至少一部分来生成伪标记信息,其中所述伪标记信息指示所述未标记的数据的所述至少一部分的属性
。10.
根据权利要求9所述的方法,还包括:使用所述标记的数据的所述至少一部分
、
所述未标记的数据的所述至少一部分以及指示所述未标记的数据的所述至少一部分的属性的所述伪标记信息来训练学生模型
。11.
一种系统,包括:至少一个处理器;以及至少一个存储器,通信地耦合到所述至少一个处理器并且存储指令,所述指令在由所述至少一个处理器执行时使所述系统执行操作,所述操作包括:接收一段音乐的音频数据;基于所述一段音乐的所述音频数据使用模型来确定所述一段音乐的至少一个属性;其中所述模型包括卷积神经网络和变换器;以及其中所述模型是使用训练数据被训练的,所述训练数据包括与第一多个音乐样本相关
联的标记的数据和与第二多个音乐样本相关联的未标记的数据,所述标记的数据包括所述第一多个音乐样本的音频数据和指示所述第一多个音乐样本的属性的标记信息,并且所述未标记的数据包括所述第...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。