音乐类型识别方法、装置、设备及存储介质制造方法及图纸

技术编号:28505139 阅读:39 留言:0更新日期:2021-05-19 22:57
本发明专利技术涉及人工智能领域,公开了一种音乐类型识别方法、装置、设备及存储介质。该方法包括:获取用户配置的待播放音乐的第一音乐类型,读取待播放的音乐文件;基于预置事件定义,将音乐文件的音乐数据转化为基于事件的离散表示数据,对离散表示数据进行向量转换,得到初始音乐特征向量;将初始音乐特征向量输入预置音乐类型识别模型进行识别,输出音乐文件为人为创作音乐的第一概率值;根据第一概率值和预置概率阈值,确定音乐文件对应的第二音乐类型,判断第一音乐类型是否与第二音乐类型相同;若相同,则播放音乐文件,否则识别下一音乐文件。本发明专利技术提供的音乐类型识别方法识别速度快,准确率高。准确率高。准确率高。

【技术实现步骤摘要】
音乐类型识别方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能领域,尤其涉及一种音乐类型识别方法、装置、设备及存储介质。

技术介绍

[0002]随着人工智能技术的快速发展,人工智能技术已经渗透进了日常生活中的方方面面,比如音乐创作领域也逐渐融入了先进的人工智能技术。采用机器学习算法能够从音乐材料中自动地学习出一些规律,然后根据学习到的规律,由机器自动生成音乐。
[0003]目前通过人工智能算法生成的音乐越来越多,许多人工智能算法生成的音乐已经可以达到人为谱写的水平,一般用户很难辨别下载或播放的音乐是人工智能算法生成的还是人为谱写的,同时音乐提供方通常不会给出相应的提示,从而使得听众丧失了对于不同音乐类型的选择权利。

技术实现思路

[0004]本专利技术的主要目的在于解决如何通过机器区分人为创作的音乐和人工智能算法生成的音乐的技术问题。
[0005]本专利技术第一方面提供了一种音乐类型识别方法,包括:
[0006]获取用户配置的待播放音乐的第一音乐类型,并从预置音乐文件库中读取待播放的音乐文件,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种音乐类型识别方法,其特征在于,所述音乐类型识别方法包括:获取用户配置的待播放音乐的第一音乐类型,并从预置音乐文件库中读取待播放的音乐文件,其中,所述第一音乐类型包括人为创作音乐和机器合成音乐;基于预置事件定义,将所述音乐文件中的音乐数据转化为基于事件的离散表示数据,并对所述离散表示数据进行向量转换,得到初始音乐特征向量;将所述初始音乐特征向量输入预置音乐类型识别模型进行识别,输出所述音乐文件为人为创作音乐的第一概率值,其中,所述音乐类型识别模型包括嵌入层、两层门限循环单元、两层全连接层;根据所述第一概率值和预置概率阈值,确定所述音乐文件对应的第二音乐类型,并判断所述第一音乐类型是否与所述第二音乐类型相同;若相同,则播放所述音乐文件,否则继续识别下一音乐文件。2.根据权利要求1所述的音乐类型识别方法,其特征在于,在所述获取用户配置的待播放音乐的第一音乐类型之前,还包括:采集多个样本音乐文件,并将所述样本音乐文件中的人为创作音乐作为正样本、将机器合成音乐作为负样本;基于预置事件定义,将所述样本音乐文件中的音乐数据转化为基于事件的离散表示数据,并对所述离散表示数据进行向量转换,得到样本音乐初始向量;将所述样本音乐初始向量输入预置训练模型中的嵌入层进行向量转换,输出样本音乐编码向量;将所述样本音乐编码向量输入预置训练模型中的第一层门限循环单元进行特征提取,输出样本音乐第一特征向量;将所述第一样本特征向量输入预置训练模型中的第二层门限循环单元进行特征提取,输出样本音乐第二特征向量;将所述样本音乐第二特征向量输入预置训练模型中的第一层全连接进行特征分类,输出样本音乐特征值;将所述样本音乐特征值输入预置训练模型中的第二层全连接进行特征分类,输出样本音乐为人为创作音乐的第二概率值;判断所述第二概率值与所述概率阈值之间的差值是否在预置误差范围内;若是,则将当前训练模型作为音乐类型识别模型,否则采用随机梯度下降法对当前训练模型进行迭代训练,直至所述训练模型收敛,得到音乐类型识别模型。3.根据权利要求1所述的音乐类型识别方法,其特征在于,所述事件定义为音乐文件由若干音符起始字符、音符结束字符,时间移动字符、唱词启示字符以及唱词结束字符分别对应的时间组合而成;所述基于预置事件定义,将所述音乐文件中的音乐数据转化为基于事件的离散表示数据,并对所述离散表示数据进行向量转换,得到初始音乐特征向量包括:将所述音乐文件中的音乐数据转化为基于所述事件定义的离散表示数据;基于时间顺序,将同一音乐文件对应的全部离散表示数据组成一个时间向量,得到初始音乐特征向量。4.根据权利要求1所述的音乐类型识别方法,其特征在于,所述将所述初始音乐特征向
量输入预置音乐类型识别模型进行识别,输出所述音乐文件为人为创作音乐的第一概率值包括:将所述初始音乐特征向量输入所述预置音乐类型识别模型中的嵌入层进行向量转换,输出初始音乐编码向量;将所述初始音乐编码向量输入所述预置音乐类型识别模型中的两层门限循环单元进行特征提取,输出音乐特征向量;将所述音乐特征向量输入所述预置音乐类型识别模型中的两层全连接层进行特征分类和整合,输出所述音乐文件为人为创作音乐的第一概率值。5.根据权利要求4所述的音乐类型识别方法,其特征在于,所述将所述音乐特征向量输入所述预置音乐类型识别模型中的两层全连接层进行特征分类和整合,输出所述音乐文件为人为创作音乐的第一概率值包括:将所述音乐特征向量输入第一层全连接层,通过所述第一层全连接层对所述音乐特征向量进行ReLU函数运算,输出音乐特征值;将所述音乐特征值输入第二层全连接层,对所述音乐特征值进行sigmiod函数运算,输出所述音乐文件为人为创作音乐的第一概率值;其中,所述第一层全连接层采用ReLU函数,第一层全连接层的计算公式为:D1=tanh(W
d1
h
t
+b
d1
),D1表示第一层全连接层的输出结果,tanh表示双曲正切函数,h
t
为两层门限循环单元的输出向量,W
d1
、b
d1
为训练参数;所述第二层全连接层采用sigmiod函数,第二层全连接层的计算公式为:D2=σ(W
d2
D1+b
d2
),D2表示第二层全连接层的输出结果,σ表示sigmoid函数,W
d2
、b
d2
为训练参数,D2的输出值...

【专利技术属性】
技术研发人员:刘奡智郭锦岳韩宝强肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1