System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于改进径向基函数的AI生成音乐识别方法、装置及设备制造方法及图纸_技高网

基于改进径向基函数的AI生成音乐识别方法、装置及设备制造方法及图纸

技术编号:42201794 阅读:18 留言:0更新日期:2024-07-30 18:47
本发明专利技术提供的基于改进径向基函数的AI生成音乐识别方法、装置及设备,涉及人工智能技术领域,本发明专利技术方法通过获取不同风格的音乐样本数据集并预处理;然后对预处理后的音乐样本数据集进行各特征提取,并加权融合,得到初始融合特征向量;将初始融合特征向量输入初始化后的模型,采用改进的高斯径向基函数作为激活函数,通过梯度下降法进行模型训练优化,直至达到全局最优解,得到训练好的AI生成音乐识别模型;再对模型进行评估,得到评估好的模型;最后,将音乐数据输入评估好的模型,得到AI音乐识别结果。本发明专利技术通过采用改进的径向基函数的高准确性和强非线性逼近能力,提高了模型的识别准确性,缩短了模型训练与推理时长,模型稳定性好。

【技术实现步骤摘要】

本专利技术涉及人工智能,具体而言,涉及一种基于改进径向基函数的ai生成音乐识别方法、装置及设备。


技术介绍

1、随着人工智能技术的飞速发展,ai生成音乐已成为音乐创作和研究领域的新趋势。然而,ai生成的音乐具有复杂性和多样性,如间奏特征、前奏/主歌/副歌段落风格一致性与歌词特征等。

2、间奏特征:一首乐曲的间奏部分会典型的使用和声变化、节拍转换、新乐器产生新音色这些艺术手法,但是现有的ai生成算法对生成这种跳变的音乐片段能力较弱。因此,间奏特征将作为最重要的识别维度。

3、段落风格一致性:一首乐曲的不同段落(前奏、主歌、副歌)有较大的音高、音长的差异,但在风格上有较强的一致性。而ai生成音乐不同段落是用模型分段推理生成,因此普遍的缺乏段落间的风格一致性,也就是业界诟病的,ai生成音乐具备短时风格一致性,不具备长时风格一致性,一首歌曲的前后部分经常会出现风格漂移。因此,段落间风格一致性也是识别的重要维度。

4、节拍特征:一首乐曲的间奏,通常会采用不同的拍子来增加音乐的对比,而当前ai生成音乐的算法逻辑都是基于历史时间序列的内容生成,因此节拍的转换通常并不明显,整首乐器的节拍也相对单一。

5、歌词特征:在ai生成歌词中,叠词的使用率高于常规歌词均值30%,形容词和副词的语法规则相较于常规歌词更严谨,即语法规则更僵化。

6、如何准确识别分析一段具有复杂结构和表现力的音乐是否为ai生成的音乐,成为一个挑战。

7、有鉴于此,申请人在研究了现有的技术后特提出本申请。p>

技术实现思路

1、本专利技术旨在提供一种基于改进径向基函数的ai生成音乐识别方法、装置及设备,以解决现有方法无法准确识别分析一段具有复杂结构和表现力的音乐是否为ai生成的音乐等问题。

2、为解决上述技术问题,本专利技术通过以下技术方案实现:

3、一种基于改进径向基函数的ai生成音乐识别方法,包括:

4、1.一种基于改进径向基函数的ai生成音乐识别方法,其特征在于,包括:

5、s1,获取不同风格的音乐样本数据集,并对所述音乐样本数据集进行预处理;其中,所述不同风格包括古典、流行、中式与西方,所述预处理包括采样、量化与歌词分离处理;

6、s2,对预处理后的音乐样本数据集分别进行间奏特征、风格一致性特征与歌词特征提取,并对提取得到的特征赋予初始权重进行加权融合,得到初始融合特征向量。

7、优选地,所述间奏特征包括和声变化特征、乐器特征和节拍变化特征,提取步骤包括:

8、通过频谱包络分析方法对所述音乐样本数据集的音频文件进行分析提取,得到和声变化特征;

9、通过音色分析对所述音频文件进行分析提取,得到乐器特征;

10、通过对所述音频文件的脉冲频率提取分析,得到节拍变化特征。

11、所述风格一致性特征包括主歌副歌的节奏特征以及音高特征,提取步骤包括:

12、通过fft变换方法对所述音频文件进行重复模式与节拍差异值的识别,得到主歌副歌的节奏特征;

13、通过频谱分析方法提取所述音频文件的音频信号中的基本频率,得到音高特征。

14、所述歌词特征包括词频特征与词性特征,以对歌词部分进行叠词和语法规则的识别,提取步骤包括:

15、通过统计学方法计算所述音乐样本数据集的歌词文件的叠词使用频率,得到词频特征;

16、通过nlp技术识别提取所述歌词文件的形容词、副词使用的语法规范性特征,得到词性特征。

17、优选地,所述初始权重的表达式为:

18、;

19、其中,a0、a1、a2分别表示和声变化特征、乐器特征和节拍变化特征的初始权重;b0、b1分别表示主歌副歌的节奏特征与音高特征的初始权重;c0、c1分别表示词频特征与词性特征的初始权重,如果样本数据为纯音乐,则c0、c1为0。

20、s3,初始化径向基函数多特征网络模型,采用改进的高斯径向基函数作为激活函数,通过梯度下降法,将所述初始融合特征向量输入所述径向基函数多特征网络模型进行训练优化,直至达到全局最优解,得到训练好的ai生成音乐识别模型;

21、其中,所述径向基函数多特征网络模型包括输入层、若干隐藏层和输出层,初始化径向基函数多特征网络模型时,根据所述初始权重,初始化隐藏层和输出层的权值参数,并设定隐藏层的中心初始值为0;

22、在对所述径向基函数多特征网络模型的参数进行训练优化时,直至代价函数达到设定的阈值,得到全局最优欧式距离,即全局最优解;

23、其中,所述改进的高斯径向基函数的表达式为:

24、;

25、其中,x是输入向量,即所述初始融合特征向量,是第j个隐藏层单元的中心,是第j个隐藏单元的感受野宽度,是输入向量与中心的多特征加权欧氏距离;

26、所述代价函数为隐藏层的输出与中心的加权欧氏距离的平方的一半,其表达式为:

27、;

28、其中,表示隐藏层的权重参数矩阵,初始状态下为。

29、s4,对所述ai生成音乐识别模型进行评估,当评估分数超过设定的阈值时,得到评估好的ai生成音乐识别模型。

30、优选地,在对所述ai生成音乐识别模型进行评估时,评估表达式为:

31、;

32、其中,评估分数f1表示精确率和召回率的调和平均,最大值是1,最小值是0,f1值越大,模型性能越好;

33、,表示精确率,表示当前模型序号,n表示测试集中真正为正且预测为正的个体数,n表示测试集中所有被模型预测为正的个体数;

34、,表示召回率,m表示测试集中真正为正的个体数。

35、s5,将音乐数据输入所述评估好的ai生成音乐识别模型,得到所述音乐数据的ai音乐识别结果。

36、本专利技术还提供了一种基于改进径向基函数的ai生成音乐识别装置,包括:

37、预处理单元,用于获得预处理后的样本数据集,获取不同风格的音乐样本数据集,并对所述音乐样本数据集进行预处理;其中,所述不同风格包括古典、流行、中式与西方,所述预处理包括采样、量化与歌词分离处理;

38、初始特征融合单元,用于获得初始融合特征向量,对预处理后的音乐样本数据集分别进行间奏特征、风格一致性特征与歌词特征提取,并对提取得到的特征赋予初始权重进行加权融合,得到初始融合特征向量;

39、模型训练单元,用于得到训练好的ai生成音乐识别模型,初始化径向基函数多特征网络模型,采用改进的高斯径向基函数作为激活函数,通过梯度下降法,将所述初始融合特征向量输入所述径向基函数多特征网络模型进行训练优化,直至达到全局最优解,得到训练好的ai生成音乐识别模型;其中,

40、所述径向基函数多特征网络模型包括输入层、若干隐藏层和输出层,初始化径向基函数多特征网络模型时,根据所述初始权重,初始化隐藏层本文档来自技高网...

【技术保护点】

1.一种基于改进径向基函数的AI生成音乐识别方法,其特征在于,包括:

2.根据权利要求1所述的一种基于改进径向基函数的AI生成音乐识别方法,其特征在于,所述间奏特征包括和声变化特征、乐器特征和节拍变化特征,提取步骤包括:

3.根据权利要求2所述的一种基于改进径向基函数的AI生成音乐识别方法,其特征在于,所述风格一致性特征包括主歌副歌的节奏特征以及音高特征,提取步骤包括:

4.根据权利要求3所述的一种基于改进径向基函数的AI生成音乐识别方法,其特征在于,所述歌词特征包括词频特征与词性特征,以对歌词部分进行叠词和语法规则的识别,提取步骤包括:

5.根据权利要求4所述的一种基于改进径向基函数的AI生成音乐识别方法,其特征在于,所述初始权重的表达式为:

6.根据权利要求5所述的一种基于改进径向基函数的AI生成音乐识别方法,其特征在于,在对所述AI生成音乐识别模型进行评估时,评估表达式为:

7.一种基于改进径向基函数的AI生成音乐识别装置,其特征在于,包括:

8.一种基于改进径向基函数的AI生成音乐识别设备,其特征在于,包括处理器以及存储器,所述存储器内存储有计算机程序,所述计算机程序能够被所述处理器执行,以实现如权利要求1-6任意一项所述的一种基于改进径向基函数的AI生成音乐识别方法。

...

【技术特征摘要】

1.一种基于改进径向基函数的ai生成音乐识别方法,其特征在于,包括:

2.根据权利要求1所述的一种基于改进径向基函数的ai生成音乐识别方法,其特征在于,所述间奏特征包括和声变化特征、乐器特征和节拍变化特征,提取步骤包括:

3.根据权利要求2所述的一种基于改进径向基函数的ai生成音乐识别方法,其特征在于,所述风格一致性特征包括主歌副歌的节奏特征以及音高特征,提取步骤包括:

4.根据权利要求3所述的一种基于改进径向基函数的ai生成音乐识别方法,其特征在于,所述歌词特征包括词频特征与词性特征,以对歌词部分进行叠词和语法规则的识别,提取步骤包括:

<...

【专利技术属性】
技术研发人员:刘莉
申请(专利权)人:厦门理工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1