The invention provides a method and device for automatic composition and terminal equipment, including the automatic composition method for receiving music file to be predicted earlier, the prediction of some music files including the prediction of music or music audio data segment description information; extracting frame level audio features the music file corresponding to the music; according to the characteristics of the audio frame level and pre built music band feature combination model, obtain the frame level audio features carry band information; according to the characteristics of the audio frame carrying band information in advance and the construction of music prediction model, the prediction of the obtained music, in order to achieve the automatic composition. The application can realize automatic composition, thereby improving the efficiency and feasibility of automatic composition, and reducing the influence of subjective factors on automatic composition.
【技术实现步骤摘要】
自动作曲方法、装置和终端设备
本申请涉及音频信号处理
,尤其涉及一种自动作曲方法、装置和终端设备。
技术介绍
随着计算机技术在音乐处理上的应用,计算机音乐应运而生。计算机音乐作为新生代艺术,已逐渐渗透到音乐的创作、乐器演奏、教育、娱乐等各个方面。采用人工智能技术进行自动作曲作为计算机音乐中较新的研究方向,近年来受到了相关领域研究人员的高度重视。现有的基于人工智能技术的自动作曲方法主要有以下两种:基于启发式搜索的自动作曲和基于遗传算法的自动作曲。但是,现有的基于启发式搜索的自动作曲只适用于乐曲长度短的情况,其搜索效率随着乐曲长度的增加成指数级下降,因而对于长度较长的乐曲该方法的可行性差;而基于遗传算法的自动作曲方法继承了遗传算法的一些典型缺点,例如:对初始种群依赖大、遗传算子难以精准选定等。
技术实现思路
本申请的目的旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请的第一个目的在于提出一种自动作曲方法。该方法通过构建音乐频带特征结合模型和音乐预测模型,实现自动作曲,是一种全新的自动作曲方法,解决了现有技术所存在的效率低、可行性差、主观影响大等问题。本申请的第二个目的在于提出一种自动作曲装置。本申请的第三个目的在于提出一种终端设备。本申请的第四个目的在于提出一种包含计算机可执行指令的存储介质。为了实现上述目的,本申请第一方面实施例的自动作曲方法,包括:接收待预测前段音乐的音乐文件,所述待预测前段音乐的音乐文件包括所述待预测前段音乐的音频数据或音乐描述信息;提取所述音乐文件对应音乐的帧级音频特征;根据所述帧级音频特征和预先构建的音乐频带特征结合模 ...
【技术保护点】
一种自动作曲方法,其特征在于,包括:接收待预测前段音乐的音乐文件,所述待预测前段音乐的音乐文件包括所述待预测前段音乐的音频数据或音乐描述信息;提取所述音乐文件对应音乐的帧级音频特征;根据所述帧级音频特征和预先构建的音乐频带特征结合模型,获得携带频带信息的帧级音频特征;根据所述携带频带信息的帧级音频特征和预先构建的音乐预测模型,获得预测出的音乐,以实现自动作曲。
【技术特征摘要】
1.一种自动作曲方法,其特征在于,包括:接收待预测前段音乐的音乐文件,所述待预测前段音乐的音乐文件包括所述待预测前段音乐的音频数据或音乐描述信息;提取所述音乐文件对应音乐的帧级音频特征;根据所述帧级音频特征和预先构建的音乐频带特征结合模型,获得携带频带信息的帧级音频特征;根据所述携带频带信息的帧级音频特征和预先构建的音乐预测模型,获得预测出的音乐,以实现自动作曲。2.根据权利要求1所述的方法,其特征在于,所述根据所述帧级音频特征和预先构建的音乐频带特征结合模型,获得携带频带信息的帧级音频特征之前,还包括:收集音乐文件,并将所述音乐文件转换为相同格式的音频文件;提取所述音频文件的帧级音频特征;确定音乐频带特征结合模型的拓扑结构;根据确定的拓扑结构和所述帧级音频特征,训练所述音乐频带特征结合模型。3.根据权利要求2所述的方法,其特征在于,所述提取所述音频文件的帧级音频特征包括:将所述音频文件按帧进行固定点数的快速傅里叶变换;根据快速傅里叶变换的结果计算所述音频文件的每帧在每个频率点的能量值;根据所述能量值确定每帧的音符归属;计算每个音符的能量值,根据每个音符的能量值获取帧级音频特征。4.根据权利要求3所述的方法,其特征在于,所述根据所述能量值确定每帧的音符归属包括:在每个频率点,确定所述音频文件的第一帧和第二帧属于第一个音符;判断第一差值的绝对值是否小于第二差值;所述第一差值为所述音频文件的第三帧的能量值与所述音频文件的第一帧到第二帧能量值的平均值之差,所述第二差值为所述音频文件的第一帧到第二帧能量值的最大值与最小值之差;如果是,则确定所述音频文件的第三帧属于第一个音符,再依次向后判断第四帧直至最后一帧的音符归属。5.根据权利要求4所述的方法,其特征在于,所述判断第一差值的绝对值是否小于第二差值的绝对值之后,还包括:如果所述第一差值的绝对值大于或等于所述第二差值,则将所述音频文件的第三帧作为第二个音符的开始,并确定所述音频文件的第四帧属于所述第二个音符;从所述音频文件的第五帧开始判断第三差值的绝对值是否小于第四差值,所述第三差值为所述音频文件的第五帧的能量值与所述音频文件的第三帧到第四帧能量值的平均值之差,所述第四差值为所述音频文件的第三帧到第四帧能量值的最大值与最小值之差;直至将所述音频文件的最后一帧的音符归属确定完毕。6.根据权利要求3所述的方法,其特征在于,所述计算每个音符的能量值,根据每个音符的能量值获取帧级音频特征包括:计算每个音符所含所有帧的能量均值,作为每个音符的能量值;将每个音符所包括的每帧的能量值归一化为所属音符的能量值;滤除能量值小于预定阈值的音符,以获得帧级音频特征。7.根据权利要求1所述的方法,其特征在于,所述根据所述携带频带信息的帧级音频特征和预先构建的音乐预测模型,获得预测出的音乐之前,还可以包括:确定音乐预测模型的拓扑结构;根据所述音乐频带特征结合模型的输出,以及确定的拓扑结构,训练所述音乐预测模型。8.一种自动作曲装置,其特征在于,包括:接收模块,用于接收待预测前段音乐的音乐文件,所述待预测前段音乐的音乐文件包括所述待预测前段音乐的音频数据或音乐描述信息;提取模块,用于提取所述接收模块接收的音乐文件对应音乐的帧级音频特征;获得模块,用于根据所述帧级音频特征和预先构建的音乐频带特征结合模型,获得携带频带信息的帧级音频特征;以及根据所述携带频带...
【专利技术属性】
技术研发人员:何江聪,潘青华,胡国平,胡郁,刘庆峰,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。