自动作曲方法、装置和终端设备制造方法及图纸

技术编号:16000077 阅读:34 留言:0更新日期:2017-08-15 14:34
本申请提出一种自动作曲方法、装置和终端设备,上述自动作曲方法包括:接收待预测前段音乐的音乐文件,所述待预测前段音乐的音乐文件包括所述待预测前段音乐的音频数据或音乐描述信息;提取所述音乐文件对应音乐的帧级音频特征;根据所述帧级音频特征和预先构建的音乐频带特征结合模型,获得携带频带信息的帧级音频特征;根据所述携带频带信息的帧级音频特征和预先构建的音乐预测模型,获得预测出的音乐,以实现自动作曲。本申请可以实现自动作曲,进而可以提高自动作曲的效率和可行性,降低了主观因素对自动作曲的影响。

Automatic composing method, device and terminal equipment

The invention provides a method and device for automatic composition and terminal equipment, including the automatic composition method for receiving music file to be predicted earlier, the prediction of some music files including the prediction of music or music audio data segment description information; extracting frame level audio features the music file corresponding to the music; according to the characteristics of the audio frame level and pre built music band feature combination model, obtain the frame level audio features carry band information; according to the characteristics of the audio frame carrying band information in advance and the construction of music prediction model, the prediction of the obtained music, in order to achieve the automatic composition. The application can realize automatic composition, thereby improving the efficiency and feasibility of automatic composition, and reducing the influence of subjective factors on automatic composition.

【技术实现步骤摘要】
自动作曲方法、装置和终端设备
本申请涉及音频信号处理
,尤其涉及一种自动作曲方法、装置和终端设备。
技术介绍
随着计算机技术在音乐处理上的应用,计算机音乐应运而生。计算机音乐作为新生代艺术,已逐渐渗透到音乐的创作、乐器演奏、教育、娱乐等各个方面。采用人工智能技术进行自动作曲作为计算机音乐中较新的研究方向,近年来受到了相关领域研究人员的高度重视。现有的基于人工智能技术的自动作曲方法主要有以下两种:基于启发式搜索的自动作曲和基于遗传算法的自动作曲。但是,现有的基于启发式搜索的自动作曲只适用于乐曲长度短的情况,其搜索效率随着乐曲长度的增加成指数级下降,因而对于长度较长的乐曲该方法的可行性差;而基于遗传算法的自动作曲方法继承了遗传算法的一些典型缺点,例如:对初始种群依赖大、遗传算子难以精准选定等。
技术实现思路
本申请的目的旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请的第一个目的在于提出一种自动作曲方法。该方法通过构建音乐频带特征结合模型和音乐预测模型,实现自动作曲,是一种全新的自动作曲方法,解决了现有技术所存在的效率低、可行性差、主观影响大等问题。本申请的第二个目的在于提出一种自动作曲装置。本申请的第三个目的在于提出一种终端设备。本申请的第四个目的在于提出一种包含计算机可执行指令的存储介质。为了实现上述目的,本申请第一方面实施例的自动作曲方法,包括:接收待预测前段音乐的音乐文件,所述待预测前段音乐的音乐文件包括所述待预测前段音乐的音频数据或音乐描述信息;提取所述音乐文件对应音乐的帧级音频特征;根据所述帧级音频特征和预先构建的音乐频带特征结合模型,获得携带频带信息的帧级音频特征;根据所述携带频带信息的帧级音频特征和预先构建的音乐预测模型,获得预测出的音乐,以实现自动作曲。本申请实施例的自动作曲方法中,接收待预测前段音乐的音乐文件之后,提取上述音乐文件对应音乐的帧级音频特征,然后根据上述帧级音频特征和预先构建的音乐频带特征结合模型,获得携带频带信息的帧级音频特征,最后根据上述携带频带信息的帧级音频特征和预先构建的音乐预测模型,获得预测出的音乐,从而可以实现自动作曲,进而可以提高自动作曲的效率和可行性,降低了主观因素对自动作曲的影响。为了实现上述目的,本申请第二方面实施例的自动作曲装置,包括:接收模块,用于接收待预测前段音乐的音乐文件,所述待预测前段音乐的音乐文件包括所述待预测前段音乐的音频数据或音乐描述信息;提取模块,用于提取所述接收模块接收的音乐文件对应音乐的帧级音频特征;获得模块,用于根据所述帧级音频特征和预先构建的音乐频带特征结合模型,获得携带频带信息的帧级音频特征;以及根据所述携带频带信息的帧级音频特征和预先构建的音乐预测模型,获得预测出的音乐,以实现自动作曲。本申请实施例的自动作曲装置中,接收模块接收待预测前段音乐的音乐文件之后,提取模块提取上述音乐文件对应音乐的帧级音频特征,然后获得模块根据上述帧级音频特征和预先构建的音乐频带特征结合模型,获得携带频带信息的帧级音频特征,以及根据上述携带频带信息的帧级音频特征和预先构建的音乐预测模型,获得预测出的音乐,从而可以实现自动作曲,进而可以提高自动作曲的效率和可行性,降低了主观因素对自动作曲的影响。为了实现上述目的,本申请第三方面实施例的终端设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的方法。为了实现上述目的,本申请第四方面实施例提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如上所述的方法。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本申请自动作曲方法一个实施例的流程图;图2为本申请自动作曲方法另一个实施例的流程图;图3为本申请自动作曲方法中拓扑结构一个实施例的示意图;图4为本申请自动作曲方法再一个实施例的流程图;图5为本申请自动作曲方法中能量值坐标表示示意图;图6为本申请自动作曲方法再一个实施例的流程图;图7为本申请自动作曲方法再一个实施例的流程图;图8为本申请自动作曲方法中拓扑结构另一个实施例的示意图;图9为本申请自动作曲装置一个实施例的结构示意图;图10为本申请自动作曲装置另一个实施例的结构示意图;图11为本申请终端设备一个实施例的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1为本申请自动作曲方法一个实施例的流程图,如图1所示,上述自动作曲方法可以包括:步骤101,接收待预测前段音乐的音乐文件,上述待预测前段音乐的音乐文件包括上述待预测前段音乐的音频数据或音乐描述信息。其中,上述待预测前段音乐的音频数据或音乐描述信息指的是给定一小段音乐的音频数据或者音乐描述信息,然后就可以依据给定的一小段音乐的音频数据或者音乐描述信息预测后面的音乐。上述音乐描述信息一般可以转换为音频数据,上述音乐描述信息可以为乐器数字接口(MusicalInstrumentDigitalInterface;以下简称:MIDI)文件等。步骤102,提取上述音乐文件对应音乐的帧级音频特征。步骤103,根据上述帧级音频特征和预先构建的音乐频带特征结合模型,获得携带频带信息的帧级音频特征。步骤104,根据上述携带频带信息的帧级音频特征和预先构建的音乐预测模型,获得预测出的音乐,以实现自动作曲。上述自动作曲方法中,接收待预测前段音乐的音乐文件之后,提取上述音乐文件对应音乐的帧级音频特征,然后根据上述帧级音频特征和预先构建的音乐频带特征结合模型,获得携带频带信息的帧级音频特征,最后根据上述携带频带信息的帧级音频特征和预先构建的音乐预测模型,获得预测出的音乐,从而可以实现自动作曲,进而可以提高自动作曲的效率和可行性,降低了主观因素对自动作曲的影响。图2为本申请自动作曲方法另一个实施例的流程图,如图2所示,步骤103之前,还可以包括:步骤201,收集音乐文件,并将上述音乐文件转换为相同格式的音频文件。具体地,可通过爬取互联网大量音乐文件,得到大量训练数据,上述音乐文件可以是音频数据,也可以是音乐描述信息,例如:MIDI文件等。然后可以将上述音乐文件转换为相同格式的音频文件,上述音频文件的格式只需满足可以进行快速傅里叶变换(FastFourierTransformation;以下简称:FFT)即可,例如:“.PCM”或“.WAV”等,本实施例对上述音频文件的格式不作限定,本实施例以“.PCM”格式为例进行说明。需要说明的是:如果上述音乐文件为音乐描述信息,如MIDI文件,则需要先将MIDI文件转换为音频文件,再转换为“.PCM”格式的音频文件。步骤202,提取上述音频文件的本文档来自技高网...
自动作曲方法、装置和终端设备

【技术保护点】
一种自动作曲方法,其特征在于,包括:接收待预测前段音乐的音乐文件,所述待预测前段音乐的音乐文件包括所述待预测前段音乐的音频数据或音乐描述信息;提取所述音乐文件对应音乐的帧级音频特征;根据所述帧级音频特征和预先构建的音乐频带特征结合模型,获得携带频带信息的帧级音频特征;根据所述携带频带信息的帧级音频特征和预先构建的音乐预测模型,获得预测出的音乐,以实现自动作曲。

【技术特征摘要】
1.一种自动作曲方法,其特征在于,包括:接收待预测前段音乐的音乐文件,所述待预测前段音乐的音乐文件包括所述待预测前段音乐的音频数据或音乐描述信息;提取所述音乐文件对应音乐的帧级音频特征;根据所述帧级音频特征和预先构建的音乐频带特征结合模型,获得携带频带信息的帧级音频特征;根据所述携带频带信息的帧级音频特征和预先构建的音乐预测模型,获得预测出的音乐,以实现自动作曲。2.根据权利要求1所述的方法,其特征在于,所述根据所述帧级音频特征和预先构建的音乐频带特征结合模型,获得携带频带信息的帧级音频特征之前,还包括:收集音乐文件,并将所述音乐文件转换为相同格式的音频文件;提取所述音频文件的帧级音频特征;确定音乐频带特征结合模型的拓扑结构;根据确定的拓扑结构和所述帧级音频特征,训练所述音乐频带特征结合模型。3.根据权利要求2所述的方法,其特征在于,所述提取所述音频文件的帧级音频特征包括:将所述音频文件按帧进行固定点数的快速傅里叶变换;根据快速傅里叶变换的结果计算所述音频文件的每帧在每个频率点的能量值;根据所述能量值确定每帧的音符归属;计算每个音符的能量值,根据每个音符的能量值获取帧级音频特征。4.根据权利要求3所述的方法,其特征在于,所述根据所述能量值确定每帧的音符归属包括:在每个频率点,确定所述音频文件的第一帧和第二帧属于第一个音符;判断第一差值的绝对值是否小于第二差值;所述第一差值为所述音频文件的第三帧的能量值与所述音频文件的第一帧到第二帧能量值的平均值之差,所述第二差值为所述音频文件的第一帧到第二帧能量值的最大值与最小值之差;如果是,则确定所述音频文件的第三帧属于第一个音符,再依次向后判断第四帧直至最后一帧的音符归属。5.根据权利要求4所述的方法,其特征在于,所述判断第一差值的绝对值是否小于第二差值的绝对值之后,还包括:如果所述第一差值的绝对值大于或等于所述第二差值,则将所述音频文件的第三帧作为第二个音符的开始,并确定所述音频文件的第四帧属于所述第二个音符;从所述音频文件的第五帧开始判断第三差值的绝对值是否小于第四差值,所述第三差值为所述音频文件的第五帧的能量值与所述音频文件的第三帧到第四帧能量值的平均值之差,所述第四差值为所述音频文件的第三帧到第四帧能量值的最大值与最小值之差;直至将所述音频文件的最后一帧的音符归属确定完毕。6.根据权利要求3所述的方法,其特征在于,所述计算每个音符的能量值,根据每个音符的能量值获取帧级音频特征包括:计算每个音符所含所有帧的能量均值,作为每个音符的能量值;将每个音符所包括的每帧的能量值归一化为所属音符的能量值;滤除能量值小于预定阈值的音符,以获得帧级音频特征。7.根据权利要求1所述的方法,其特征在于,所述根据所述携带频带信息的帧级音频特征和预先构建的音乐预测模型,获得预测出的音乐之前,还可以包括:确定音乐预测模型的拓扑结构;根据所述音乐频带特征结合模型的输出,以及确定的拓扑结构,训练所述音乐预测模型。8.一种自动作曲装置,其特征在于,包括:接收模块,用于接收待预测前段音乐的音乐文件,所述待预测前段音乐的音乐文件包括所述待预测前段音乐的音频数据或音乐描述信息;提取模块,用于提取所述接收模块接收的音乐文件对应音乐的帧级音频特征;获得模块,用于根据所述帧级音频特征和预先构建的音乐频带特征结合模型,获得携带频带信息的帧级音频特征;以及根据所述携带频带...

【专利技术属性】
技术研发人员:何江聪潘青华胡国平胡郁刘庆峰
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1