音频生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:29407416 阅读:26 留言:0更新日期:2021-07-23 22:47
本申请实施例公开了一种音频生成方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取目标图像的像素点的像素值;根据获取的像素点的像素值生成曲谱,所述曲谱包括音符标识,每个音符标识的音调是基于一个像素点的像素值确定的,或者,每个音符标识的音调是基于多个像素点的像素值确定的;按照所述曲谱,生成与所述曲谱对应的第一音频,实现了音频的自动化生成,提高了音频生成的效率,由于无需人工参与,因此,还减少了人力成本。

【技术实现步骤摘要】
音频生成方法、装置、计算机设备及存储介质
本申请实施例涉及计算机
,特别涉及一种音频生成方法、装置、计算机设备及存储介质。
技术介绍
随着计算机技术和电子设备的不断发展,收听音频成为人们常用的一种娱乐方式,逐渐深入到人们的日常生活中。为了满足人们对音频的需求,相关技术中,需要音乐制作人谱写曲谱,并按照该曲谱进行演奏,在音乐制作人的演奏过程中录制音频。但是该过程会消耗大量的人力和物力,且生成音频的效率较低。
技术实现思路
本申请实施例提供了一种音频生成方法、装置、计算机设备及存储介质,减少了人力和物力的消耗,提高了生成音频的效率。所述技术方案如下:一方面,提供了一种音频生成方法,所述方法包括:获取目标图像的像素点的像素值;根据获取的像素点的像素值生成曲谱,所述曲谱包括音符标识,每个音符标识的音调是基于一个像素点的像素值确定的,或者,所述每个音符标识的音调是基于多个像素点的像素值确定的;按照所述曲谱,生成与所述曲谱对应的第一音频。另一方面,提供了一种音频生成装置,所述装置包括:像素值获取模块,用于获取目标图像的像素点的像素值;曲谱生成模块,用于根据获取的像素点的像素值生成曲谱,所述曲谱包括音符标识,每个音符标识的音调是基于一个像素点的像素值确定的,或者,所述每个音符标识的音调是基于多个像素点的像素值确定的;音频生成模块,用于按照所述曲谱,生成与所述曲谱对应的第一音频。另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现如上述方面所述的音频生成方法中所执行的操作。另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现如上述方面所述的音频生成方法中所执行的操作。再一方面,提供了一种计算机程序,所述计算机程序中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现上述实施例的音频生成方法中所执行的操作。本申请实施例提供的音频生成方法、装置、计算机设备及存储介质,能够基于图像自动生成曲谱,并且还能按照生成的曲谱自动生成音频,实现了音频的自动化生成,提高了音频生成的效率,由于音频生成过程无需人工参与,因此,还减少了人力成本。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的一种实施环境的结构示意图。图2是本申请实施例提供的一种音频生成方法的流程图。图3是本申请实施例提供的一种音频生成方法的流程图。图4是本申请实施例提供的一种曲谱的示意图。图5是本申请实施例提供的一种目标图像的示意图。图6是本申请实施例提供的一种音频生成装置的结构示意图。图7是本申请实施例提供的另一种音频生成装置的结构示意图。图8是本申请实施例提供的一种终端的结构示意图。图9是本申请实施例提供的一种服务器的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。可以理解,本申请所使用的术语“第一”、“第二”、“第三”、“第四”、“第五”、“第六”等可在本文中用于描述各种概念,但除非特别说明,这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。举例来说,在不脱离本申请的范围的情况下,可以将第一目标数量称为第二目标数量,将第二目标数量称为第一目标数量。本申请所使用的术语“每个”、“多个”、“至少一个”、“任一”等,至少一个包括一个、两个或两个以上,多个包括两个或两个以上,而每个是指对应的多个中的每一个,任一是指多个中的任意一个。举例来说,多个像素点包括3个像素点,而每个是指这3个像素点中的每一个像素点,任一是指这3个像素点中的任意一个,可以是第一个,可以是第二个,也可以是第三个。本申请实施例提供的音频数据生成方法,应用于计算机设备。在一种可能实现方式中,计算机设备为终端,例如,手机、平板电脑、计算机等。在另一种可能实现方式中,计算机设备包括终端和服务器。图1是本申请实施例提供的一种实施环境的示意图。参见图1,该实施环境包括至少一个终端101和服务器102。终端101和服务器102之间通过无线或者有线网络连接。终端101上安装由服务器102提供服务的目标应用,终端101能够通过该目标应用实现例如数据传输、消息交互等功能。可选地,目标应用为终端101操作系统中的目标应用,或者为第三方提供的目标应用。例如,目标应用为音频处理应用,该音频处理应用具有音频处理的功能,例如,通过输入文本和图像自动生成歌曲等。当然,该图像处理应用还能够具有其他功能,例如,音频分享功能、点评功能等。可选地,终端101基于目标应用获取终端用户输入的目标图像和目标文本,并基于目标应用向服务器102上传该目标图像和目标文本,由服务器102根据目标图像生成第一音频,根据目标文本生成第二音频。服务器102将第一音频和第二音频下发给终端101,由终端101同时播放该第一音频和第二音频。本申请实施例提供的音频生成方法,能够应用于音频处理场景中:例如,应用于自动生成音频的场景中。在用户编写音频的过程中,若采用本申请实施例提供的音频生成方法,用户只需输入图像,设备即可根据输入的图像自动生成音频,用户可以直接使用该音频,或者,由该音频为用户带来创作灵感。图2是本申请实施例提供的一种音频生成方法的流程图。本申请实施例以执行主体为终端为例,进行示例性说明。参见图2,该方法包括:201、终端获取目标图像的像素点的像素值。其中,目标图像为任一图像,例如,目标图像为人物图像、动物图像、风景图像、物品图像等,本申请实施例对目标图像不做限定。像素点的像素值为能够表示该像素点的颜色或者亮度的数值。在步骤201中,终端会获取目标图像的像素点的像素值,其中,终端可以只获取目标图像中一个像素点的像素值,也可以获取多个像素点的像素值,可以获取部分像素点的像素值,也可以获取全部像素点的像素值,本申请实施例对步骤201中获取多少个像素点的像素值不做限定。202、终端根据获取的像素点的像素值生成曲谱,该曲谱包括音符标识,每个音符标识的音调是基于一个或者多个像素点的像素值确定的。其中,每个音符标识的音调是基于一个或者多个像素点的像素值确定的是指:每个音符标识是基于一个像素点的像素值确定的,或者,每个音符标识是基于多个像素点的像素值确定的。步骤202中的终端获取的像素点为该目标图像中的全部像素点或者部分像素点,本申请实施例本文档来自技高网...

【技术保护点】
1.一种音频生成方法,其特征在于,所述方法包括:/n获取目标图像的像素点的像素值;/n根据获取的像素点的像素值生成曲谱,所述曲谱包括音符标识,每个音符标识的音调是基于一个像素点的像素值确定的,或者,所述每个音符标识的音调是基于多个像素点的像素值确定的;/n按照所述曲谱,生成与所述曲谱对应的第一音频。/n

【技术特征摘要】
1.一种音频生成方法,其特征在于,所述方法包括:
获取目标图像的像素点的像素值;
根据获取的像素点的像素值生成曲谱,所述曲谱包括音符标识,每个音符标识的音调是基于一个像素点的像素值确定的,或者,所述每个音符标识的音调是基于多个像素点的像素值确定的;
按照所述曲谱,生成与所述曲谱对应的第一音频。


2.根据权利要求1所述的方法,其特征在于,所述根据获取的像素点的像素值生成曲谱,包括:
按照所述目标图像中像素点的排列顺序,依次在曲谱中与获取的每个像素点的像素值对应的谱线上添加音符标识,得到添加多个所述音符标识后的曲谱,其中,所述音符标识所在的谱线用于指示所述音符标识的音调。


3.根据权利要求2所述的方法,其特征在于,所述按照所述目标图像中像素点的排列顺序,依次在曲谱中与获取的每个像素点的像素值对应的谱线上添加音符标识,得到添加多个所述音符标识后的曲谱,包括:
按照所述目标图像中像素点的排列顺序,依次获取所述每个像素点的像素值;
每次根据获取的像素值,确定谱线序号与所述像素值匹配的谱线,在所述曲谱中的所述谱线上添加所述音符标识,得到添加多个所述音符标识后的曲谱。


4.根据权利要求3所述的方法,其特征在于,所述每次根据获取的像素值,确定谱线序号与所述像素值匹配的谱线,在所述曲谱中的所述谱线上添加所述音符标识,得到添加多个所述音符标识后的曲谱,包括:
每次对获取的像素值进行统计处理,得到处理后的像素值,在所述曲谱中谱线序号与所述处理后的像素值相等的谱线上添加所述音符标识,得到添加多个所述音符标识后的曲谱。


5.根据权利要求1所述的方法,其特征在于,所述根据获取的像素点的像素值生成曲谱,包括:
按照所述目标图像中像素点的排列顺序,依次确定与获取的每个像素点的像素值对应的数字形式的音符标识,将确定的多个音符标识构成所述曲谱,其中,所述音符标识的数字用于指示所述音符标识的音调。


6.根据权利要求5所述的方法,其特征在于,所述按照所述目标图像中像素点的排列顺序,依次确定与获取的每个像素点的像素值对应的数字形式的音符标识,包括:
按照所述目标图像中像素点的排列顺序,依次获取所述每个像素点的像素值;
每次根据获取的像素值,获取所述像素值与目标数值相除之后得到的余数,所述目标数值与曲谱中的音符类型数量相等,将获取的余数加1后的数字作为音符标识。


7.根据权利要求1所述的方法,其特征在于,所述根据获取的像素点的像素值生成曲谱,包括:
按照所述目标图像中多列像素点的排列顺序,依次在曲谱中与每列像素点的统计像素值对应的谱线上添加音符标识,得到添加多个所述音符标识后的曲谱,其中,所述音符标识所在的谱线用于指示所述音符标识的音调。


8.根据权利要求1所述的方法,其特征在于,所述根据获取的像素点的像素值生成曲谱,包括:
按照所述目标图像中多列像素点的排列顺序,依次确定与每列像素点的统计像素值对应的数字形式的音符标识,将确定的多个音符标识构成所述曲谱,其中,所述音符标识的数字用于指示所述音符标识的音调。


9.根据权利要求1所述的方法,其特征在于,所述像素值为RGB值,所述根据获取的像素点的像素值生成曲谱,包括:
根据所述像素点的RGB值,获取所述像素点的灰度值;
根据所述像素点的灰度值,生成所述曲谱,所述曲谱中的每个音符标识是基于一个像素点的灰度值确定的,或者,所述每个音符标识是基于多个像素点的灰度值确定的。


10.根据权利要求1所述的方法,其特征在于,所述按照所述曲谱,生成与所述曲谱对应的第一音频,包括:
按照所述曲谱中多个音符标识的排列顺序,依次根据每个音符标识生成第一目标时长的第一子音频,将生成的多个第一子音频构成所述第一音频;或者,
按照所述曲谱中多个音符标识的排列顺序,依次为每个音符标识生成第一子音频,且每个音符标识对应的第一子音频的音量值与所述每个音符标识所指示的音调呈正相关关系,将生成的多个第一子音频构成所述第一音频。


11.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取目标文本,所述目标文本中包括多个字符;
将所述目标文本划分为多个语句,每个语句包括至少一个字符;
按照所述曲谱以及所述多个语句,生成包含所述多个语句的第二音频,所述曲谱还用于指示所述第二音频的音调变化。


12.根据权利要求11所述的方法,...

【专利技术属性】
技术研发人员:刘春宇
申请(专利权)人:广州酷狗计算机科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1