一种音频合成的方法及终端技术

技术编号:15331916 阅读:147 留言:0更新日期:2017-05-16 15:04
本发明专利技术实施例提供了一种音频合成的方法及终端,其中,所述方法包括:对用户输入的人声音频进行切割处理,得到M个音频切片;根据预设乐曲MIDI文件中的至少一个MIDI信息,确定所述M个音频切片中每个音频切片对应的目标MIDI信息;根据确定的所述目标MIDI信息中的旋律,将所述M个音频切片中每个音频切片进行对应的音频处理,得到处理后的M个音频切片,所述处理后的M个音频切片具有与所述目标MIDI信息相同的旋律;按照时间序列,将所述处理后的M个音频切片进行拼接和合成处理,以得到歌声音频。采用本发明专利技术,可实现一键歌声音频合成的功能,且保留有用户自身的音色,差异化明显,提升了音频合成的实用性和方便快捷性。

Method and terminal for synthesizing audio

The embodiment of the invention provides an audio synthesis method and a terminal, wherein, the method comprises the following steps: the user input voice audio cut processing, M audio section; according to at least one preset MIDI information in the MIDI file to determine the music, the M audio sections of each audio section corresponding to the the target of MIDI information; according to the information of the target MIDI in the melody, the M audio sections of each audio section corresponding audio processing, M audio processing section, the processed M audio section has the same and the target MIDI according to the time information of melody; sequence, the treated M audio sections for splicing and synthesis processing, in order to get the audio song. By adopting the invention, the function of one button singing and audio synthesis can be realized, and the sound quality of the user is reserved, and the difference is obvious, and the practicability, the convenience and the rapidity of the audio synthesis are improved.

【技术实现步骤摘要】
一种音频合成的方法及终端
本专利技术涉及音频处理
,尤其涉及一种音频合成的方法及终端。
技术介绍
随着信息科技的不断发展和成熟,终端设备所具备的处理能力也大幅提高,使得很多复杂的应用得以实现,例如音频或歌声合成等相关技术。目前市面上出现的唱歌软件,例如虚拟歌手、练唱软件等,大多是为一些唱歌爱好者,特别是唱歌比较好听的人群设计的,通过录音发布自己演唱的歌曲。但其并不适用于那些不会唱歌、但妙语连珠适合创作的人。在实践中发现,现有技术中的音频合成方案,通常需要预先录制真人的歌曲样本数据库以建立歌曲语料库,用户输入文本文字后,通过文字匹配到歌曲语料库中的目标歌曲,然后将目标歌曲的歌词对应替换为用户输入的文本文字,即可输出用户想要的演唱歌曲。然而,建立歌曲语料库需要较长的时间消耗,并且录制数量还会受限。此外,受限于预录的歌曲语料库,输出的演唱歌曲只能为固定音色,并不能保留用户自身的音色,使得差异化不大。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供一种音频合成的方法及终端,可实现一键歌声音频合成的功能,且保留有用户自身的音色特征,具有明显地差异化,提升了音频合成的实用性。第一方面,本专利技术实施例公开提供了一种音频合成的方法,所述方法包括:接收用户输入的人声音频,并对所述人声音频进行切割处理,得到M个音频切片,M为大于0的正整数;根据预设乐曲MIDI文件中的至少一个MIDI信息,确定所述M个音频切片中每个音频切片对应的目标MIDI信息,其中,每个音频切片对应一个或多个目标MIDI信息,所述至少一个MIDI信息按照时间序列组成所述预设乐曲MIDI文件,所述MIDI信息包括旋律;根据确定的所述目标MIDI信息中的旋律,将所述M个音频切片中每个音频切片进行对应的音频处理,得到处理后的M个音频切片,所述处理后的M个音频切片具有与所述目标MIDI信息相同的旋律;按照时间序列,将所述处理后的M个音频切片进行拼接和合成处理,以得到歌声音频。其中可选的,所述根据预设乐曲MIDI文件中的至少一个MIDI信息,确定所述M个音频切片中每个音频切片对应的目标MIDI信息具体包括:按照时间序列,将预设乐曲MIDI文件中的至少一个MIDI信息顺序匹配给所述M个音频切片中每个音频切片,并作为所述每个音频切片对应的目标MIDI信息;其中,每个音频切片对应一个或多个目标MIDI信息。其中可选的,所述旋律包括音高、音长、音量中的至少一个,所述根据确定的所述目标MIDI信息中的旋律,将所述M个音频切片中每个音频切片进行对应的音频处理,得到处理后的M个音频切片具体包括:根据确定的所述目的MIDI信息中的旋律,来对应调整和处理所述M个音频切片中每个音频切片,以得到处理后的M个音频切片;其中,所述处理后的M个音频切片与确定的所述目的MIDI信息具有以下相同内容中的至少一个:音高、音长、音量。其中可选的,所述对所述人声音频进行切割处理,得到M个音频切片具体包括:在存在所述人声音频对应的文本歌词的情况下,通过对所述文本歌词进行分割处理,得到与所述人声音频对应的至少一个音频切片;或者,在没有所述人声音频对应的文本歌词的情况下,通过对所述人声音频进行语音识别,得到所述人声音频对应的文本歌词,并对所述文本歌词进行分割处理,得到与所述人声音频对应的至少一个音频切片。其中可选的,所述方法还包括:获取所述预设乐曲MIDI文件或所述人声音频对应的伴奏音频;将所述伴奏音频和所述歌声音频进行音频合成处理,得到混合歌曲音频。第二方面,本专利技术实施例还公开提供了一种终端,所述终端包括:接收单元,用于接收用户输入的人声音频;切割单元,用于对所述人声音频进行切割处理,得到M个音频切片,M为大于0的正整数;确定单元,用于根据预设乐曲MIDI文件中的至少一个MIDI信息,确定所述M个音频切片中每个音频切片对应的目标MIDI信息,其中,每个音频切片对应一个或多个目标MIDI信息,所述至少一个MIDI信息按照时间序列组成所述预设乐曲MIDI文件,所述MIDI信息包括旋律;处理单元,用于根据确定的所述目标MIDI信息中的旋律,将所述M个音频切片中每个音频切片进行对应的音频处理,得到处理后的M个音频切片,所述处理后的M个音频切片具有与所述目标MIDI信息相同的旋律;合成单元,用于按照时间序列,将所述处理后的M个音频切片进行拼接和合成处理,以得到歌声音频。其中可选地,所述确定单元,具体用于按照时间序列,将预设乐曲MIDI文件中的至少一个MIDI信息顺序匹配给所述M个音频切片中每个音频切片,并作为所述每个音频切片对应的目标MIDI信息;其中,每个音频切片对应一个或多个目标MIDI信息。其中可选地,所述旋律包括音高、音长、音量中的至少一个,所述处理单元,具体用于根据确定的所述目的MIDI信息中的旋律,来对应调整和处理所述M个音频切片中每个音频切片,以得到处理后的M个音频切片;其中,所述处理后的M个音频切片与确定的所述目的MIDI信息具有以下相同内容中的至少一个:音高、音长、音量。其中可选地,所述切割单元,具体用于在存在所述人声音频对应的文本歌词的情况下,通过对所述文本歌词进行分割处理,得到与所述人声音频对应的至少一个音频切片;或者,所述切割单元,具体用于在没有所述人声音频对应的文本歌词的情况下,通过对所述人声音频进行语音识别,得到所述人声音频对应的文本歌词,并对所述文本歌词进行分割处理,得到与所述人声音频对应的至少一个音频切片。其中可选地,所述终端还包括:获取单元,用于获取所述预设乐曲MIDI文件或所述人声音频对应的伴奏音频;所述合成单元,还用于将所述伴奏音频和所述歌声音频进行音频合成处理,得到混合歌曲音频。第三方面,提供了一种终端,其特征在于,包括:处理器、存储器、通信接口和总线;所述处理器、所述存储器和所述通信接口通过所述总线连接并完成相互间的通信;所述存储器存储可执行程序代码;所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于执行一种音频合成的方法;其中,所述方法为第一方面任一项所述的方法。第四方面,本专利技术提供了一种计算机可读存储介质,所述计算机可读存储介质存储了计算设备所执行的用于音频合成的程序代码。所述程序代码包括用于执行在第一方面中任一项的方法的指令。本专利技术实施例中,通过对用户输入的人声音频进行切割处理,得到M个音频切片,然后根据预设乐曲MIDI文件中的至少一个MIDI信息,确定所述M个音频切片中每个音频切片对应的目标MIDI信息,接着根据确定的所述目标MIDI信息中的旋律,将所述M个音频切片中每个音频切片进行对应的音频处理,得到处理后的M个音频切片,所述处理后的M个音频切片具有与所述目标MIDI信息相同的旋律,最后按照时间序列,将所述处理后的M个音频切片进行拼接和合成处理,以得到歌声音频。采用本专利技术,可实现一键歌声音频合成的功能,且保留有用户自身的音色,具有明显地差异化,提升了音频合成的实用性和方便快捷性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提本文档来自技高网...
一种音频合成的方法及终端

【技术保护点】
一种音频合成的方法,其特征在于,所述方法包括:接收用户输入的人声音频,并对所述人声音频进行切割处理,得到M个音频切片,M为大于0的正整数;根据预设乐曲MIDI文件中的至少一个MIDI信息,确定所述M个音频切片中每个音频切片对应的目标MIDI信息,其中,每个音频切片对应一个或多个目标MIDI信息,所述至少一个MIDI信息按照时间序列组成所述预设乐曲MIDI文件,所述MIDI信息包括旋律;根据确定的所述目标MIDI信息中的旋律,将所述M个音频切片中每个音频切片进行对应的音频处理,得到处理后的M个音频切片,所述处理后的M个音频切片具有与所述目标MIDI信息相同的旋律;按照时间序列,将所述处理后的M个音频切片进行拼接和合成处理,以得到歌声音频。

【技术特征摘要】
1.一种音频合成的方法,其特征在于,所述方法包括:接收用户输入的人声音频,并对所述人声音频进行切割处理,得到M个音频切片,M为大于0的正整数;根据预设乐曲MIDI文件中的至少一个MIDI信息,确定所述M个音频切片中每个音频切片对应的目标MIDI信息,其中,每个音频切片对应一个或多个目标MIDI信息,所述至少一个MIDI信息按照时间序列组成所述预设乐曲MIDI文件,所述MIDI信息包括旋律;根据确定的所述目标MIDI信息中的旋律,将所述M个音频切片中每个音频切片进行对应的音频处理,得到处理后的M个音频切片,所述处理后的M个音频切片具有与所述目标MIDI信息相同的旋律;按照时间序列,将所述处理后的M个音频切片进行拼接和合成处理,以得到歌声音频。2.如权利要求1所述的方法,其特征在于,所述根据预设乐曲MIDI文件中的至少一个MIDI信息,确定所述M个音频切片中每个音频切片对应的目标MIDI信息具体包括:按照时间序列,将预设乐曲MIDI文件中的至少一个MIDI信息顺序匹配给所述M个音频切片中每个音频切片,并作为所述每个音频切片对应的目标MIDI信息;其中,每个音频切片对应一个或多个目标MIDI信息。3.如权利要求1所述的方法,其特征在于,所述旋律包括音高、音长、音量中的至少一个。4.如权利要求1所述的方法,其特征在于,所述对所述人声音频进行切割处理,得到M个音频切片具体包括:在存在所述人声音频对应的文本歌词的情况下,通过对所述文本歌词进行分割处理,得到与所述人声音频对应的至少一个音频切片;或者,在没有所述人声音频对应的文本歌词的情况下,通过对所述人声音频进行语音识别,得到所述人声音频对应的文本歌词,并对所述文本歌词进行分割处理,得到与所述人声音频对应的至少一个音频切片。5.如权利要求1-4中任意一项所述的方法,其特征在于,所述方法还包括:获取所述预设乐曲MIDI文件或所述人声音频对应的伴奏音频;将所述伴奏音频和所述歌声音频进行音频合成处理,得到混合歌曲音频。6.一种终端,其特征在于,所述终端包括:接收单元,用于接收用户输入的人声音频;切割单元,用于对所述人声音频进行切割处理,得到M个音频切片,M为大于0的正整数;...

【专利技术属性】
技术研发人员:陈雪琪
申请(专利权)人:腾讯音乐娱乐深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1