The embodiment of the invention provides an audio synthesis method and a terminal, wherein, the method comprises the following steps: the user input voice audio cut processing, M audio section; according to at least one preset MIDI information in the MIDI file to determine the music, the M audio sections of each audio section corresponding to the the target of MIDI information; according to the information of the target MIDI in the melody, the M audio sections of each audio section corresponding audio processing, M audio processing section, the processed M audio section has the same and the target MIDI according to the time information of melody; sequence, the treated M audio sections for splicing and synthesis processing, in order to get the audio song. By adopting the invention, the function of one button singing and audio synthesis can be realized, and the sound quality of the user is reserved, and the difference is obvious, and the practicability, the convenience and the rapidity of the audio synthesis are improved.
【技术实现步骤摘要】
一种音频合成的方法及终端
本专利技术涉及音频处理
,尤其涉及一种音频合成的方法及终端。
技术介绍
随着信息科技的不断发展和成熟,终端设备所具备的处理能力也大幅提高,使得很多复杂的应用得以实现,例如音频或歌声合成等相关技术。目前市面上出现的唱歌软件,例如虚拟歌手、练唱软件等,大多是为一些唱歌爱好者,特别是唱歌比较好听的人群设计的,通过录音发布自己演唱的歌曲。但其并不适用于那些不会唱歌、但妙语连珠适合创作的人。在实践中发现,现有技术中的音频合成方案,通常需要预先录制真人的歌曲样本数据库以建立歌曲语料库,用户输入文本文字后,通过文字匹配到歌曲语料库中的目标歌曲,然后将目标歌曲的歌词对应替换为用户输入的文本文字,即可输出用户想要的演唱歌曲。然而,建立歌曲语料库需要较长的时间消耗,并且录制数量还会受限。此外,受限于预录的歌曲语料库,输出的演唱歌曲只能为固定音色,并不能保留用户自身的音色,使得差异化不大。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供一种音频合成的方法及终端,可实现一键歌声音频合成的功能,且保留有用户自身的音色特征,具有明显地差异化,提升了音频合成的实用性。第一方面,本专利技术实施例公开提供了一种音频合成的方法,所述方法包括:接收用户输入的人声音频,并对所述人声音频进行切割处理,得到M个音频切片,M为大于0的正整数;根据预设乐曲MIDI文件中的至少一个MIDI信息,确定所述M个音频切片中每个音频切片对应的目标MIDI信息,其中,每个音频切片对应一个或多个目标MIDI信息,所述至少一个MIDI信息按照时间序列组成所述预设乐曲MIDI文件, ...
【技术保护点】
一种音频合成的方法,其特征在于,所述方法包括:接收用户输入的人声音频,并对所述人声音频进行切割处理,得到M个音频切片,M为大于0的正整数;根据预设乐曲MIDI文件中的至少一个MIDI信息,确定所述M个音频切片中每个音频切片对应的目标MIDI信息,其中,每个音频切片对应一个或多个目标MIDI信息,所述至少一个MIDI信息按照时间序列组成所述预设乐曲MIDI文件,所述MIDI信息包括旋律;根据确定的所述目标MIDI信息中的旋律,将所述M个音频切片中每个音频切片进行对应的音频处理,得到处理后的M个音频切片,所述处理后的M个音频切片具有与所述目标MIDI信息相同的旋律;按照时间序列,将所述处理后的M个音频切片进行拼接和合成处理,以得到歌声音频。
【技术特征摘要】
1.一种音频合成的方法,其特征在于,所述方法包括:接收用户输入的人声音频,并对所述人声音频进行切割处理,得到M个音频切片,M为大于0的正整数;根据预设乐曲MIDI文件中的至少一个MIDI信息,确定所述M个音频切片中每个音频切片对应的目标MIDI信息,其中,每个音频切片对应一个或多个目标MIDI信息,所述至少一个MIDI信息按照时间序列组成所述预设乐曲MIDI文件,所述MIDI信息包括旋律;根据确定的所述目标MIDI信息中的旋律,将所述M个音频切片中每个音频切片进行对应的音频处理,得到处理后的M个音频切片,所述处理后的M个音频切片具有与所述目标MIDI信息相同的旋律;按照时间序列,将所述处理后的M个音频切片进行拼接和合成处理,以得到歌声音频。2.如权利要求1所述的方法,其特征在于,所述根据预设乐曲MIDI文件中的至少一个MIDI信息,确定所述M个音频切片中每个音频切片对应的目标MIDI信息具体包括:按照时间序列,将预设乐曲MIDI文件中的至少一个MIDI信息顺序匹配给所述M个音频切片中每个音频切片,并作为所述每个音频切片对应的目标MIDI信息;其中,每个音频切片对应一个或多个目标MIDI信息。3.如权利要求1所述的方法,其特征在于,所述旋律包括音高、音长、音量中的至少一个。4.如权利要求1所述的方法,其特征在于,所述对所述人声音频进行切割处理,得到M个音频切片具体包括:在存在所述人声音频对应的文本歌词的情况下,通过对所述文本歌词进行分割处理,得到与所述人声音频对应的至少一个音频切片;或者,在没有所述人声音频对应的文本歌词的情况下,通过对所述人声音频进行语音识别,得到所述人声音频对应的文本歌词,并对所述文本歌词进行分割处理,得到与所述人声音频对应的至少一个音频切片。5.如权利要求1-4中任意一项所述的方法,其特征在于,所述方法还包括:获取所述预设乐曲MIDI文件或所述人声音频对应的伴奏音频;将所述伴奏音频和所述歌声音频进行音频合成处理,得到混合歌曲音频。6.一种终端,其特征在于,所述终端包括:接收单元,用于接收用户输入的人声音频;切割单元,用于对所述人声音频进行切割处理,得到M个音频切片,M为大于0的正整数;...
【专利技术属性】
技术研发人员:陈雪琪,
申请(专利权)人:腾讯音乐娱乐深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。