一种音频转换方法及装置制造方法及图纸

技术编号:17304523 阅读:38 留言:0更新日期:2018-02-18 22:38
本发明专利技术公开了一种音频转化方法,包括:获取第一音频数据以及转换目标,确定出所述第一音频数据的音节所对应的文本信息以及所述第一音频数据的音频特征,并确定出所述转换目标的发音方式;在设定的发音数据库查询出所述第一音频数据的文本信息所对应于所述转换目标发音方式的发音数据,根据所述文本信息的文字顺序将所述发音数据进行合成,获得第二音频数据;按照所述第一音频数据的音频特征,对所述第二音频数据的音频特征进行调音,确定出调音后的第二音频数据。本发明专利技术还公开了一种音频转化装置以及计算机可读存储介质。

An audio conversion method and device

The invention discloses an audio conversion method, including: obtaining a first audio data and audio conversion goals, determine the characteristics corresponding to the first syllable audio data and text information of the first audio data, and determined that the conversion target mode in the setting of pronunciation; pronunciation database to search a the first audio data text information corresponding to the pronunciation data of the conversion target pronunciation, according to the text information of the text in order to the pronunciation data synthesis, second audio data; according to the audio features the first audio data, the audio features of the second audio data for tuning, second the audio data is determined after tuning. The invention also discloses an audio conversion device and a computer readable storage medium.

【技术实现步骤摘要】
一种音频转换方法及装置
本专利技术涉及音频处理技术,尤其涉及一种音频转换方法、音频转换装置以及计算机可读存储介质。
技术介绍
随着移动终端技术的飞速发展,移动终端所能提供的功能变得越来越丰富,因此,依托于移动终端的移动应用也越来越朝着一个APP多种功能的方向发展。以音乐APP为例,音乐APP作为较为常见的娱乐APP,为了满足用户的娱乐需求,现在的音乐APP所能提供的功能已经从传统只提供单纯的听歌功能转换为还可以提供社交、消费、K歌等多种领域的功能。在现有的音乐APP中,针对传统的音乐播放功能以及K歌功能,主要为用户提供调音功能,以便可以更好的满足不同用户的口味和风格,其中,所提供的调音功能主要是针对歌曲的音调、音准、节奏、曲调等方面的调节,例如,针对一首歌曲,用户可以根据自己的喜好,调整歌曲的节奏与曲调,比如可以从“爵士、摇滚、古典以及流行”四种模式中选择一个自己喜欢的模式,进而使得歌曲按照用户所选模式的曲调以及节奏进行播放。而在进行K歌时,用户也可以通过调整音调、音准以及节奏的方式,以使得自己演唱的歌曲尽量接近原唱。而在社交以及消费这两方面,现有的音乐APP所提供的功能多是非音乐播放方面的功能,例如,歌曲社区、听歌交友、图片分享、音乐分享、彩铃定制以及电子专辑购买等方面的功能。而现有的音乐APP虽然提供的功能越来越丰富,但是这些功能主要都是针对音乐APP的非音乐播放方面的功能,例如音乐社交功能以及音乐消费功能等,而对于传统的音乐播放领域,音乐APP所能提供的功能仍然主要为调音方面的功能,例如曲调、节奏等方面的调节,很明显,这类功能的主要目的是为了能带给用户一个更好的听歌体验,并且要使用类似的调音功能也需要用户具有一定的音乐常识与基础,因而现有的音乐APP所能提供的这类调音功能的受众范围较小。因此,从整体上来说,现有的音乐APP所提供的功能在娱乐性方面仍略显不足,尤其是在音乐APP的音乐播放方面,现有的音乐APP在音乐播放方面所提供的功能的娱乐性更显不足。由此可见,现有的音乐APP所提供的功能无法满足用户使用需求。
技术实现思路
有鉴于此,本专利技术实施例期望提供一种音频转换方法、音频转换装置及存储介质,能够选择一段音频,并根据音频转换模式,对所述选择的音频发音进行转换,达到不同的播放效果,以提高用户体验。为达到上述目的,本专利技术实施例提供了一种音频转换方法:获取第一音频数据以及转换目标,确定出所述第一音频数据的音节所对应的文本信息以及所述第一音频数据的音频特征,并确定出所述转换目标的发音方式;在设定的发音数据库查询出所述第一音频数据的文本信息所对应于所述转换目标发音方式的发音数据,根据所述文本信息的文字顺序将所述发音数据进行合成,获得第二音频数据;按照所述第一音频数据的音频特征,对所述第二音频数据的音频特征进行调音,确定出调音后的第二音频数据。其中,上述获取第一音频数据,确定出所述第一音频数据的音频特征,包括:对所述第一音频数据连续的音节进行采样,确定出所述第一音频数据的音频特征,其中,所述音频特征包括所述音频数据的响度、音色以及音调。其中,上述方法还包括:采集单个文字不同发音方式的音频数据,生成发音数据库;其中,所述发音方式至少包括各个区域不同性别的发音方式;所述发音数据库还包含所述文字所对应的不同发音方式的音频数据在数据库中存储位置的索引信息。其中,上述按照所述第一音频数据的音频特征,对所述第二音频数据的音频特征进行调整,包括:根据所述第一音频数据对应文字的音节的响度对所述第二音频数据对应文字的发音音节的响度进行调音;根据所述第一音频数据对应文字的音节的音色对所述第二音频数据对应文字的发音音节的音色进行调音;根据所述第一音频数据对应文字的音节的音调对所述第二音频数据对应文字的发音音节的音调进行调音。本专利技术实施例提供了一种音频转换装置,所述装置包括:第一采集模块,用于获取第一音频数据以及转换目标,确定出所述第一音频数据的音节所对应的文本信息以及所述第一音频数据的音频特征,并确定出所述转换目标的发音方式;转换模块,用于在设定的发音数据库查询出所述第一音频数据的文本信息所对应于所述转换目标发音方式的发音数据,根据所述文本信息的文字顺序将所述发音数据进行合成,获得第二音频数据;调音模块,用于按照所述第一音频数据的音频特征,对所述第二音频数据的音频特征进行调音,确定出调音后的第二音频数据。其中,上述第一采集模块具体用于:对所述第一音频数据连续的音节进行采样,确定出所述第一音频数据的音频特征,其中,所述音频特征包括所述音频数据的响度、音色以及音调。其中,上述装置还包括:存储器,用于采集单个文字不同发音方式的音频数据,生成发音数据库;其中,所述发音方式至少包括各个区域不同性别的发音方式;所述发音数据库还包含所述文字所对应的不同发音方式的音频数据在数据库中存储位置的索引信息。其中,上述调音模块,具体用于:根据所述第一音频数据对应文字的音节的响度对所述第二音频数据对应文字的发音音节的响度进行调音;根据所述第一音频数据对应文字的音节的音色对所述第二音频数据对应文字的发音音节的音色进行调音;根据所述第一音频数据对应文字的音节的音调对所述第二音频数据对应文字的发音音节的音调进行调音。本专利技术实施例提供了一种终端,其特征在于,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行:获取第一音频数据以及转换目标,确定出所述第一音频数据的音节所对应的文本信息以及所述第一音频数据的音频特征,并确定出所述转换目标的发音方式;在设定的发音数据库查询出所述第一音频数据的文本信息所对应于所述转换目标发音方式的发音数据,根据所述文本信息的文字顺序将所述发音数据进行合成,获得第二音频数据;按照所述第一音频数据的音频特征,对所述第二音频数据的音频特征进行调音,确定出调音后的第二音频数据。本专利技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现:获取第一音频数据以及转换目标,确定出所述第一音频数据的音节所对应的文本信息以及所述第一音频数据的音频特征,并确定出所述转换目标的发音方式;在设定的发音数据库查询出所述第一音频数据的文本信息所对应于所述转换目标发音方式的发音数据,根据所述文本信息的文字顺序将所述发音数据进行合成,获得第二音频数据;按照所述第一音频数据的音频特征,对所述第二音频数据的音频特征进行调音,确定出调音后的第二音频数据。本专利技术实施例提供的一种音频转换方法、音频转换装置以及计算机存储介质,包括:获取第一音频数据以及转换目标,确定出所述第一音频数据的音节所对应的文本信息以及所述第一音频数据的音频特征,并确定出所述转换目标的发音方式;在设定的发音数据库查询出所述第一音频数据的文本信息所对应于所述转换目标发音方式的发音数据,根据所述文本信息的文字顺序将所述发音数据进行合成,获得第二音频数据;按照所述第一音频数据的音频特征,对所述第二音频数据的音频特征进行调音,确定出调音后的第二音频数据。如此,能够选择一段音频,并根据预设音频转换模式,对所述选择的音频发音进行转换,以达到不同的播放效果,提高了音乐APP的娱乐性,给用户带来更好的使用体验。附本文档来自技高网
...
一种音频转换方法及装置

【技术保护点】
一种音频转换方法,其特征在于,所述方法包括:获取第一音频数据以及转换目标,确定出所述第一音频数据的音节所对应的文本信息以及所述第一音频数据的音频特征,并确定出所述转换目标的发音方式;在设定的发音数据库查询出所述第一音频数据的文本信息所对应于所述转换目标发音方式的发音数据,根据所述文本信息的文字顺序将所述发音数据进行合成,获得第二音频数据;按照所述第一音频数据的音频特征,对所述第二音频数据的音频特征进行调音,确定出调音后的第二音频数据。

【技术特征摘要】
1.一种音频转换方法,其特征在于,所述方法包括:获取第一音频数据以及转换目标,确定出所述第一音频数据的音节所对应的文本信息以及所述第一音频数据的音频特征,并确定出所述转换目标的发音方式;在设定的发音数据库查询出所述第一音频数据的文本信息所对应于所述转换目标发音方式的发音数据,根据所述文本信息的文字顺序将所述发音数据进行合成,获得第二音频数据;按照所述第一音频数据的音频特征,对所述第二音频数据的音频特征进行调音,确定出调音后的第二音频数据。2.根据权利要求1所述的方法,其特征在于,所述获取第一音频数据,确定出所述第一音频数据的音频特征,包括:对所述第一音频数据连续的音节进行采样,确定出所述第一音频数据的音频特征,其中,所述音频特征包括所述音频数据的响度、音色以及音调。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:采集单个文字不同发音方式的音频数据,生成发音数据库;其中,所述发音方式至少包括各个区域不同性别的发音方式;所述发音数据库还包含所述文字所对应的不同发音方式的音频数据在数据库中存储位置的索引信息。4.根据权利要求1所述的方法,其特征在于,所述按照所述第一音频数据的音频特征,对所述第二音频数据的音频特征进行调整,包括:根据所述第一音频数据对应文字的音节的响度对所述第二音频数据对应文字的发音音节的响度进行调音;根据所述第一音频数据对应文字的音节的音色对所述第二音频数据对应文字的发音音节的音色进行调音;根据所述第一音频数据对应文字的音节的音调对所述第二音频数据对应文字的发音音节的音调进行调音。5.一种音频转换装置,其特征在于,所述装置包括:采集模块,用于获取第一音频数据以及转换目标,确定出所述第一音频数据的音节所对应的...

【专利技术属性】
技术研发人员:黄玉贵
申请(专利权)人:咪咕音乐有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1