一种音频文件生成方法及装置、终端设备制造方法及图纸

技术编号:18368240 阅读:52 留言:0更新日期:2018-07-05 10:32
本发明专利技术实施例涉及音频处理技术领域,公开了一种音频文件生成方法及装置、终端设备,该方法包括:录制外部人声以获得声音文件;将声音文件转换成文本内容;对该文本内容进行语义分析,以获得声音文件对应的情感特征;以该情感特征为依据,获取声音文件相适配的背景音乐和音效;对声音文件添加背景音乐和音效,获得音频文件;实施本发明专利技术实施例,结合声音文件的情感特征给以声音文件添加背景音乐和音效,以提高音频文件的听觉感受。

Audio file generation method, device and terminal device

An embodiment of the invention relates to the technical field of audio processing, and discloses an audio file generation method and device and terminal device. The method includes recording an external voice to obtain sound files, converting a sound file into text content, and analyzing the content of the text to obtain the emotional features corresponding to the sound file. The background music and sound effects suitable for sound files are obtained on the basis of the emotional characteristics; the audio files are added to the sound files by adding background music and sound effects, and the implementation examples of the invention are implemented to add background music and sound effects to sound files with the emotional features of the sound files to improve the audible feelings of the audio files.

【技术实现步骤摘要】
一种音频文件生成方法及装置、终端设备
本专利技术涉及音频处理
,具体涉及一种音频文件生成方法及装置、终端设备。
技术介绍
市面上推出的录音软件满足了很多用户的音乐梦,如用户可以通过录音软件录制出声音文件,然后对声音文件加以润色,保存成通用的MP3格式等格式的音频文件,然后可以在其它音频播放软件上进行播放。但是目前市面上的录音软件只是对录制的声音文件加以简单润色,如去躁、混响等,最后得到的音频文件的播放效果比较单调干涩,听觉效果较差。
技术实现思路
本专利技术实施例公开了一种音频文件生成方法及装置、终端设备,用于解决现有录制的音频文件单调干涉的技术问题。本专利技术第一方面公开了一种音频文件生成方法,可包括:录制外部人声以获得声音文件;将所述声音文件转换成文本内容;对所述文本内容进行语义分析,以获得所述声音文件对应的情感特征;以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效;对所述声音文件添加所述背景音乐和所述音效,获得音频文件。作为一种可选的实施方式,在本专利技术第一方面中,上述方法还包括:在所述录制外部人声以获得声音文件的过程中,周期性拍摄录音用户的脸部图像;分析所述脸部图像,获得所述录音用户的表情特征;获取所述表情特征相对应的情绪特征;所述以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效,包括:以所述情感特征和所述情绪特征为依据,获取所述声音文件相适配的背景音乐和音效。作为一种可选的实施方式,在本专利技术第一方面中,所述对所述文本内容进行语义分析,以获得所述声音文件对应的情感特征,包括:识别所述文本内容的断句点;以所述断句点为依据,将所述文本内容划分成若干个短句;分析所述短句的短句语义或提取所述短句的短句关键字;根据每一个所述短句的短句语义或短句关键字,识别每一个所述短句的情感特征;判断所述短句中是否存在所述情感特征相同的连续的至少两个短句;如果存在,将所述至少两个短句作为一个所述短句;按照所述短句在所述文本内容中的位置,排序每一个所述短句的情感特征,获得所述声音文件的情感特征;所述以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效,包括:以所述文本内容的短句为依据,将所述声音文件切割成多个播放时长的子文件,所述子文件与所述短句一一对应;依序获取所述子文件相适配的背景音乐和音效;所述对所述声音文件添加所述背景音乐和所述音效,获得音频文件包括:依序对每一个所述子文件添加相适配的背景音乐和音效,获得所述音频文件。作为一种可选的实施方式,在本专利技术第一方面中,所述将所述声音文件转换成文本内容,包括:检测所述声音文件中的声音停顿位置;按照所述声音停顿位置,将所述声音文件转换成文本内容,所述声音停顿位置作为所述文本内容的断句点。作为一种可选的实施方式,在本专利技术第一方面中,所述对所述声音文件添加所述背景音乐和所述音效,获得音频文件之后,所述方法还包括:检测是否接收到针对所述音频文件的保存指令;在接收到所述保存指令时,检测是否接收到针对所述音频文件的保存路径;在接收到所述保存路径时,将所述音频文件以及所述音频文件的生成时间关联保存到所述保存路径对应的存储区域;在未接收到所述保存路径时,将所述音频文件以及所述音频文件的生成时间关联保存到默认路径对应的存储区域。本专利技术第二方面公开了一种音频文件生成装置,可包括:录制单元,用于录制外部人声以获得声音文件;转换单元,用于将所述声音文件转换成文本内容;第一获取单元,用于对所述文本内容进行语义分析,以获得所述声音文件对应的情感特征;第二获取单元,用于以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效;第三获取单元,用于对所述声音文件添加所述背景音乐和所述音效,获得音频文件。作为一种可选的实施方式,在本专利技术第二方面中,所述装置还包括:拍摄单元,用于在所述录制单元录制外部人声以获得声音文件的过程中,周期性拍摄录音用户的脸部图像;分析单元,用于分析所述脸部图像,获得所述录音用户的表情特征;情绪获取单元,用于获取所述表情特征相对应的情绪特征;所述第二获取单元用于以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效的方式具体为:所述第二获取单元,用于以所述情感特征和所述情绪特征为依据,获取所述声音文件相适配的背景音乐和音效。作为一种可选的实施方式,在本专利技术第二方面中,所述第一获取单元用于对所述文本内容进行语义分析,以获得所述声音文件对应的情感特征的方式具体为:所述第一获取单元,用于识别所述文本内容的断句点;以及,以所述断句点为依据,将所述文本内容划分成若干个短句;以及,分析所述短句的短句语义或提取所述短句的短句关键字;以及,根据每一个所述短句的短句语义或短句关键字,识别每一个所述短句的情感特征;以及,判断所述短句中是否存在所述情感特征相同的连续的至少两个短句;以及,如果存在,将所述至少两个短句作为一个所述短句;以及,按照所述短句在所述文本内容中的位置,排序每一个所述短句的情感特征,获得所述声音文件的情感特征;所述第二获取单元用于以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效的方式具体为:所述第二获取单元,用于以所述文本内容的短句为依据,将所述声音文件切割成多个播放时长的子文件,所述子文件与所述短句一一对应;以及,依序获取所述子文件相适配的背景音乐和音效;所述第三获取单元用于对所述声音文件添加所述背景音乐和所述音效,获得音频文件的方式具体为:所述第三获取单元,用于依序对每一个所述子文件添加相适配的背景音乐和音效,获得所述音频文件。作为一种可选的实施方式,在本专利技术第二方面中,所述转换单元包括:位置检测单元,用于检测所述声音文件中的声音停顿位置;文本转换单元,用于按照所述声音停顿位置,将所述声音文件转换成文本内容,所述声音停顿位置作为所述文本内容的断句点。作为一种可选的实施方式,在本专利技术第二方面中,所述装置还包括:指令检测单元,用于在所述第三获取单元对所述声音文件添加所述背景音乐和所述音效,获得音频文件之后,检测是否接收到针对所述音频文件的保存指令;路径检测单元,用于在所述指令检测单元接收到所述保存指令时,检测是否接收到针对所述音频文件的保存路径;第一保存单元,用于在所述路径检测单元接收到所述保存路径时,将所述音频文件以及所述音频文件的生成时间关联保存到所述保存路径对应的存储区域;第二保存单元,用于在所述路径检测单元未接收到所述保存路径时,将所述音频文件以及所述音频文件的生成时间关联保存到默认路径对应的存储区域。本专利技术第三方面公开了一种终端设备,可包括:本专利技术第二方面所述的音频文件生成装置。与现有技术相比,本专利技术实施例具有以下有益效果:在本专利技术实施例中,在录制外部人声获得声音文件后,首先将声音文件转换成文本内容,然后对文本内容进行语义分析,获得声音文件对应的情感特征,以该情感特征为依据,获取该声音文件相适配的背景音乐和音效,然后将背景音乐和音效添加到声音文件中,获得音频文件;可以看出,通过本专利技术实施例,在制作音频文件时,在录制到声音文件后,能够将声音文件转换成文本内容,然后通过分析文本内容的语义,获得用于丰富和加强感受的背景音乐以及用于润色的音效,对声音文件进行处理,处理得到的音频文件具有更强的听觉感受,获得更好的效果。附图说明为了本文档来自技高网...
一种音频文件生成方法及装置、终端设备

【技术保护点】
1.一种音频文件生成方法,其特征在于,包括:录制外部人声以获得声音文件;将所述声音文件转换成文本内容;对所述文本内容进行语义分析,以获得所述声音文件对应的情感特征;以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效;对所述声音文件添加所述背景音乐和所述音效,获得音频文件。

【技术特征摘要】
1.一种音频文件生成方法,其特征在于,包括:录制外部人声以获得声音文件;将所述声音文件转换成文本内容;对所述文本内容进行语义分析,以获得所述声音文件对应的情感特征;以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效;对所述声音文件添加所述背景音乐和所述音效,获得音频文件。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述录制外部人声以获得声音文件的过程中,周期性拍摄录音用户的脸部图像;分析所述脸部图像,获得所述录音用户的表情特征;获取所述表情特征相对应的情绪特征;所述以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效,包括:以所述情感特征和所述情绪特征为依据,获取所述声音文件相适配的背景音乐和音效。3.根据权利要求1或2所述的方法,其特征在于,所述对所述文本内容进行语义分析,以获得所述声音文件对应的情感特征,包括:识别所述文本内容的断句点;以所述断句点为依据,将所述文本内容划分成若干个短句;分析所述短句的短句语义或提取所述短句的短句关键字;根据每一个所述短句的短句语义或短句关键字,识别每一个所述短句的情感特征;判断所述短句中是否存在所述情感特征相同的连续的至少两个短句;如果存在,将所述至少两个短句作为一个所述短句;按照所述短句在所述文本内容中的位置,排序每一个所述短句的情感特征,获得所述声音文件的情感特征;所述以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效,包括:以所述文本内容的短句为依据,将所述声音文件切割成多个播放时长的子文件,所述子文件与所述短句一一对应;依序获取所述子文件相适配的背景音乐和音效;所述对所述声音文件添加所述背景音乐和所述音效,获得音频文件包括:依序对每一个所述子文件添加相适配的背景音乐和音效,获得所述音频文件。4.根据权利要求1或2所述的方法,其特征在于,所述将所述声音文件转换成文本内容,包括:检测所述声音文件中的声音停顿位置;按照所述声音停顿位置,将所述声音文件转换成文本内容,所述声音停顿位置作为所述文本内容的断句点。5.根据权利要求1或2所述的方法,其特征在于,所述对所述声音文件添加所述背景音乐和所述音效,获得音频文件之后,所述方法还包括:检测是否接收到针对所述音频文件的保存指令;在接收到所述保存指令时,检测是否接收到针对所述音频文件的保存路径;在接收到所述保存路径时,将所述音频文件以及所述音频文件的生成时间关联保存到所述保存路径对应的存储区域;在未接收到所述保存路径时,将所述音频文件以及所述音频文件的生成时间关联保存到默认路径对应的存储区域。6.一种音频文件生成装置,其特征在于,包括:录制单元,用于录制外部人声以获得声音文件;转换单元,用于将所述声音文件转换成文本内容;第一获取单元,用于对所述文本内容进行语义分析,以获得所述声音文件对应的情感特征;第二获取单元,用于以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效;第三获...

【专利技术属性】
技术研发人员:李丹
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1