An embodiment of the invention relates to the technical field of audio processing, and discloses an audio file generation method and device and terminal device. The method includes recording an external voice to obtain sound files, converting a sound file into text content, and analyzing the content of the text to obtain the emotional features corresponding to the sound file. The background music and sound effects suitable for sound files are obtained on the basis of the emotional characteristics; the audio files are added to the sound files by adding background music and sound effects, and the implementation examples of the invention are implemented to add background music and sound effects to sound files with the emotional features of the sound files to improve the audible feelings of the audio files.
【技术实现步骤摘要】
一种音频文件生成方法及装置、终端设备
本专利技术涉及音频处理
,具体涉及一种音频文件生成方法及装置、终端设备。
技术介绍
市面上推出的录音软件满足了很多用户的音乐梦,如用户可以通过录音软件录制出声音文件,然后对声音文件加以润色,保存成通用的MP3格式等格式的音频文件,然后可以在其它音频播放软件上进行播放。但是目前市面上的录音软件只是对录制的声音文件加以简单润色,如去躁、混响等,最后得到的音频文件的播放效果比较单调干涩,听觉效果较差。
技术实现思路
本专利技术实施例公开了一种音频文件生成方法及装置、终端设备,用于解决现有录制的音频文件单调干涉的技术问题。本专利技术第一方面公开了一种音频文件生成方法,可包括:录制外部人声以获得声音文件;将所述声音文件转换成文本内容;对所述文本内容进行语义分析,以获得所述声音文件对应的情感特征;以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效;对所述声音文件添加所述背景音乐和所述音效,获得音频文件。作为一种可选的实施方式,在本专利技术第一方面中,上述方法还包括:在所述录制外部人声以获得声音文件的过程中,周期性拍摄录音用户的脸部图像;分析所述脸部图像,获得所述录音用户的表情特征;获取所述表情特征相对应的情绪特征;所述以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效,包括:以所述情感特征和所述情绪特征为依据,获取所述声音文件相适配的背景音乐和音效。作为一种可选的实施方式,在本专利技术第一方面中,所述对所述文本内容进行语义分析,以获得所述声音文件对应的情感特征,包括:识别所述文本内容的断句点;以所述断句点为依 ...
【技术保护点】
1.一种音频文件生成方法,其特征在于,包括:录制外部人声以获得声音文件;将所述声音文件转换成文本内容;对所述文本内容进行语义分析,以获得所述声音文件对应的情感特征;以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效;对所述声音文件添加所述背景音乐和所述音效,获得音频文件。
【技术特征摘要】
1.一种音频文件生成方法,其特征在于,包括:录制外部人声以获得声音文件;将所述声音文件转换成文本内容;对所述文本内容进行语义分析,以获得所述声音文件对应的情感特征;以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效;对所述声音文件添加所述背景音乐和所述音效,获得音频文件。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述录制外部人声以获得声音文件的过程中,周期性拍摄录音用户的脸部图像;分析所述脸部图像,获得所述录音用户的表情特征;获取所述表情特征相对应的情绪特征;所述以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效,包括:以所述情感特征和所述情绪特征为依据,获取所述声音文件相适配的背景音乐和音效。3.根据权利要求1或2所述的方法,其特征在于,所述对所述文本内容进行语义分析,以获得所述声音文件对应的情感特征,包括:识别所述文本内容的断句点;以所述断句点为依据,将所述文本内容划分成若干个短句;分析所述短句的短句语义或提取所述短句的短句关键字;根据每一个所述短句的短句语义或短句关键字,识别每一个所述短句的情感特征;判断所述短句中是否存在所述情感特征相同的连续的至少两个短句;如果存在,将所述至少两个短句作为一个所述短句;按照所述短句在所述文本内容中的位置,排序每一个所述短句的情感特征,获得所述声音文件的情感特征;所述以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效,包括:以所述文本内容的短句为依据,将所述声音文件切割成多个播放时长的子文件,所述子文件与所述短句一一对应;依序获取所述子文件相适配的背景音乐和音效;所述对所述声音文件添加所述背景音乐和所述音效,获得音频文件包括:依序对每一个所述子文件添加相适配的背景音乐和音效,获得所述音频文件。4.根据权利要求1或2所述的方法,其特征在于,所述将所述声音文件转换成文本内容,包括:检测所述声音文件中的声音停顿位置;按照所述声音停顿位置,将所述声音文件转换成文本内容,所述声音停顿位置作为所述文本内容的断句点。5.根据权利要求1或2所述的方法,其特征在于,所述对所述声音文件添加所述背景音乐和所述音效,获得音频文件之后,所述方法还包括:检测是否接收到针对所述音频文件的保存指令;在接收到所述保存指令时,检测是否接收到针对所述音频文件的保存路径;在接收到所述保存路径时,将所述音频文件以及所述音频文件的生成时间关联保存到所述保存路径对应的存储区域;在未接收到所述保存路径时,将所述音频文件以及所述音频文件的生成时间关联保存到默认路径对应的存储区域。6.一种音频文件生成装置,其特征在于,包括:录制单元,用于录制外部人声以获得声音文件;转换单元,用于将所述声音文件转换成文本内容;第一获取单元,用于对所述文本内容进行语义分析,以获得所述声音文件对应的情感特征;第二获取单元,用于以所述情感特征为依据,获取所述声音文件相适配的背景音乐和音效;第三获...
【专利技术属性】
技术研发人员:李丹,
申请(专利权)人:广东小天才科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。