The present disclosure relates to audio processing methods and devices. Among them, the method comprises: a plurality of types including detection audio sound; and the audio scene information corresponding to the plurality of identified species of the target species; for processing the audio, so that the target type sound volume is larger than that of the other types of multiple species of the sound volume preset. Because of the audio scene information, the audio in the audio is processed, so that the audio in the processed audio meets the requirements of the scene becomes more prominent, and the scene of the audio can be better displayed.
【技术实现步骤摘要】
音频处理方法和装置
本公开涉及多媒体
,尤其涉及音频处理方法和装置。
技术介绍
可以通过使用录音设备或录像设备获取音频。录音设备可以是任何具有录音功能的设备,例如录音机、录音笔、具有录音功能的手机、电脑、相机、自拍杆等。录像设备可以是任何具有录像功能的设备,例如摄像机、具有录音功能的手机、电脑、相机、自拍杆等。用户听音乐会时,使用录音设备或录像设备录制音乐;用户开会时,使用录音设备或录像设备录制会议内容;餐厅可以使用录音设备或录像设备录制餐厅环境;在外旅游时,使用录音设备或录像设备录制游览环境。然而,有时录制环境比较嘈杂,导致录制的音频中主要的声音不明显,被其他杂音干扰。
技术实现思路
本公开实施例提供一种音频处理方法和装置。技术方案如下:根据本公开实施例的第一方面,提供一种音频处理方法,包括:检测音频中包括的多个种类的声音;确定所述多个种类中的与所述音频的场景信息对应的目标种类;对所述音频进行处理,使得所述目标种类的声音的音量大于所述多个种类中的其他种类的声音的音量预设值。可选的,所述方法包括:获取音频发生时对应的图像信息;基于所述图像信息确定音频的场景信息。可选的,所述确定所述多个种类中的与所述音频的场景信息对应的目标种类,包括:根据预设的场景信息与目标种类的对应关系,确定所述多个种类中的与所述音频的场景信息对应的目标种类。可选的,所述确定所述多个种类中的与所述音频的场景信息对应的目标种类,包括:根据对于所述多个种类的选择信息,确定所述多个种类中的与所述音频的场景信息对应的目标种类。可选的,声音的种类包括以下一种或多种:人声、音乐声、掌声和杂声。可选 ...
【技术保护点】
一种音频处理方法,其特征在于,包括:检测音频中包括的多个种类的声音;确定所述多个种类中的与所述音频的场景信息对应的目标种类;对所述音频进行处理,使得所述目标种类的声音的音量大于所述多个种类中的其他种类的声音的音量预设值。
【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:检测音频中包括的多个种类的声音;确定所述多个种类中的与所述音频的场景信息对应的目标种类;对所述音频进行处理,使得所述目标种类的声音的音量大于所述多个种类中的其他种类的声音的音量预设值。2.根据权利要求1所述的方法,其特征在于,所述方法包括:获取音频发生时对应的图像信息;基于所述图像信息确定音频的场景信息。3.根据权利要求1所述的方法,其特征在于,所述确定所述多个种类中的与所述音频的场景信息对应的目标种类,包括:根据预设的场景信息与目标种类的对应关系,确定所述多个种类中的与所述音频的场景信息对应的目标种类。4.根据权利要求1所述的方法,其特征在于,所述确定所述多个种类中的与所述音频的场景信息对应的目标种类,包括:根据对于所述多个种类的选择信息,确定所述多个种类中的与所述音频的场景信息对应的目标种类。5.根据权利要求1所述的方法,其特征在于,声音的种类包括以下一种或多种:人声、音乐声、掌声和杂声。6.根据权利要求5所述的方法,其特征在于,当检测音频中包括的多个种类的声音至少包括人声,所述音频的场景信息为人声场景时,所述确定所述多个种类中的与所述音频的场景信息对应的目标种类,包括:确定人声为目标种类;所述对所述音频进行处理,包括:提高人声的音量,降低其他种类的声音的音量,使人声的音量大于其他种类的声音的音量预设值。7.根据权利要求5所述的方法,其特征在于,当检测音频中包括的多个种类的声音至少包括音乐声,以及所述音频的场景信息为音乐会场景时,所述确定所述多个种类中的与所述音频的场景信息对应的目标种类,包括:确定音乐声为目标种类;所述对所述音频进行处理,包括:提高音乐声的音量,降低其他种类的声音的音量,使音乐声的音量大于其他种类的声音的的音量预设值。8.一种音频处理装置,其特征在于,包括:检测模块,被配置为检测音频中包括的多个种类的声音;第一确定模块,被配置为确定所述多个种类中的与所述音频的场景信息对应的目标种类...
【专利技术属性】
技术研发人员:吴珂,
申请(专利权)人:北京小米移动软件有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。