音频处理方法和装置制造方法及图纸

技术编号:15508029 阅读:92 留言:0更新日期:2017-06-04 02:28
本公开是关于音频处理方法和装置。其中,该方法包括:检测音频中包括的多个种类的声音;确定所述多个种类中的与所述音频的场景信息对应的目标种类;对所述音频进行处理,使得所述目标种类的声音的音量大于所述多个种类中的其他种类的声音的音量预设值。由于根据音频的场景信息对音频中的各类声音进行处理,使得处理后的音频中符合场景需求的声音变得更加突出,可以更好地表现出音频的场景。

Audio processing method and apparatus

The present disclosure relates to audio processing methods and devices. Among them, the method comprises: a plurality of types including detection audio sound; and the audio scene information corresponding to the plurality of identified species of the target species; for processing the audio, so that the target type sound volume is larger than that of the other types of multiple species of the sound volume preset. Because of the audio scene information, the audio in the audio is processed, so that the audio in the processed audio meets the requirements of the scene becomes more prominent, and the scene of the audio can be better displayed.

【技术实现步骤摘要】
音频处理方法和装置
本公开涉及多媒体
,尤其涉及音频处理方法和装置。
技术介绍
可以通过使用录音设备或录像设备获取音频。录音设备可以是任何具有录音功能的设备,例如录音机、录音笔、具有录音功能的手机、电脑、相机、自拍杆等。录像设备可以是任何具有录像功能的设备,例如摄像机、具有录音功能的手机、电脑、相机、自拍杆等。用户听音乐会时,使用录音设备或录像设备录制音乐;用户开会时,使用录音设备或录像设备录制会议内容;餐厅可以使用录音设备或录像设备录制餐厅环境;在外旅游时,使用录音设备或录像设备录制游览环境。然而,有时录制环境比较嘈杂,导致录制的音频中主要的声音不明显,被其他杂音干扰。
技术实现思路
本公开实施例提供一种音频处理方法和装置。技术方案如下:根据本公开实施例的第一方面,提供一种音频处理方法,包括:检测音频中包括的多个种类的声音;确定所述多个种类中的与所述音频的场景信息对应的目标种类;对所述音频进行处理,使得所述目标种类的声音的音量大于所述多个种类中的其他种类的声音的音量预设值。可选的,所述方法包括:获取音频发生时对应的图像信息;基于所述图像信息确定音频的场景信息。可选的,所述确定所述多个种类中的与所述音频的场景信息对应的目标种类,包括:根据预设的场景信息与目标种类的对应关系,确定所述多个种类中的与所述音频的场景信息对应的目标种类。可选的,所述确定所述多个种类中的与所述音频的场景信息对应的目标种类,包括:根据对于所述多个种类的选择信息,确定所述多个种类中的与所述音频的场景信息对应的目标种类。可选的,声音的种类包括以下一种或多种:人声、音乐声、掌声和杂声。可选的,当检测音频中包括的多个种类的声音至少包括人声,所述音频的场景信息为人声场景时,所述确定所述多个种类中的与所述音频的场景信息对应的目标种类,包括:确定人声为目标种类;所述对所述音频进行处理,包括:提高人声的音量,降低其他种类的声音的音量,使人声的音量大于其他种类的声音的音量预设值。可选的,当检测音频中包括的多个种类的声音至少包括音乐声和掌声,以及所述音频的场景信息为音乐会场景时,所述确定所述多个种类中的与所述音频的场景信息对应的目标种类,包括:确定音乐声和掌声为目标种类;所述对所述音频进行处理,包括:提高音乐声和掌声的音量,降低其他种类的声音的音量,使音乐声和掌声的音量大于其他种类的声音的音量预设值。根据本公开的第二方面,提供一种音频处理装置,包括:检测模块,被配置为检测音频中包括的多个种类的声音;第一确定模块,被配置为确定所述多个种类中的与所述音频的场景信息对应的目标种类;处理模块,被配置为对所述音频进行处理,使得所述目标种类的声音的音量大于所述多个种类中的其他种类的声音的音量预设值。可选的,所述装置还包括:获取模块,被配置为获取音频发生时对应的图像信息;第二确定模块,被配置为基于所述图像信息确定音频的场景信息。可选的,所述第一确定模块,包括:第一确定子模块,被配置为根据预设的场景信息与目标种类的对应关系,确定所述多个种类中的与所述音频的场景信息对应的目标种类。可选的,所述第一确定模块,包括:第二确定子模块,被配置为根据接收的对于所述多个种类的选择信息,确定所述多个种类中的与所述音频的场景信息对应的目标种类。声音的种类包括以下中的一种或多种:人声、音乐声、掌声和杂声。可选的,所述第一确定模块,被配置为当所述检测模块检测到音频中包括的多个种类的声音至少包括人声,所述音频的场景信息为人声场景时,确定人声为目标种类;所述处理模块,被配置为提高人声的音量,降低其他种类的声音的音量,使人声的音量大于其他种类的声音的音量预设值。可选的,所述第一确定模块,被配置为当所述检测模块检测到音频中包括的多个种类的声音至少包括音乐声和掌声,以及所述音频的场景信息为音乐场景时,确定音乐声和掌声为目标种类;所述处理模块,被配置为提高音乐声和掌声的音量,降低其他种类的声音的音量,使音乐声和掌声的音量大于其他种类的声音的音量预设值。根据本公开的第三方面,提供一种音频处理装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:检测音频中包括的多个种类的声音;确定所述多个种类中的与所述音频的场景信息对应的目标种类;对所述音频进行处理,使得所述目标种类的声音的音量大于所述多个种类中的其他种类的声音的音量预设值。本公开的实施例提供的技术方案可以包括以下有益效果:上述技术方案,通过检测音频中包括的多个种类的声音,确定多个种类中的与音频的场景信息对应的目标种类,对音频进行处理,最终使得目标种类的声音的音量大于多个种类中的其他种类的声音的音量预设值。由于根据音频的场景信息对音频中的各类声音进行处理,使得处理后的音频中符合场景需求的声音变得更加突出,可以更好地表现出音频的场景。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1是根据一示例性实施例示出的音频处理方法的流程图。图2是根据另一示例性实施例示出的音频处理方法的流程图。图3是根据另一示例性实施例示出的音频处理方法的流程图。图4是根据另一示例性实施例示出的音频处理方法的流程图。图5是根据一示例性实施例示出的音频处理装置的框图。图6是根据另一示例性实施例示出的音频处理装置的框图。图7是根据另一示例性实施例示出的音频处理装置的框图。图8是根据另一示例性实施例示出的音频处理装置的框图。图9是根据一示例性实施例示出的用于音频处理的装置的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。本公开实施例提供的技术方案,涉及能够对音频进行处理的终端。图1是根据一示例性实施例示出的一种音频处理方法的流程图,如图1所示,音频处理方法包括以下步骤S11-S13:在步骤S11中,检测音频中包括的多个种类的声音。音频可以是通过录音设备或录像设备获取的,也可以是以任意可能的方式获取的音频文件。音频中可能包括不止一种声音。可以根据声波的特征对声音进行分类。或者,也可以根据预先设置的各种声音样本对音频中的声音进行分类。例如,声音样本例如是掌声,那么,可以从音频中检测出符合该样本的特征的掌声。在本公开实施例中,声音的种类包括以下一种或多种:人声、音乐声、掌声和杂声。声音的种类可以多种多样,不限于此。音频中可能同时包括人声、音乐声、掌声、其他无法分辨的杂声等多个种类的声音,而用户可能只需要其中一种或几种声音。该步骤中,检测音频中包括的多个种类的声音,就是检测音频中包括哪些种类的声音。可以使用任意核实的技术来检测音频中包括的各种种类的声音,本公开实施例对此不进行限定。例如,检测人声可以采用以下方法:利用时域分析(短时能量、短时过零率、短时自相关)方法的某一个特征或某几个特征的结合,判定某一语音有效的清音和浊音段;其次,针对浊音段,本文档来自技高网...
音频处理方法和装置

【技术保护点】
一种音频处理方法,其特征在于,包括:检测音频中包括的多个种类的声音;确定所述多个种类中的与所述音频的场景信息对应的目标种类;对所述音频进行处理,使得所述目标种类的声音的音量大于所述多个种类中的其他种类的声音的音量预设值。

【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:检测音频中包括的多个种类的声音;确定所述多个种类中的与所述音频的场景信息对应的目标种类;对所述音频进行处理,使得所述目标种类的声音的音量大于所述多个种类中的其他种类的声音的音量预设值。2.根据权利要求1所述的方法,其特征在于,所述方法包括:获取音频发生时对应的图像信息;基于所述图像信息确定音频的场景信息。3.根据权利要求1所述的方法,其特征在于,所述确定所述多个种类中的与所述音频的场景信息对应的目标种类,包括:根据预设的场景信息与目标种类的对应关系,确定所述多个种类中的与所述音频的场景信息对应的目标种类。4.根据权利要求1所述的方法,其特征在于,所述确定所述多个种类中的与所述音频的场景信息对应的目标种类,包括:根据对于所述多个种类的选择信息,确定所述多个种类中的与所述音频的场景信息对应的目标种类。5.根据权利要求1所述的方法,其特征在于,声音的种类包括以下一种或多种:人声、音乐声、掌声和杂声。6.根据权利要求5所述的方法,其特征在于,当检测音频中包括的多个种类的声音至少包括人声,所述音频的场景信息为人声场景时,所述确定所述多个种类中的与所述音频的场景信息对应的目标种类,包括:确定人声为目标种类;所述对所述音频进行处理,包括:提高人声的音量,降低其他种类的声音的音量,使人声的音量大于其他种类的声音的音量预设值。7.根据权利要求5所述的方法,其特征在于,当检测音频中包括的多个种类的声音至少包括音乐声,以及所述音频的场景信息为音乐会场景时,所述确定所述多个种类中的与所述音频的场景信息对应的目标种类,包括:确定音乐声为目标种类;所述对所述音频进行处理,包括:提高音乐声的音量,降低其他种类的声音的音量,使音乐声的音量大于其他种类的声音的的音量预设值。8.一种音频处理装置,其特征在于,包括:检测模块,被配置为检测音频中包括的多个种类的声音;第一确定模块,被配置为确定所述多个种类中的与所述音频的场景信息对应的目标种类...

【专利技术属性】
技术研发人员:吴珂
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1