一种定位录音的方法及装置制造方法及图纸

技术编号:19353146 阅读:59 留言:0更新日期:2018-11-07 17:51
本发明专利技术公开了一种定位录音的方法及装置。该方法包括:获取目标声源的图像信息;根据所述图像信息获取目标声源的位置信息;获取多路录音信息;根据所述目标声源的位置信息识别所述录音信息中所述目标声源的声音信息;对所述目标声源的声音信息进行处理。本发明专利技术采用上述技术方案,根据目标声源的位置信息确定多路录音信息中所述目标声源的声音信息,从而实现目标声源方向上的定位录音,使得在录音模式下,无论目标声源的位置如何移动,录音装置都能够直接识别目标声源的声音,实现对目标声源的定位录音,获得更好的录音效果,提升用户体验。

【技术实现步骤摘要】
一种定位录音的方法及装置
本专利技术涉及音视频处理领域,特别涉及一种定位录音的方法及装置。
技术介绍
随着网络APP的兴起,音视频直播成为了一项非常火爆的产业,目前多数移动终端都具备录音功能,如手机、平板电脑、音乐播放器以及专业的录音笔等,以满足用户在生活以及工作中的录音需求。用户在使用移动终端的录音功能时,录音环境往往会存在各种环境噪音,而目前市场上的手机或其它手持终端在摄像中采用的录音技术,都是只用一个MIC来采集摄像时的环境声音来作为摄像视频的伴音;或是有多个MIC来采集摄像时的多方向的环境声音信号,然后对多路声音信号进行简单的合成来作为摄像视频的伴音。这两种方案得到的视频伴音都会存在一些摄像者不希望采集的环境噪声,无法定向的录制摄像者指定方向上的声音,影响录音效果。针对该问题,现有技术中存在一种定向录音方式,利用手持终端上的两个对向MIC和一组摄像头进行录像录音,选择背离摄像头的MIC采集的录音信号作为消噪的参考音频信号,将摄像头一侧的MIC采集的录音信号中符合该参考音频信号的频率去除,以达到摄像中定向录音的目的,但此种方式通过摄像头一侧的麦克风录进的声音中仍然存在环境中所有的声音,会由于其他声源的声音干扰而无法听清目标声源的声音,比如:当将此方式应用于主播模式下时,该录音方式没有区分主播者的声音和背景音乐或背景噪音,当主播者没有靠近录音设备表演时,主播者的声音会被背景音乐或背景噪声干扰,导致人声不够响亮或不够清晰,影响最终录音效果,该方式无法实现对目标声源的定位录音,给用户带来不便。
技术实现思路
有鉴于此,本专利技术实施例的目的是提供一种定位录音的方法及装置,以解决现有定向录音装置中无法对目标声源定位录音的问题。根据第一方面,本专利技术第一实施方式中提供了一种定位录音的方法,包括:获取目标声源的图像信息;根据所述图像信息获取目标声源的位置信息;获取多路录音信息;根据所述目标声源的位置信息识别所述录音信息中所述目标声源的声音信息;对所述目标声源的声音信息进行处理。通过采用上述技术方案,可以实现目标声源位置方向上的定位录音,使得在录音模式下,无论目标声源的位置如何移动,录音装置都能够直接识别目标声源的声音,以获得更好的录音效果。结合第一方面,在第一方面第一实施方式中,所述根据所述图像信息获取目标声源的位置信息包括:提取所述图像信息中目标声源的方向信息和景深信息;根据所述方向信息和景深信息计算所述目标生源的位置信息。通过上述方法能够得到目标声源的位置。结合第一方面,在第一方面第一实施方式中,所述多路录音信息包括至少三路。通过所述多路录音信息能够收集包括目标声源在内的所有声源信息。结合第一方面,在第一方面第二实施方式中,所述根据所述目标声源的位置信息识别所述录音信息中所述目标声源的声音信息包括:获取所述多路录音信息中各路录音信息的相位和信号幅度;通过比对上述各路录音信息的相位和信号幅度差异,获取多路录音信息中所有声源的位置信息;将获取的所述声源的位置信息与根据所述图像信息获取的目标声源的位置信息进行对比,识别出所述多路录音信息中目标声源的信息。通过上述方法能够识别出多路录音信息中来自目标声源的声音信息,实现对目标声源声音的定位。结合第一方面,在第一方面的上述实施方式中,对所述目标声源的声音信息进行处理包括:对所述目标声源的声音信息进行增强,得到第一录音信息;和/或对所述录音信息中目标声源的声音信息以外的其他声源信息进行削弱,得到第二录音信息。通过上述处理,能够突出所述录音信息中目标声源的声音信息,增强对目标声源的定位录音效果。结合第一方面,在第一方面上述实施方式中,还包括根据所述第一录音信息和所述第二录音信息生成录音文件,以获得定位录音的音频文件。结合第一方面,在第一方面上述实施方式中,还包括将所述录音文件与其对应的视频信号进行同步合成,以获取定位录音的音频视频文件。根据第二方面,本专利技术实施例提供了一种定位录音装置,所述装置包括:图像信息获取模块,用于获取目标声源的图像信息;位置信息获取模块,用于根据所述图像信息获取目标声源的位置信息;录音信息获取模块,用于获取多路麦克风的录音信息;目标声源声音信息确定模块,用于根据所述目标声源的位置信息识别所述录音信息中所述目标声源的声音信息;声音信息处理模块,用于对所述目标声源的声音信息进行处理。通过采用上述技术方案,提供了一种可以实现目标位置方向上的定位录音的装置,该装置能够实施上述对目标声源的定位录音方法,使得在录音模式下,无论目标声源的位置如何移动,录音装置都能够直接识别目标声源的声音,以获得更好的录音效果。结合第二方面,在第二方面第一实施方式中,所述位置信息获取模块包括:方向接收模块,被配置为根据所述目标声源的图像信息获取目标声源的位置方向;景深参数获取模块,被配置为根据所述目标声源的图像信息获取目标声源的景深信息。通过上述位置信息获取模块能够得到目标声源的位置。结合第二方面,在第二方面第二实施方式中,所述目标声源声音信息确定模块包括:相位和信号幅度获取模块;多路录音信息声源位置信息获取模块;目标声源信息识别模块。通过使用该模块对多路录音信息进行比对分析,识别出来自目标声源的声音信息。附图说明通过参考附图会更加清楚的理解本专利技术的特征和优点,附图是示意性的而不应理解为对本专利技术进行任何限制,在附图中:图1为本专利技术实施例一提供的一种定位录音的方法的流程示意图;图2为本专利技术实施例二提供的一种定位录音的方法中识别录音信息中目标声源的声音信息的流程示意图;图3为本专利技术实施例三提供的一种定位录音的装置的结构框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一图1为本专利技术实施例一提供的一种定位录音的方法的流程示意图,该方法可以由定位录音的装置执行,其中该装置可由软件和硬件实现,一般可集成在移动终端中,本实施例中的移动终端具体可为手机、平板电脑和录音笔等终端设备。如图1所示,该方法包括:步骤101、获取目标声源的图像信息。可以通过集成在移动终端上的摄像头来获取目标声源的图像信息,目标声源就是发出目标声音的人或物,目标声音是当前场景下希望录制的声音,根据录音的场景来确定,例如在直播过程中,直播者的嘴巴就是目标声源;在乐器演奏过程中,被奏乐的乐器就是目标声源。通过集成在移动终端上的摄像头,来拍摄目标声源的图像,这样就获得了目标声源的图像信息。示例性的,可以通过摄像头的人脸识别或人体轮廓识别,得到目标声源的图像信息。步骤102、根据所述图像信息获取目标声源的位置信息。在拍摄的目标声源的图像信息中,通过图像识别可以识别出目标声源,然后根据图像中目标声源所在的位置以及拍摄图像的移动终端所在的位置,移动终端与目标声源的距离,就可以获得目标声音的位置信息。例如在主播模式下直播的过程中,移动终端所在的位置为参考坐标,移动终端拍摄的直播者的图像中,直播者位于移动终端正后方30厘米的位置,这样就得到了目标声源的位置信息。通本文档来自技高网...

【技术保护点】
1.一种定位录音的方法,其特征在于:包括:获取目标声源的图像信息;根据所述图像信息获取目标声源的位置信息;获取多路录音信息;根据所述目标声源的位置信息识别所述录音信息中所述目标声源的声音信息;对所述目标声源的声音信息进行处理。

【技术特征摘要】
1.一种定位录音的方法,其特征在于:包括:获取目标声源的图像信息;根据所述图像信息获取目标声源的位置信息;获取多路录音信息;根据所述目标声源的位置信息识别所述录音信息中所述目标声源的声音信息;对所述目标声源的声音信息进行处理。2.根据权利要求1所述的方法,其特征在于:所述根据所述图像信息获取目标声源的位置信息包括:提取所述图像信息中目标声源的方向信息和景深信息;根据所述方向信息和景深信息计算所述目标声源的位置信息。3.根据权利要求1所述的方法,其特征在于:所述多路录音信息包括至少三路。4.根据权利要求1所述的方法,其特征在于,根据所述目标声源的位置信息识别所述录音信息中目标声源的声音信息,包括:获取所述多路录音信息中各路录音信息的相位和信号幅度;通过比对上述各路录音信息的相位和信号幅度差异,获取多路录音信息中所有声源的位置信息;将获取的所述声源的位置信息与根据所述图像信息获取的目标声源的位置信息进行对比,识别出所述多路录音信息中目标声源的信息。5.根据权利要求1-4中任一项所述的方法,其特征在于,对所述目标声源的声音信息进行处理包括:对所述目标声源的声音信息进行增强,得到第一录音信息;和/或对所述录音信息中目标声源的声音信息以外的其他声源信息进行削弱,得到第二录音信息。6.根据权利要求5所述的方法,其特征在于:还包括根据所...

【专利技术属性】
技术研发人员:林萌姜南
申请(专利权)人:宇龙计算机通信科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1