语音增强方法及装置制造方法及图纸

技术编号:22138033 阅读:37 留言:0更新日期:2019-09-18 11:25
本申请公开了一种语音增强方法及装置,属于多媒体处理领域。所述方法包括:获取目标图像,目标图像包括N个图像区域;当接收到N个图像区域中目标图像区域上的预设操作时,确定与目标图像区域对应的目标空间方向,并对目标空间方向对应的声音信号进行语音增强处理。本申请通过语音增强系统根据用户通过预设操作所指定的目标图像区域进行声源定位,进而使得定位出的目标空间方向即为用户所需要增强语音的方向,从而提高了声源定位的准确性和增强后的声音信号的质量,大大提供了语音增强系统的性能。

Speech Enhancement Method and Device

【技术实现步骤摘要】
语音增强方法及装置
本申请实施例涉及多媒体处理领域,特别涉及一种语音增强方法及装置。
技术介绍
语音增强方法是指从环境噪声中提取有用的声音信号从而降低噪声干扰的方法。目前,以基于麦克风阵列的语音增强方法为例,该语音增强方法包括:摄像机利用多个麦克风各自采集声音信号,根据采集到的多个声音信号各自包含的空间相位信息进行空间滤波,形成具有指向方向的空间波束,从而对指定方向上的声音信号进行增强。但是,在上述方法中,当使用环境中存在多个声音信号或者环境噪声较大时,由于摄像机通常选择声音最强的声音信号进行增强,因此很可能会导致增强的声音信号与使用者实际需要增强的声音信号不一致的情况。
技术实现思路
为了解决相关技术中语言增强过程中声源定位不准确的问题,本申请实施例提供了一种语音增强方法及装置。所述技术方案如下:第一方面,提供了一种语音增强方法,所述方法包括:获取视频采集区域的目标图像,所述目标图像包括N个图像区域,所述N为大于1的正整数;当接收到所述N个图像区域中目标图像区域上的预设操作时,确定与所述目标图像区域对应的目标空间方向,所述目标空间方向用于指示需要进行语音增强处理的空间方向;对所述目标空间方向对应的声音信号进行语音增强处理。可选的,所述当接收到所述目标图像中目标图像区域上的预设操作时,确定与所述目标图像区域对应的目标空间方向,包括:当接收到所述目标图像中的预设操作时,将所述预设操作对应的图像区域确定为所述目标图像区域;根据第一预设对应关系,将所述目标图像区域对应的空间方向确定为目标空间方向,所述第一预设对应关系包括所述图像区域与所述空间方向之间的对应关系。可选的,所述对所述目标空间方向对应的声音信号进行语音增强处理,包括:对来自于所述目标空间方向的声音信号进行语音增强处理,并对来自于非目标空间方向的声音信号进行语音抑制处理;其中,所述非目标空间方向为所述视频采集区域中除所述目标空间方向以外的其它空间方向。可选的,所述对所述目标空间方向对应的声音信号进行语音增强处理,包括:根据第二预设对应关系,确定与所述目标空间方向对应的目标局部空间,所述第二预设对应关系包括所述空间方向和局部空间之间的对应关系;对来自于所述目标局部空间的声音信号进行语音增强处理,并对来自于非目标局部空间的声音信号进行语音抑制处理;其中,所述非目标局部空间为所述视频采集区域中除所述目标局部空间以外的其它空间。可选的,所述视频采集区域包括M个不同的拍摄区域,所述M为大于1的正整数,所述获取视频采集区域的目标图像,包括:获取所述M个拍摄区域各自对应的拍摄图像;将所述M个拍摄图像进行拼接,得到所述目标图像。第二方面,提供了一种语音增强装置,所述装置包括:获取模块,用于获取视频采集区域的目标图像,所述目标图像包括N个图像区域,所述N为大于1的正整数;确定模块,用于当接收到所述N个图像区域中目标图像区域上的预设操作时,确定与所述目标图像区域对应的目标空间方向,所述目标空间方向用于指示需要进行语音增强处理的空间方向;增强模块,用于对所述目标空间方向对应的声音信号进行语音增强处理。可选的,所述确定模块,还用于当接收到所述N个图像区域中的预设操作时,将所述预设操作对应的图像区域确定为所述目标图像区域;根据第一预设对应关系,将所述目标图像区域对应的空间方向确定为目标空间方向,所述第一预设对应关系包括所述图像区域与空间方向之间的对应关系。可选的,所述增强模块,还用于对来自于所述目标空间方向的声音信号进行语音增强处理,并对来自于非目标空间方向的声音信号进行语音抑制处理;其中,所述非目标空间方向为除所述目标空间方向以外的其它空间方向。可选的,所述增强模块,还用于根据第二预设对应关系,确定与所述目标空间方向对应的目标局部空间,所述第二预设对应关系包括所述空间方向和局部空间之间的对应关系;对来自于所述目标局部空间的声音信号进行语音增强处理,并对来自于非目标局部空间的声音信号进行语音抑制处理;其中,所述非目标局部空间为所述视频采集区域中除所述目标局部空间以外的其它空间。可选的,所述视频采集区域包括M个不同的拍摄区域,所述M为大于1的正整数,所述获取模块,还用于获取所述M个拍摄区域各自对应的拍摄图像;将所述M个拍摄图像进行拼接,得到所述目标图像。第三方面,提供了一种摄像机,所述摄像机包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面及第一方面中任意一种可能的实现方式所提供的语音增强方法。第四方面,提供了一种终端,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面及第一方面中任意一种可能的实现方式所提供的语音增强方法。第五方面,提供了一种语音增强系统,所述系统包括摄像机和终端,所述摄像机与所述终端相连,所述摄像机包括至少三个摄像头和至少六个麦克风,所述终端,用于获取视频采集区域的目标图像,所述目标图像包括N个图像区域,所述N为大于1的正整数;所述终端,还用于当接收到所述N个图像区域中目标图像区域上的预设操作时,确定与所述目标图像区域对应的目标空间方向,所述目标空间方向用于指示需要进行语音增强处理的空间方向;所述终端或者所述摄像机,用于对所述目标空间方向对应的声音信号进行语音增强处理。第六方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面及第一方面中任意一种可能的实现方式所提供的语音增强方法。本申请实施例提供的技术方案带来的有益效果是:通过语音增强系统获取目标图像,目标图像包括N个图像区域;当接收到N个图像区域中目标图像区域上的预设操作时,确定与目标图像区域对应的目标空间方向,并对目标空间方向对应的声音信号进行语音增强处理;使得语音增强系统能够根据用户通过预设操作所指定的目标图像区域进行声源定位,进而使得定位出的目标空间方向即为用户所需要增强语音的方向,从而提高了声源定位的准确性和增强后的声音信号的质量,大大提供了语音增强系统的性能。附图说明图1是本申请一个示例性实施例提供的语音增强系统的结构示意图;图2是本申请一个示例性实施例提供的语音增强系统中摄像机的结构示意图;图3是本申请一个示例性实施例提供的语音增强方法的流程图;图4是本申请另一个示例性实施例提供的语音增强方法的流程图;图5是本申请一个示例性实施例提供的语音增强方法涉及的视频采集区域的划分方式的示意图;图6是本申请一个示例性实施例提供的语音增强方法涉及的目标图像的划分方式的示意图;图7是本申请一个示例性实施例提供的语音增强方法的原理示意图;图8是本申请一个示例性实施例提供的语音增强装置的结构图;图9是本申请一个示例性实施例提供的终端的结构框图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。请参考图1,其示出了本申请一个示例性实施例提供的语音增强系统的结构示本文档来自技高网...

【技术保护点】
1.一种语音增强方法,其特征在于,所述方法包括:获取视频采集区域的目标图像,所述目标图像包括N个图像区域,所述N为大于1的正整数;当接收到所述N个图像区域中目标图像区域上的预设操作时,确定与所述目标图像区域对应的目标空间方向,所述目标空间方向用于指示需要进行语音增强处理的空间方向;对所述目标空间方向对应的声音信号进行语音增强处理。

【技术特征摘要】
1.一种语音增强方法,其特征在于,所述方法包括:获取视频采集区域的目标图像,所述目标图像包括N个图像区域,所述N为大于1的正整数;当接收到所述N个图像区域中目标图像区域上的预设操作时,确定与所述目标图像区域对应的目标空间方向,所述目标空间方向用于指示需要进行语音增强处理的空间方向;对所述目标空间方向对应的声音信号进行语音增强处理。2.根据权利要求1所述的方法,其特征在于,所述当接收到所述N个图像区域中目标图像区域上的预设操作时,确定与所述目标图像区域对应的目标空间方向,包括:当接收到所述N个图像区域中的预设操作时,将所述预设操作对应的图像区域确定为所述目标图像区域;根据第一预设对应关系,将所述目标图像区域对应的空间方向确定为目标空间方向,所述第一预设对应关系包括所述图像区域与所述空间方向之间的对应关系。3.根据权利要求1所述的方法,其特征在于,所述对所述目标空间方向对应的声音信号进行语音增强处理,包括:对来自于所述目标空间方向的声音信号进行语音增强处理,并对来自于非目标空间方向的声音信号进行语音抑制处理;其中,所述非目标空间方向为除所述目标空间方向以外的其它空间方向。4.根据权利要求1所述的方法,其特征在于,所述对所述目标空间方向对应的声音信号进行语音增强处理,包括:根据第二预设对应关系,确定与所述目标空间方向对应的目标局部空间,所述第二预设对应关系包括所述空间方向和局部空间之间的对应关系;对来自于所述目标局部空间的声音信号进行语音增强处理,并对来自于非目标局部空间的声音信号进行语音抑制处理;其中,所述非目标局部空间为所述视频采集区域中除所述目标局部空间以外的其它空间。5.根据权利要求1至4任一所述的方法,其特征在于,所述视频采集区域包括M个不同的拍摄区域,所述M为大于1的正整数,所述获取视频采集区域的目标图像,包括:获取所述M个拍摄区域各自对应的拍摄图像;将所述M个拍摄图像进行拼接,得到所述目标图像。6.一种语音增强装置,其特征在于,所述装置包括:获取模块,用于获取视频采集区域的目标图像,所述目标图像包括N个图像区域,所述N为大于1的正整数;确定模块,用于当接收到所述N个图像区域中目标图像区域上的预设操作时,确定与所述目标图像区域对应的目标空间方向,所述目标空间方向用于指示需要进行语音增强处理的空间方向;增强模块,用于对所述目标空间方向对应的声音信号进行语音增强处理。7.根据权利要求6所述的装置,其特征在于,所述确定模块,还用于当接收到所述N个图像区域中的预设操作时,将所述预设操作对应的图像区域确定为所述目标图像...

【专利技术属性】
技术研发人员:陈扬坤钱能锋陈展
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1