音频信号的处理方法、装置、设备和存储介质制造方法及图纸

技术编号:26224664 阅读:26 留言:0更新日期:2020-11-04 10:59
本发明专利技术提供一种音频信号的处理方法、装置、设备和存储介质,方法包括确定视频采集设备的视场范围;从采集的所有音频信号中选取位于视频采集设备的视场范围内的待处理音频信号后,对所述待处理音频信号进行增强处理,得到增强音频信号。本发明专利技术的技术方案实现了利用视场和声音结合的方式对特定目标、特定方向、特定区域范围的声源定位和增强处理,从而提高了音频信号处理的灵活性、准确性。

【技术实现步骤摘要】
音频信号的处理方法、装置、设备和存储介质
本专利技术涉及信号处理
,尤其涉及一种音频信号的处理方法、装置、设备和存储介质。
技术介绍
通话设备在实际使用环境中容易受到背景噪音和混响等干扰,使音频信号的质量和可懂度受到影响,因此在许多通话应用中都需要进行有效的音频信号增强处理,以抑制噪声,提高音频的清晰度、可懂度和舒适度。目前,最常用的麦克风阵列语音增强技术是利用麦克风阵列接收到的音频信号里包含的空间相位信息对输入语音进行空间滤波,形成具有指向性的空间波束,对指定方向上的音频信号进行增强。但是,当使用环境中存在多个声源时,传统的来波方向估计只能选择声音最强的声源进行增强,而其他声源无法被增强,或者,无法对特定的声源信号、特定区域范围内的声源信号进行增强,从而降低了音频信号处理的灵活性、准确性。
技术实现思路
有鉴于此,本专利技术的目的在于提出一种音频信号的处理方法、装置、设备和存储介质,以解决音频信号处理的灵活性、准确性较低的问题。基于上述目的,本专利技术提供了一种音频信号的处理方法,包括:确定视频采集设备的视场范围;从采集的所有音频信号中选取位于所述视场范围内的待处理音频信号;对所述待处理音频信号进行增强处理,得到增强音频信号。进一步地,上述所述的音频信号的处理方法中,确定视频采集设备的视场范围,包括:获取所述视频采集设备的采集参数;根据所述视频采集设备的采集参数,确定所述视场范围。进一步地,上述所述的音频信号的处理方法中,所述视频采集设备的采集参数包括所述视频采集设备的拍摄方向和/或成像倍数。进一步地,上述所述的音频信号的处理方法中,从采集的所有音频信号中选取位于所述视场范围内的待处理音频信号,包括:根据视频采集设备和麦克风阵列的相对位置,确定所述视场范围对应的视频画面中像素坐标与麦克风阵列的来波方向之间的映射关系;其中,所述麦克风阵列用于采集音频信号;提取所述视频画面中唇部坐标;根据像素坐标与麦克风阵列的来波方向之间的映射关系,确定所述唇部坐标对应的来波方向;从所有音频信号的来波方向中选取与所述唇部坐标对应的来波方向一致的音频信号作为所述待处理音频信号。进一步地,上述所述的音频信号的处理方法中,对所述待处理音频信号进行增强处理,得到增强音频信号,包括:将所有待处理音频信号进行积分处理,得到目标音频信号;根据所述目标音频信号和所有音频信号,确定待抑制音频信号;根据所述目标音频信号和所述待抑制音频信号,确定所述目标音频信号的加权权重变换矩阵;利用所述加权权重变换矩阵对所述目标音频信号进行增强处理,得到所述增强音频信号。本专利技术还提供一种音频信号的处理装置,包括:确定模块,用于确定视频采集设备的视场范围;选取模块,用于从采集的所有音频信号中选取位于所述视场范围内的待处理音频信号;增强处理模块,用于对所述待处理音频信号进行增强处理,得到增强音频信号。进一步地,上述所述的音频信号的处理装置中,所述确定模块,具体用于:获取所述视频采集设备的采集参数;根据所述视频采集设备的采集参数,确定所述视场范围。进一步地,上述所述的音频信号的处理装置中,所述增强处理模块,具体用于:将所有待处理音频信号进行积分处理,得到目标音频信号;根据所述目标音频信号和所有音频信号,确定待抑制音频信号;根据所述目标音频信号和所述待抑制音频信号,确定所述目标音频信号的加权权重变换矩阵;利用所述加权权重变换矩阵对所述目标音频信号进行增强处理,得到所述增强音频信号。本专利技术还提供一种音频信号的处理设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上任意一项所述的音频信号的处理方法。本专利技术还提供一种存储介质,所述存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任意一项所述的音频信号的处理方法。从上面所述可以看出,本专利技术提供的音频信号的处理方法、装置、设备和存储介质,通过确定视频采集设备的视场范围;从采集的所有音频信号中选取位于视频采集设备的视场范围内的待处理音频信号后,对所述待处理音频信号进行增强处理,得到增强音频信号,实现了利用视场和声音结合的方式对特定目标、特定方向、特定区域范围的声源定位和增强处理。采用本专利技术的技术方案,能够提高音频信号处理的灵活性、准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术的音频信号的处理方法实施例的流程图;图2为本专利技术的音频信号的处理装置实施例的结构示意图;图3为本专利技术的音频信号的处理设备实施例的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术进一步详细说明。需要说明的是,除非另外定义,本专利技术实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。图1为本专利技术的音频信号的处理方法实施例的流程图,如图1所示,本实施例的音频信号的处理方法具体可以包括如下步骤:100、确定视频采集设备的视场范围;具体地,本实施例中,可以获取视频采集设备的采集参数,例如,视频采集设备的拍摄方向和/或成像倍数。在采集到视频采集设备的采集参数后,可以根据视频采集设备的采集参数,确定视频采集设备的视场范围。其中,视频采集设备的拍摄方向可以为预设的,也可以是随着声源位置转动后得到的,本实施例不做具体限制。例如,视频采集设备通常为摄像头,可以根据摄像头具体的拍摄方向,确定视频采集设备的视场范围,另外,还可以通过调整摄像头的焦距进行缩小或扩大,从而得到摄像头的成像倍数,并根据摄像头的成像倍数,确定视频采集设备的视场范围,从而可以灵活调整视场范围大小。再次,本实施例还可以将拍摄方向与成像倍数结合在一起,确定视频采集设备的视场范围。101、从采集的所有音频信号中选取位于视场范围内的待处理音频信号;在一个具体实现过程中,可以根据视频采集本文档来自技高网...

【技术保护点】
1.一种音频信号的处理方法,其特征在于,包括:/n确定视频采集设备的视场范围;/n从采集的所有音频信号中选取位于所述视场范围内的待处理音频信号;/n对所述待处理音频信号进行增强处理,得到增强音频信号。/n

【技术特征摘要】
1.一种音频信号的处理方法,其特征在于,包括:
确定视频采集设备的视场范围;
从采集的所有音频信号中选取位于所述视场范围内的待处理音频信号;
对所述待处理音频信号进行增强处理,得到增强音频信号。


2.根据权利要求1所述的音频信号的处理方法,其特征在于,确定视频采集设备的视场范围,包括:
获取所述视频采集设备的采集参数;
根据所述视频采集设备的采集参数,确定所述视场范围。


3.根据权利要求2所述的音频信号的处理方法,其特征在于,所述视频采集设备的采集参数包括所述视频采集设备的拍摄方向和/或成像倍数。


4.根据权利要求1所述的音频信号的处理方法,其特征在于,从采集的所有音频信号中选取位于所述视场范围内的待处理音频信号,包括:
根据视频采集设备和麦克风阵列的相对位置,确定所述视场范围对应的视频画面中像素坐标与麦克风阵列的来波方向之间的映射关系;其中,所述麦克风阵列用于采集音频信号;
提取所述视频画面中唇部坐标;
根据像素坐标与麦克风阵列的来波方向之间的映射关系,确定所述唇部坐标对应的来波方向;
从所有音频信号的来波方向中选取与所述唇部坐标对应的来波方向一致的音频信号作为所述待处理音频信号。


5.根据权利要求1所述的音频信号的处理方法,其特征在于,对所述待处理音频信号进行增强处理,得到增强音频信号,包括:
将所有待处理音频信号进行积分处理,得到目标音频信号;
根据所述目标音频信号和所有音频信号,确定待抑制音频信号;
根据所述目标音频信号和...

【专利技术属性】
技术研发人员:刘青松
申请(专利权)人:云知声智能科技股份有限公司厦门云知芯智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1