音频处理方法、装置及存储介质制造方法及图纸

技术编号:23346435 阅读:30 留言:0更新日期:2020-02-15 04:55
本申请公开了一种音频处理方法、装置及存储介质,属于语音处理技术领域。该方法包括:获取多个音频采样频点对应的波束形成系数矩阵,获取到的多个波束形成系数矩阵是基于从麦克风阵列对应的圆形区域内选取的目标扇形区域确定的,多个波束形成系数矩阵用于控制在目标扇形区域指代的音频采集区域内采集的音频信号为静音状态,分别确定麦克风阵列中每个麦克风采集的音频信号在多个音频采样频点下的频域信号,将每个波束形成系数矩阵作为每个麦克风在对应音频采样频点下的频域信号的系数,对确定的频域信号进行变换处理,得到目标音频信号。本申请在不影响采集需求的音频信号的情况下,可以抑制掉需要静音的目标扇形区域的音频信号。

Audio processing method, device and storage medium

【技术实现步骤摘要】
音频处理方法、装置及存储介质
本申请实施例涉及语音处理
,特别涉及一种音频处理方法、装置及存储介质。
技术介绍
目前,麦克风阵列被广泛应用于音频信号采集中,其中包括的多个麦克风一般呈圆形状均匀分布。在一些情况下,麦克风阵列采集的音频信号中可能包括有噪音,譬如,在视频会议环境中,桌面上键盘的声音、纸的沙沙声等均属于噪音。为此,通常需要对麦克风阵列的某个特定区域所采集的音频信号进行抑制处理,即,使该特定区域的音频信号处于静音状态。在相关技术中,可以为麦克风阵列设置静音按钮,当环境中存在噪音时,用户可以按动该静音按钮,以暂时关闭该麦克风阵列。此时,该麦克风阵列暂停采集操作,如此,可以避免采集到噪音。然而,当关闭麦克风阵列后,不仅暂停了对噪音的采集,同时也无法再对需求的音频信号进行采集。
技术实现思路
本申请实施例提供了一种音频处理方法、装置及存储介质,可以解决关闭麦克风阵列导致无法再对需求的音频信号进行采集的问题。所述技术方案如下:第一方面,提供了一种音频处理方法,所述方法包括:<br>获取多个音频采本文档来自技高网...

【技术保护点】
1.一种音频处理方法,其特征在于,所述方法包括:/n获取多个音频采样频点对应的波束形成系数矩阵,获取到的多个波束形成系数矩阵是基于从麦克风阵列对应的圆形区域内选取的目标扇形区域确定的,所述圆形区域用于指代所述麦克风阵列的音频采集区域,所述多个波束形成系数矩阵用于控制在所述目标扇形区域指代的音频采集区域内采集的音频信号为静音状态;/n分别确定所述麦克风阵列中每个麦克风采集的音频信号在所述多个音频采样频点下的频域信号;/n将每个波束形成系数矩阵作为所述每个麦克风在对应音频采样频点下的频域信号的系数,对所确定的频域信号进行变换处理,得到目标音频信号。/n

【技术特征摘要】
1.一种音频处理方法,其特征在于,所述方法包括:
获取多个音频采样频点对应的波束形成系数矩阵,获取到的多个波束形成系数矩阵是基于从麦克风阵列对应的圆形区域内选取的目标扇形区域确定的,所述圆形区域用于指代所述麦克风阵列的音频采集区域,所述多个波束形成系数矩阵用于控制在所述目标扇形区域指代的音频采集区域内采集的音频信号为静音状态;
分别确定所述麦克风阵列中每个麦克风采集的音频信号在所述多个音频采样频点下的频域信号;
将每个波束形成系数矩阵作为所述每个麦克风在对应音频采样频点下的频域信号的系数,对所确定的频域信号进行变换处理,得到目标音频信号。


2.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述多个音频采样频点对应的预设阵列流形矩阵;
基于所述目标扇形区域,生成目标响应向量,所述目标响应向量包括与所述圆形区域内预先划分的K个单位扇形区域一一对应的K个响应数值,K为正整数,所述目标扇形区域不包括的单位扇形区域对应的响应数值为第一数值,所述目标扇形区域包括的单位扇形区域对应的响应数值为第二数值,所述第一数值用于表示非静音,所述第二数值用于表示静音;
基于所述目标响应向量和获取到的预设阵列流形矩阵,获取所述多个音频采样频点对应的波束形成系数矩阵。


3.如权利要求2所述的方法,其特征在于,所述基于所述目标响应向量和获取到的预设阵列流形矩阵,获取所述多个音频采样频点对应的波束形成系数矩阵,包括:
基于所述目标响应向量和获取到的预设阵列流形矩阵,通过指定公式,获取所述多个音频采样频点对应的波束形成系数矩阵,所述指定公式为:



其中,所述A(i)为第i个预设阵列流形矩阵,所述pd(Θ)为所述目标响应向量,所述wi为第i个波束形成系数矩阵。


4.如权利要求1所述的方法,其特征在于,所述将每个波束形成系数矩阵作为所述每个麦克风在对应音频采样频点下的频域信号的系数,对所确定的频域信号进行变换处理,得到目标音频信号,包括:
对于所述多个音频采样频点中的每个音频采样频点,将所述每个麦克风采集的音频信号在所述音频采样频点下的频域信号进行组合,得到组合矩阵;
确定所述组合矩阵与所述音频采样频点对应的预设波束形成系数矩阵之间的乘积,得到所述麦克风阵列在所述音频采样频点下的频域信号;
对所述麦克风阵列在所述多个音频采样频点下的频域信号进行组合,并将组合后的频域信号进行傅里叶反变换处理,得到所述目标音频信号。


5.如权利要求1所述的方法,其特征在于,所述分别确定所述麦克风阵列中每个麦克风采集的音频信号在所述多个音频采样频点下的频域信号,包括:
分别对所述麦克风阵列中每个麦克风采集的音频信号进行分帧处理,得到所述每个麦克风采集的音频信号的分帧信号;
按照预设窗口大小,对所述每个麦克风采集的音频信号的分帧信号进行加窗处理,得到所述每个麦克风采集的音频信号的加窗信号;
基于所述多个音频采样频点,分别对所述每个麦克风采集的音频信号的加窗信号进行傅里叶变换处理,得到所述每个麦克风采集的音频信号在所述多个音...

【专利技术属性】
技术研发人员:钱能锋陈扬坤陈展
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1