音频信号处理方法、装置、设备及存储介质制造方法及图纸

技术编号:24891344 阅读:15 留言:0更新日期:2020-07-14 18:17
本公开揭示了一种音频信号处理方法、装置、设备及存储介质,属于智能家居技术领域。所述方法包括:获取第一声卡输出的多通道麦克风信号;将多通道麦克风信号拆分成n个单通道麦克风信号;获取第二声卡输出的回采信号;将n个单通道麦克风信号与回采信号进行同步;输出同步后的n个单通道麦克风信号与回采信号。通过上述方法,使得语音交互设备能够获取到完整且同步的音频信号,从而提高了后续音频处理的准确性,进而提高录音效果。

【技术实现步骤摘要】
音频信号处理方法、装置、设备及存储介质
本公开涉及智能家居
,特别涉及一种音频信号处理方法、装置、设备及存储介质。
技术介绍
随着人工智能的而不断发展,人们对智能音箱的使用已经十分普遍。智能音箱被配置为接收用户的语音命令,通过对该语音命令的执行以达到用户语音上网的目的。在相关技术中,智能音箱能够通过声卡驱动来控制声卡设备工作,比如,控制声卡设备播放声音以及录音。其中,在进行录音时,智能音箱通过单个声卡设备获取采样信号,采样信号中包含麦克风信号和回采信号,后续通过回采信号对麦克风信号进行回声消除等处理,得到最终的录音信号。在上述相关技术中,由于从单个声卡设备获得的采样信号中混合了麦克风信号和回采信号,且两种信号不同步,影响后续处理的准确性,从而影响录音效果。
技术实现思路
本公开提供一种音频信号处理方法、装置、设备及存储介质。所述技术方案如下:根据本公开实施例的第一方面,提供了一种音频信号处理方法,所述方法由语音交互设备执行,所述语音交互设备包含第一声卡和第二声卡,所述方法包括:获取所述第一声卡输出的多通道麦克风信号;所述多通道麦克风信号是通过麦克风组件输入所述语音交互设备的,经过所述第一声卡处理后所获得的n通道的声音信号,n为正整数;将所述多通道麦克风信号拆分为n个单通道麦克风信号;获取所述第二声卡输出的回采信号,所述回采信号是所述第二声卡记录的所述语音交互设备播放的单通道的声音信号;将所述n个单通道麦克风信号与所述回采信号进行同步;<br>输出同步后的所述n个单通道麦克风信号与所述回采信号。在一种可能的实现方式中,所述将所述n个单通道麦克风信号与所述回采信号进行同步之前,还包括:确定第一起始位置与第二起始位置之间的先后顺序,所述第一起始位置是指所述n个单通道麦克风信号的起始位置,所述第二起始位置是指所述回采信号的起始位置;确定所述第一起始位置与所述第二起始位置之间的时间间隔;所述将所述n个单通道麦克风信号与所述回采信号进行同步,包括:根据所述第一起始位置与所述第二起始位置之间的先后顺序以及时间间隔对所述n个单通道麦克风信号与所述回采信号进行同步。在一种可能的实现方式中,所述根据所述第一起始位置与所述第二起始位置之间的先后顺序以及时间间隔对所述n个单通道麦克风信号与所述回采信号进行同步,包括:响应于所述第一起始位置提前于所述第二起始位置,根据所述第一起始位置与所述第二起始位置之间的所述时间间隔,在所述第一起始位置之前添加N个样本点,N为正整数,所述N个样本点的持续时长等于所述时间间隔;响应于所述第二起始位置提前于所述第一起始位置,根据所述第一起始位置与所述第二起始位置之间的所述时间间隔,在所述第二起始位置之前添加N个样本点。在一种可能的实现方式中,所述N个样本点的数值为0。在一种可能的实现方式中,所述n个单通道麦克风信号分别有对应的通道标识,所述n个单通道麦克风信号以采样点为单位根据所述通道标识交替存放组成所述多通道麦克风信号;所述将所述多通道麦克风信号拆分为n个单通道麦克风信号,包括:根据所述n个单通道麦克风信号分别对应的所述通道标识,将所述多通道麦克风信号拆分为所述n个单通道麦克风信号。在一种可能的实现方式中,所述获取所述第一声卡采集输出的多通道麦克风信号,包括:获取所述第一声卡以预设采样频率采样、量化、编码后输出的所述多通道麦克风信号;所述获取所述第二声卡输出的回采信号,包括:获取所述第二声卡以所述预设采样频率采样、量化、编码后输出的所述回采信号。根据本公开实施例的第二方面,提供了一种音频信号处理装置,所述装置用于语音交互设备中,所述语音交互设备包含第一声卡和第二声卡,所述装置包括:第一获取模块,用于获取所述第一声卡输出的多通道麦克风信号;所述多通道麦克风信号是通过麦克风组件输入所述语音交互设备的,经过所述第一声卡处理后所获得的n通道的声音信号,n为正整数;拆分模块,用于将所述多通道麦克风信号拆分为n个单通道麦克风信号;第二获取模块,用于获取所述第二声卡输出的回采信号,所述回采信号是所述第二声卡记录的所述语音交互设备播放的单通道的声音信号;同步模块,用于将所述n个单通道麦克风信号与所述回采信号进行同步;输出模块,用于输出同步后的所述n个单通道麦克风信号与所述回采信号。在一种可能的实现方式中,所述装置还包括:第一确定模块,用于确定第一起始位置与第二起始位置之间的先后顺序,所述第一起始位置是指所述n个单通道麦克风信号的起始位置,所述第二起始位置是指所述回采信号的起始位置;第二确定模块,用于确定所述第一起始位置与所述第二起始位置之间的时间间隔;所述同步模块,用于根据所述第一起始位置与所述第二起始位置之间的先后顺序以及时间间隔对所述n个单通道麦克风信号与所述回采信号进行同步。在一种可能的实现方式中,所述同步模块,包括:第一添加子模块,用于响应于所述第一起始位置提前于所述第二起始位置,根据所述第一起始位置与所述第二起始位置之间的所述时间间隔,在所述第一起始位置之前添加N个样本点,N为正整数,所述N个样本点的持续时长等于所述时间间隔;第二添加子模块,用于响应于所述第二起始位置提前于所述第一起始位置,根据所述第一起始位置与所述第二起始位置之间的所述时间间隔,在所述第二起始位置之前添加N个样本点。在一种可能的实现方式中,所述N个样本点的数值为0。在一种可能的实现方式中,所述n个单通道麦克风信号分别有对应的通道标识,所述n个单通道麦克风信号以采样点为单位根据所述通道标识交替存放组成所述多通道麦克风信号;所述拆分模块,用于根据所述n个单通道麦克风信号分别对应的所述通道标识,将所述多通道麦克风信号拆分为所述n个单通道麦克风信号。在一种可能的实现方式中,所述第一获取模块,用于获取所述第一声卡以预设采样频率采样、量化、编码后输出的所述多通道麦克风信号;所述第二获取模块,用于获取所述第二声卡以所述预设采样频率采样、量化、编码后输出的所述回采信号。根据本公开实施例的第三方面,提供了一种音频信号处理装置,所述装置用于语音交互设备中,所述语音交互设备包含第一声卡和第二声卡,所述装置包括:处理器;用于存储所述处理器的可执行指令的存储器;其中,所述处理器被配置为:获取所述第一声卡输出的多通道麦克风信号;所述多通道麦克风信号是通过麦克风组件输入所述语音交互设备的,经过所述第一声卡处理后所获得的n通道的声音信号,n为正整数;将所述多通道麦克风信号拆分为n个单通道麦克风信号;获取所述第二声卡输出的回采信号,所述回采信号是所述第二声卡记录的所述语音交互设备播放的单通道的声音信号;将所述n个单通道麦克风信号与所述回采信号进行同步;输出同步后的所述n个单通道麦克风信号与所述回采信号。...

【技术保护点】
1.一种音频信号处理方法,其特征在于,所述方法由语音交互设备执行,所述语音交互设备包含第一声卡和第二声卡,所述方法包括:/n获取所述第一声卡输出的多通道麦克风信号;所述多通道麦克风信号是通过麦克风组件输入所述语音交互设备的,经过所述第一声卡处理后所获得的n通道的声音信号,n为正整数;/n将所述多通道麦克风信号拆分为n个单通道麦克风信号;/n获取所述第二声卡输出的回采信号,所述回采信号是所述第二声卡记录的所述语音交互设备播放的单通道的声音信号;/n将所述n个单通道麦克风信号与所述回采信号进行同步;/n输出同步后的所述n个单通道麦克风信号与所述回采信号。/n

【技术特征摘要】
1.一种音频信号处理方法,其特征在于,所述方法由语音交互设备执行,所述语音交互设备包含第一声卡和第二声卡,所述方法包括:
获取所述第一声卡输出的多通道麦克风信号;所述多通道麦克风信号是通过麦克风组件输入所述语音交互设备的,经过所述第一声卡处理后所获得的n通道的声音信号,n为正整数;
将所述多通道麦克风信号拆分为n个单通道麦克风信号;
获取所述第二声卡输出的回采信号,所述回采信号是所述第二声卡记录的所述语音交互设备播放的单通道的声音信号;
将所述n个单通道麦克风信号与所述回采信号进行同步;
输出同步后的所述n个单通道麦克风信号与所述回采信号。


2.根据权利要求1所述的方法,其特征在于,所述将所述n个单通道麦克风信号与所述回采信号进行同步之前,还包括:
确定第一起始位置与第二起始位置之间的先后顺序,所述第一起始位置是指所述n个单通道麦克风信号的起始位置,所述第二起始位置是指所述回采信号的起始位置;
确定所述第一起始位置与所述第二起始位置之间的时间间隔;
所述将所述n个单通道麦克风信号与所述回采信号进行同步,包括:
根据所述第一起始位置与所述第二起始位置之间的先后顺序以及时间间隔对所述n个单通道麦克风信号与所述回采信号进行同步。


3.根据权利要求2所述的方法,其特征在于,所述根据所述第一起始位置与所述第二起始位置之间的先后顺序以及时间间隔对所述n个单通道麦克风信号与所述回采信号进行同步,包括:
响应于所述第一起始位置提前于所述第二起始位置,根据所述第一起始位置与所述第二起始位置之间的所述时间间隔,在所述第一起始位置之前添加N个样本点,N为正整数,所述N个样本点的持续时长等于所述时间间隔;
响应于所述第二起始位置提前于所述第一起始位置,根据所述第一起始位置与所述第二起始位置之间的所述时间间隔,在所述第二起始位置之前添加N个样本点。


4.根据权利要求3所述的方法,其特征在于,所述N个样本点的数值为0。


5.根据权利要求1所述的方法,其特征在于,所述n个单通道麦克风信号分别有对应的通道标识,所述n个单通道麦克风信号以采样点为单位根据所述通道标识交替存放组成所述多通道麦克风信号;所述将所述多通道麦克风信号拆分为n个单通道麦克风信号,包括:
根据所述n个单通道麦克风信号分别对应的所述通道标识,将所述多通道麦克风信号拆分为所述n个单通道麦克风信号。


6.根据权利要求1所述的方法,其特征在于,所述获取所述第一声卡采集输出的多通道麦克风信号,包括:
获取所述第一声卡以预设采样频率采样、量化、编码后输出的所述多通道麦克风信号;
所述获取所述第二声卡输出的回采信号,包括:
获取所述第二声卡以所述预设采样频率采样、量化、编码后输出的所述回采信号。


7.一种音频信号处理装置,其特征在于,所述装置用于语音交互设备中,所述语音交互设备包含第一声卡和第二声卡,所述装置包括:
第一获取模块,用于获取所述第一声卡输出的多通道麦克风信号;所述多通道麦克风信号是通过麦克风组件输入所述语音交互设备的,经过所述第一声卡处理后所获得的n通道的声音信号,n为正整数;
拆分模块,用于将所述多通道麦克风信号拆分为n个单通道麦克风信号;
第二获取模块,用于获取所述第二声卡输出的回采信号,所述回采信号是所述第二声卡记录的所述语音交互设备播放的单通道的声音信号;
...

【专利技术属性】
技术研发人员:张东魁陈孝良冯大航常乐
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1