音频信号的处理方法和装置制造方法及图纸

技术编号:27659091 阅读:15 留言:0更新日期:2021-03-12 14:25
本发明专利技术提供一种音频信号的处理方法和装置,获取预先录制的源音频信号和预设的目标声源位置;根据目标声源位置对源音频信号进行转换,得到麦克风对应的音频信号;其中,麦克风是麦克风阵列中的每一个麦克风;组合每一个麦克风对应的音频信号,得到麦克风阵列的目标音频信号。其中,根据目标声源位置处理得到的目标音频信号相当于麦克风阵列录制得到的,从目标声源位置发出的音频信号。因此本方案能够利用预先录制好的音频信号模拟出麦克风阵列从任意一个声源位置录制得到的音频信号,而不必频繁改变声源位置并针对每个声源位置重复录制音频信号,减少了获取训练智能音箱所需的音频样本的时间,从而减少训练智能音箱的唤醒模型所需的时间。

【技术实现步骤摘要】
音频信号的处理方法和装置
本专利技术涉及信号处理
,特别涉及一种音频信号的处理方法和装置。
技术介绍
随着人工智能技术的快速发展,智能音箱在大众中的普及程度越来越高。目前的智能音箱一般使用麦克风阵列来获取音频信号。其中,实际使用麦克风阵列时,以麦克风阵列所在的位置为基准,从不同的声源位置发出的声音,麦克风阵列录制得到的音频信号也不同。也就是说,麦克风阵列录制得到的音频信号会随着声源位置的变化而变化。因此,现有技术中,在优化一种新型的智能音箱的唤醒模型时,一般需要利用这种智能音箱的麦克风阵列分别录制从多个不同的声源位置发出的声音,从而获得不同声源位置下的多个音频信号,再用这些音频信号训练唤醒模型。以确保在智能音箱实际使用时,唤醒模型能够准确的识别出麦克风阵列从不同声源位置录制得到的音频信号,从而获得更好的唤醒效果。然而,频繁的改变声源位置,并在每个声源位置重复录制音频信号的过程需要耗费较长的时间,导致现有的这种训练智能音箱的唤醒模型的方法效率较低。
技术实现思路
基于上述现有技术的缺点,本专利技术提供一种音频信号的处理方法和装置,以提高训练智能音箱的唤醒模型的效率。本专利技术第一方面提供一种音频信号的处理方法,包括:获取预先录制的源音频信号和预设的目标声源位置;根据所述目标声源位置对所述源音频信号进行转换,得到麦克风对应的音频信号;其中,所述麦克风是麦克风阵列中的每一个麦克风;组合每一个所述麦克风对应的音频信号,得到所述麦克风阵列的目标音频信号。可选的,所述组合每一个所述麦克风对应的音频信号,得到所述麦克风阵列的目标音频信号之后,还包括:利用所述目标音频信号,训练安装有所述麦克风阵列的智能音箱的唤醒模型。可选的,所述根据所述目标声源位置对所述源音频信号进行转换,得到麦克风对应的音频信号,包括:获取所述麦克风的冲激响应;其中,所述冲激响应根据所述目标声源位置预先生成;根据所述目标声源位置对应的冲激响应计算所述源音频信号,得到麦克风对应的音频信号。可选的,所述根据所述目标声源位置对所述源音频信号进行转换,得到麦克风对应的音频信号之前,还包括:获取预设的目标场景的吸声量和所述目标场景的噪声数据;其中,所述根据所述目标声源位置对所述源音频信号进行转换,得到麦克风对应的音频信号,包括:根据所述目标声源位置,所述目标场景的吸声量,以及所述目标场景的噪声数据对所述源音频信号进行转换,得到麦克风对应的音频信号。可选的,所述组合每一个所述麦克风对应的音频信号,得到所述麦克风阵列的目标音频信号之后,还包括:复制所述目标音频信号,得到所述目标音频信号的多个副本;根据预先采集的用户音调数据,调整每一个所述目标音频信号的副本的音调,得到多个调整后的音频信号;其中,每一个所述调整后的音频信号的音调均是唯一的。可选的,所述组合每一个所述麦克风对应的音频信号,得到所述麦克风阵列的目标音频信号之后,还包括:复制所述目标音频信号,得到所述目标音频信号的多个副本;根据预先采集的用户语速数据,调整每一个所述目标音频信号的副本的语速,得到多个调整后的音频信号;其中,每一个所述调整后的音频信号的语速均是唯一的。本专利技术第二方面提供一种音频信号的处理装置,包括:获取单元,用于获取预先录制的源音频信号和预设的目标声源位置;转换单元,用于根据所述目标声源位置对所述源音频信号进行转换,得到麦克风对应的音频信号;其中,所述麦克风是麦克风阵列中的每一个麦克风;组合单元,用于组合每一个所述麦克风对应的音频信号,得到所述麦克风阵列的目标音频信号。可选的,所述转换单元包括:子获取单元,用于获取所述麦克风的冲激响应;其中,所述麦克风的冲激响应根据所述目标声源位置预先生成;计算单元,用于根据所述目标声源位置对应的冲激响应计算所述源音频信号,得到麦克风对应的音频信号。可选的,所述获取单元还用于:获取预设的目标场景的吸声量和所述目标场景的噪声数据;所述转换单元用于:根据所述目标声源位置,所述目标场景的吸声量,以及所述目标场景的噪声数据对所述源音频信号进行转换,得到麦克风对应的音频信号。可选的,所述处理装置还包括:模拟单元,用于复制所述目标音频信号,得到所述目标音频信号的多个副本;根据预先采集的用户音调数据,调整每一个所述目标音频信号的副本的音调,得到多个调整后的音频信号;其中,每一个所述调整后的音频信号的音调均是唯一的。本专利技术提供一种音频信号的处理方法和装置,获取预先录制的源音频信号和预设的目标声源位置;根据目标声源位置对源音频信号进行转换,得到麦克风对应的音频信号;其中,麦克风是麦克风阵列中的每一个麦克风;组合每一个麦克风对应的音频信号,得到麦克风阵列的目标音频信号。其中,根据目标声源位置处理得到的目标音频信号相当于麦克风阵列录制得到的,从目标声源位置发出的音频信号。因此本方案能够利用预先录制好的音频信号模拟出麦克风阵列从任意一个声源位置录制得到的音频信号,而不必频繁改变声源位置并针对每个声源位置重复录制音频信号,减少了获取训练智能音箱所需的音频样本的时间,从而减少训练智能音箱的唤醒模型所需的时间。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例提供的一种音频信号的处理方法的流程图;图2为本专利技术另一实施例提供的一种音频信号的处理方法的流程图;图3为本专利技术又一实施例提供的一种音频信号的处理方法的流程图;图4为本专利技术再一实施例提供的一种音频信号的处理方法的流程图;图5为本专利技术实施例提供的一种音频信号的处理装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。智能音箱是一种目前被广泛使用的电子设备,用户使用智能音箱时,可以通过说出特定的唤醒词,来唤醒休眠状态的智能音箱,使智能音箱进入激活状态,这就是智能音箱的唤醒过程。在智能音箱的唤醒过程中,智能音箱接收到音频信号后,会利用自身的唤醒模型对音频信号进行语音识别,若唤醒模型从音频信号中识别出唤醒词,则智能音箱进入激活状态。因此,唤醒模型的识别能力直接关系到,智能音箱的唤醒效果(可以认为是,智能音箱是否能有效地、及时地响应用户的唤醒指令)。目前,为了获得一个识别能力较强的唤醒模型,一本文档来自技高网...

【技术保护点】
1.一种音频信号的处理方法,其特征在于,包括:/n获取预先录制的源音频信号和预设的目标声源位置;/n根据所述目标声源位置对所述源音频信号进行转换,得到麦克风对应的音频信号;其中,所述麦克风是麦克风阵列中的每一个麦克风;/n组合每一个所述麦克风对应的音频信号,得到所述麦克风阵列的目标音频信号。/n

【技术特征摘要】
1.一种音频信号的处理方法,其特征在于,包括:
获取预先录制的源音频信号和预设的目标声源位置;
根据所述目标声源位置对所述源音频信号进行转换,得到麦克风对应的音频信号;其中,所述麦克风是麦克风阵列中的每一个麦克风;
组合每一个所述麦克风对应的音频信号,得到所述麦克风阵列的目标音频信号。


2.根据权利要求1所述的处理方法,其特征在于,所述组合每一个所述麦克风对应的音频信号,得到所述麦克风阵列的目标音频信号之后,还包括:
利用所述目标音频信号,训练安装有所述麦克风阵列的智能音箱的唤醒模型。


3.根据权利要求1所述的处理方法,其特征在于,所述根据所述目标声源位置对所述源音频信号进行转换,得到麦克风对应的音频信号,包括:
获取所述麦克风的冲激响应;其中,所述冲激响应根据所述目标声源位置预先生成;
根据所述目标声源位置对应的冲激响应计算所述源音频信号,得到麦克风对应的音频信号。


4.根据权利要求1所述的处理方法,其特征在于,所述根据所述目标声源位置对所述源音频信号进行转换,得到麦克风对应的音频信号之前,还包括:
获取预设的目标场景的吸声量和所述目标场景的噪声数据;
其中,所述根据所述目标声源位置对所述源音频信号进行转换,得到麦克风对应的音频信号,包括:
根据所述目标声源位置,所述目标场景的吸声量,以及所述目标场景的噪声数据对所述源音频信号进行转换,得到麦克风对应的音频信号。


5.根据权利要求1至4中任意一项所述的处理方法,其特征在于,所述组合每一个所述麦克风对应的音频信号,得到所述麦克风阵列的目标音频信号之后,还包括:
复制所述目标音频信号,得到所述目标音频信号的多个副本;
根据预先采集的用户音调数据,调整每一个所述目标音频信号的副本的音调,得到多个调整后的音频信号;
其中,每一个所述调整后的音频信号的音调均是唯一的。

【专利技术属性】
技术研发人员:陈孝良杨晓帆冯大航常乐
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1