语音信号处理方法、装置、存储介质、电子设备及车辆制造方法及图纸

技术编号:34257318 阅读:7 留言:0更新日期:2022-07-24 13:00
本公开涉及一种语音信号处理方法、装置、存储介质、电子设备及车辆。该方法包括:获取语音采集阵列采集到的语音观测信号;对所述语音观测信号进行语音预分离处理,得到与所述语音采集阵列中各语音采集装置对应的语音预分离能量;根据所述语音预分离能量对所述语音观测信号进行语音盲源分离,得到各所述语音采集装置对应的独立源语音信号。采用本公开这种方式,因引入了语音预分离能量、并基于语音预分离能量对语音观测信号进行语音盲源分离指导,而可以准确地确定分离出的各独立源语音信号与各语音采集装置的对应关系,进而基于语音采集装置的安装位置可准确地确定各独立源语音信号所在的声源位置区域。信号所在的声源位置区域。信号所在的声源位置区域。

Voice signal processing method, device, storage medium, electronic equipment and vehicle

【技术实现步骤摘要】
语音信号处理方法、装置、存储介质、电子设备及车辆


[0001]本公开涉及信号处理
,尤其涉及一种语音信号处理方法、装置、存储介质、电子设备及车辆。

技术介绍

[0002]随着车联网架构的不断成熟,新能源汽车已经进入智能化时代。语音交互作为人类最普遍、最简单的交互方式之一,其也已经成为了智能座舱中主要使用的用于控制车载功能的控制方式。由于车内空间有限,行驶过程中用户不便手动操作车载功能,因此利用语音指令进行控制,如语音控制导航、语音控制开关车灯、语音控制播放/暂停音乐等可以提升行驶效率和驾车体验。
[0003]随着麦克风阵列技术的成熟和普及,智能座舱内通常采用一组或多组麦克风阵列进行拾音。然而,由于座舱内声学环境复杂,存在风噪、发动机噪声和多说话人的干扰,麦克风阵列采集到的语音往往具有较低的信噪比和可懂度,并不能被正确识别。由此,相关技术中通常采用前端语音信号处理技术(如回声消除、盲源分离和降噪等)抑制干扰信号、增强目标语音,然后再将目标语音输入语音识别系统,进行文本转换和语义理解,最后在终端中执行与语音相应的指令。但是,相关技术中的前端语音信号处理技术仍然较难精确地确定声源位置。

技术实现思路

[0004]为克服相关技术中存在的问题,本公开提供一种语音信号处理方法、装置、存储介质、电子设备及车辆。
[0005]根据本公开实施例的第一方面,提供一种语音信号处理方法,所述方法包括:
[0006]获取语音采集阵列采集到的语音观测信号;
[0007]对所述语音观测信号进行语音预分离处理,得到与所述语音采集阵列中各语音采集装置对应的语音预分离能量;
[0008]根据所述语音预分离能量对所述语音观测信号进行语音盲源分离,得到各所述语音采集装置对应的独立源语音信号。
[0009]可选地,所述语音采集阵列包括第一语音采集装置和第二语音采集装置,相应地,所述语音观测信号包括第一语音观测信号和第二语音观测信号;
[0010]所述对所述语音观测信号进行语音预分离处理,得到与所述语音采集阵列中各语音采集装置对应的语音预分离能量,包括:
[0011]对所述第一语音观测信号和所述第二语音观测信号进行语音预分离处理,得到与所述第一语音观测信号对应的第一语音预分离能量以及与所述第二语音观测信号对应的第二语音预分离能量。
[0012]可选地,所述根据所述语音预分离能量对所述语音观测信号进行语音盲源分离,得到各所述语音采集装置对应的独立源语音信号,包括:
[0013]在语音盲源分离处理过程中,将所述第一语音预分离能量作为所述第一语音观测信号对应的声源模型方差项的导频信号,并将所述第二语音预分离能量作为所述第二语音观测信号对应的声源模型方差项的导频信号,以得到与所述第一语音采集装置对应的第一独立源语音信号和与所述第二语音采集装置对应的第二独立源语音信号。
[0014]可选地,所述根据所述语音预分离能量对所述语音观测信号进行语音盲源分离,得到各所述语音采集装置对应的独立源语音信号,还包括:
[0015]根据第N代分离矩阵对所述语音观测信号进行语音盲源分离,得到第N代分离信号频率向量,其中N为大于零的整数,在N为1的情况下,第1代分离矩阵为随机矩阵;
[0016]若通过目标函数确定所述第N代分离信号频率向量未符合统计独立的标准,则根据所述第N代分离矩阵更新辅助变量,并根据更新后的辅助变量确定第N+1代分离矩阵,其中,所述辅助变量包括引入导频信号的声源模型方差项;
[0017]若通过所述目标函数确定所述第N代分离信号频率向量符合统计独立的标准,则根据所述第N代分离信号频率向量确定所述独立源语音信号。
[0018]可选地,所述对所述第一语音观测信号和所述第二语音观测信号进行语音预分离处理,得到与所述第一语音观测信号对应的第一语音预分离能量以及与所述第二语音观测信号对应的第二语音预分离能量,包括:
[0019]针对所述第一语音观测信号和所述第二语音观测信号,通过波束赋形算法在相对于所述第一语音采集装置的第一预设角度以及相对于所述第二语音采集装置的第二预设角度上进行语音信号相长干涉,得到所述第一语音预分离能量和所述第二语音预分离能量。
[0020]可选地,所述第一预设角度的大小为45度,所述第二预设角度的大小为135度。
[0021]可选地,所述语音采集阵列还包括第三语音采集装置和第四语音采集装置,相应地,所述语音观测信号还包括第三语音观测信号和第四语音观测信号;
[0022]所述对所述语音观测信号进行语音预分离处理,得到与所述语音采集阵列中各语音采集装置对应的语音预分离能量,还包括:
[0023]对所述第三语音观测信号和所述第四语音观测信号进行语音预分离处理,得到与所述第三语音观测信号对应的第三语音预分离能量以及与所述第四语音观测信号对应的第四语音预分离能量。
[0024]可选地,所述根据所述语音预分离能量对所述语音观测信号进行语音盲源分离,得到各所述语音采集装置对应的独立源语音信号,包括:
[0025]在语音盲源分离处理过程中,将所述第一语音预分离能量作为所述第一语音观测信号对应的声源模型方差项的导频信号、将所述第二语音预分离能量作为所述第二语音观测信号对应的声源模型方差项的导频信号、将所述第三语音预分离能量作为所述第三语音观测信号对应的声源模型方差项的导频信号、以及将所述第四语音预分离能量作为所述第四语音观测信号对应的声源模型方差项的导频信号,以得到与所述第一语音采集装置对应的第一独立源语音信号、与所述第二语音采集装置对应的第二独立源语音信号、与所述第三语音采集装置对应的第三独立源语音信号、以及与所述第四语音采集装置对应的第四独立源语音信号。
[0026]可选地,每一所述语音采集装置对应一个独立的声源控制区域,在得到各所述语
音采集装置对应的独立源语音信号之后,所述方法还包括:
[0027]针对每一所述声源控制区域,根据所述声源控制区域对应的所述独立源语音信号对所述声源控制区域内的语音控制功能进行控制。
[0028]根据本公开实施例的第二方面,提供一种语音信号处理装置,所述装置包括:
[0029]获取模块,被配置为获取语音采集阵列采集到的语音观测信号;
[0030]预分离模块,被配置为对所述语音观测信号进行语音预分离处理,得到与所述语音采集阵列中各语音采集装置对应的语音预分离能量;
[0031]分离模块,被配置为根据所述语音预分离能量对所述语音观测信号进行语音盲源分离,得到各所述语音采集装置对应的独立源语音信号。
[0032]可选地,所述语音采集阵列包括第一语音采集装置和第二语音采集装置,相应地,所述语音观测信号包括第一语音观测信号和第二语音观测信号;
[0033]所述预分离模块包括:
[0034]第一预分离模块子模块,被配置为对所述第一语音观测信号和所述第二语音观测信号进行语音预分离处理,得到与所述第一语音观测信号对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音信号处理方法,其特征在于,所述方法包括:获取语音采集阵列采集到的语音观测信号;对所述语音观测信号进行语音预分离处理,得到与所述语音采集阵列中各语音采集装置对应的语音预分离能量;根据所述语音预分离能量对所述语音观测信号进行语音盲源分离,得到各所述语音采集装置对应的独立源语音信号。2.根据权利要求1所述的方法,其特征在于,所述语音采集阵列包括第一语音采集装置和第二语音采集装置,相应地,所述语音观测信号包括第一语音观测信号和第二语音观测信号;所述对所述语音观测信号进行语音预分离处理,得到与所述语音采集阵列中各语音采集装置对应的语音预分离能量,包括:对所述第一语音观测信号和所述第二语音观测信号进行语音预分离处理,得到与所述第一语音观测信号对应的第一语音预分离能量以及与所述第二语音观测信号对应的第二语音预分离能量。3.根据权利要求2所述的方法,其特征在于,所述根据所述语音预分离能量对所述语音观测信号进行语音盲源分离,得到各所述语音采集装置对应的独立源语音信号,包括:在语音盲源分离处理过程中,将所述第一语音预分离能量作为所述第一语音观测信号对应的声源模型方差项的导频信号,并将所述第二语音预分离能量作为所述第二语音观测信号对应的声源模型方差项的导频信号,以得到与所述第一语音采集装置对应的第一独立源语音信号和与所述第二语音采集装置对应的第二独立源语音信号。4.根据权利要求3所述的方法,其特征在于,所述根据所述语音预分离能量对所述语音观测信号进行语音盲源分离,得到各所述语音采集装置对应的独立源语音信号,还包括:根据第N代分离矩阵对所述语音观测信号进行语音盲源分离,得到第N代分离信号频率向量,其中N为大于零的整数,在N为1的情况下,第1代分离矩阵为随机矩阵;若通过目标函数确定所述第N代分离信号频率向量未符合统计独立的标准,则根据所述第N代分离矩阵更新辅助变量,并根据更新后的辅助变量确定第N+1代分离矩阵,其中,所述辅助变量包括引入导频信号的声源模型方差项;若通过所述目标函数确定所述第N代分离信号频率向量符合统计独立的标准,则根据所述第N代分离信号频率向量确定所述独立源语音信号。5.根据权利要求2

4中任一项所述的方法,其特征在于,所述对所述第一语音观测信号和所述第二语音观测信号进行语音预分离处理,得到与所述第一语音观测信号对应的第一语音预分离能量以及与所述第二语音观测信号对应的第二语音预分离能量,包括:针对所述第一语音观测信号和所述第二语音观测信号,通过波束赋形算法在相对于所述第一语音采集装置的第一预设角度以及相对于所述第二语音采集装置的第二预设角度上进行语音信号相长干涉,得到所述第一语音预分离能量和所述第二语音预分离能量。6.根据权利要求5所述的方法,其...

【专利技术属性】
技术研发人员:汤欣钰吴俊楠
申请(专利权)人:小米汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1