语音分离方法、装置、系统、设备、存储介质和程序产品制造方法及图纸

技术编号:44620390 阅读:18 留言:0更新日期:2025-03-17 18:19
本发明专利技术提供一种语音分离方法、装置、系统、设备、存储介质和程序产品,其中方法包括:获取目标车辆上的语音信号,语音信号通过目标车辆上装载的麦克风阵列采集得到;提取语音信号的语音特征和方向性特征,语音特征以及方向性特征均与麦克风阵列的阵型无关;基于语音特征和方向性特征进行语音分离,得到语音信号对应的语音分离结果,能够在不依赖于麦克风阵列的阵型信息的情况下,实现车辆上声音的完全隔离,为各音区的独立交互提供保障,避免了传统方案中车辆上语音分离依赖于通过阵型信息训练得到的分离模型,导致陷入“一车一定制”困境的问题,基于阵型无关的特征进行语音分离,极大地提高了系统大规模交付效率,降低了成本,减少了资源浪费。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种语音分离方法、装置、系统、设备、存储介质和程序产品


技术介绍

1、随着汽车智能化的发展,车载智能语音交互系统逐渐成为现代汽车的重要组成部分,为驾驶员和乘客提供了更为便捷、智能的交互体验。该系统通过识别乘客的唤醒词和命令,实现对车内各种功能的控制。然而,实际应用中,由于车辆尺寸和车内布局的差异,不同型号的汽车的麦克风阵列的阵型呈现出多样性,这为车载语音交互系统的大规模交付带来了挑战。

2、传统的车载交互系统多基于麦克风阵列的阵型信息进行语音分离,据此实现声音隔离,避免各音区相互干扰。然而,此种方式需为每个车型定制分离模型,而“一车一定制”的方式不仅效率低下,且成本高昂,每当有新车型推出,或者即使同一车型在麦克风阵列布局上有微小的变化,都需要重新定制分离模型,耗费大量时间和资源,降低了大规模交付的效率。


技术实现思路

1、本专利技术提供一种语音分离方法、装置、系统、设备、存储介质和程序产品,用以解决现有技术中车载交互系统在实现声音隔离,以使得各音区独立,互不干扰时本文档来自技高网...

【技术保护点】

1.一种语音分离方法,其特征在于,包括:

2.根据权利要求1所述的语音分离方法,其特征在于,所述基于所述语音特征和所述方向性特征进行语音分离,得到所述语音信号对应的语音分离结果,包括:

3.根据权利要求2所述的语音分离方法,其特征在于,所述语音分离模型基于如下步骤训练:

4.根据权利要求3所述的语音分离方法,其特征在于,所述基于所述各路纯净麦克信号的时频掩码,以及所述各路麦克信号的频域相位,确定样本方向性特征,包括:

5.根据权利要求4所述的语音分离方法,其特征在于,所述基于所述各路纯净麦克信号的空间协方差矩阵,以及所述各路麦克信号的频域相...

【技术特征摘要】

1.一种语音分离方法,其特征在于,包括:

2.根据权利要求1所述的语音分离方法,其特征在于,所述基于所述语音特征和所述方向性特征进行语音分离,得到所述语音信号对应的语音分离结果,包括:

3.根据权利要求2所述的语音分离方法,其特征在于,所述语音分离模型基于如下步骤训练:

4.根据权利要求3所述的语音分离方法,其特征在于,所述基于所述各路纯净麦克信号的时频掩码,以及所述各路麦克信号的频域相位,确定样本方向性特征,包括:

5.根据权利要求4所述的语音分离方法,其特征在于,所述基于所述各路纯净麦克信号的空间协方差矩阵,以及所述各路麦克信号的频域相位,确定样本方向性特征,包括:

6.根据权利要求5所述的语音分离方法,其特征在于,所述基于所述各路纯净麦克信号的导向矢量,以及所述各路麦克信号的频域相位,确定样本方向性特征,包括:

7.根据权利要求4所述的语音分离方法,其特征在于,所述基于所述各路纯净麦克信号的时频掩码,确定所述各路纯净麦克信号的空间协方差矩阵,包括...

【专利技术属性】
技术研发人员:马峰李明子管青松高建清华磊王士进
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1