一种多说话人语音分离方法及相关装置制造方法及图纸

技术编号:44565723 阅读:22 留言:0更新日期:2025-03-11 14:23
本申请公开了一种多说话人语音分离方法及相关装置,涉及语音处理技术领域,方法包括:获取由两麦阵列针对位于不同方位的第一说话人和第二说话人采集的多说话人语音信号;根据多说话人语音信号确定两个麦克风的相位差,并对多说话人语音信号进行针对第一区域的固定波束形成处理和针对第二区域的固定波束形成处理,第一区域为第一说话人所在的区域,第二区域为第二说话人所在的区域;根据相位差以及两个区域分别对应的波束形成信号确定两个不同方位说话人的语音时频掩膜;根据确定的语音时频掩膜从多说话人语音信号的任一通道的信号中分离出第一说话人的语音信号和第二说话人的语音信号。本申请公开的多说话人语音分离方法具有较好的分离效果。

【技术实现步骤摘要】

本申请涉及语音处理,尤其涉及一种多说话人语音分离方法及相关装置


技术介绍

1、在很多场景下,会产生多说话人语音,为了便于后续的数据处理和分析,通常需要进行多说话人语音分离,即从多说话人语音中分离出不同说话人的语音。

2、以企业管理场景为例,企业员工通常需要佩戴工牌,随着科技的迅猛发展,智能电子工牌作为一种新型的管理工具,走进了越来越多企业的管理领域,被越来越多的销售型及服务型公司普及,智能电子工牌最通常要求具有多说话人语音分离功能,即,从录制的多说话人语音中将佩戴工牌者的语音与客户的语音分离出来的功能。

3、目前的多说话人语音分离方法多为基于声纹信息的多说话人语音分离方法,即利用声纹信息从多说话人语音中分离出不同说话人的语音。然而,声纹信息对于同性说话人的区分能力较弱,这导致基于声纹信息的多说话人语音分离方法具有一定的应用局限性,无法满足应用需求。


技术实现思路

1、有鉴于此,本申请提供了一种多说话人语音分离方法及相关装置,用以解决目前的基于声纹信息的多说话人语音分离方法具有一定的应本文档来自技高网...

【技术保护点】

1.一种多说话人语音分离方法,其特征在于,包括:

2.根据权利要求1所述的多说话人语音分离方法,其特征在于,所述根据所述相位差以及所述第一区域和所述第二区域分别对应的波束形成信号,确定所述第一说话人的第一语音时频掩膜和所述第二说话人的第一语音时频掩膜,包括:

3.根据权利要求1所述的多说话人语音分离方法,其特征在于,还包括:

4.根据权利要求3所述的多说话人语音分离方法,其特征在于,所述根据所述第一说话人的第一语音时频掩膜和所述第二说话人的第一语音时频掩膜,同时结合所述第一说话人的第二语音时频掩膜和所述第二说话人的第二语音时频掩膜,从所述多说话人语音信...

【技术特征摘要】

1.一种多说话人语音分离方法,其特征在于,包括:

2.根据权利要求1所述的多说话人语音分离方法,其特征在于,所述根据所述相位差以及所述第一区域和所述第二区域分别对应的波束形成信号,确定所述第一说话人的第一语音时频掩膜和所述第二说话人的第一语音时频掩膜,包括:

3.根据权利要求1所述的多说话人语音分离方法,其特征在于,还包括:

4.根据权利要求3所述的多说话人语音分离方法,其特征在于,所述根据所述第一说话人的第一语音时频掩膜和所述第二说话人的第一语音时频掩膜,同时结合所述第一说话人的第二语音时频掩膜和所述第二说话人的第二语音时频掩膜,从所述多说话人语音信号的任一通道的信号中分离出所述第一说话人的语音信号和所述第二说话人的语音信号,包括:

5.根据权利要求4所述的多说话人语音分离方法,其特征在于,所述第一说话人的第一语音时频掩膜、所述第二说话人的第一语音时频掩膜、所述第一说话人的第二语音时频掩膜以及所述第二说话人的第二语音时频掩膜均为帧级别的语音时频掩膜;

6.根据权利要求4所述的多说话人语音分离方法,其特征在于,所述第一说话人的目标语音时频掩膜和所述第二说话人的目标语音时频掩膜均为帧级别的语音时频掩膜;

7.根据权利要求6所述的多说话人语音分离方法,其特...

【专利技术属性】
技术研发人员:陈左龙马峰高建清李明子
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1