【技术实现步骤摘要】
本申请涉及语音处理,尤其涉及一种多说话人语音分离方法及相关装置。
技术介绍
1、在很多场景下,会产生多说话人语音,为了便于后续的数据处理和分析,通常需要进行多说话人语音分离,即从多说话人语音中分离出不同说话人的语音。
2、以企业管理场景为例,企业员工通常需要佩戴工牌,随着科技的迅猛发展,智能电子工牌作为一种新型的管理工具,走进了越来越多企业的管理领域,被越来越多的销售型及服务型公司普及,智能电子工牌最通常要求具有多说话人语音分离功能,即,从录制的多说话人语音中将佩戴工牌者的语音与客户的语音分离出来的功能。
3、目前的多说话人语音分离方法多为基于声纹信息的多说话人语音分离方法,即利用声纹信息从多说话人语音中分离出不同说话人的语音。然而,声纹信息对于同性说话人的区分能力较弱,这导致基于声纹信息的多说话人语音分离方法具有一定的应用局限性,无法满足应用需求。
技术实现思路
1、有鉴于此,本申请提供了一种多说话人语音分离方法及相关装置,用以解决目前的基于声纹信息的多说话人语音
...【技术保护点】
1.一种多说话人语音分离方法,其特征在于,包括:
2.根据权利要求1所述的多说话人语音分离方法,其特征在于,所述根据所述相位差以及所述第一区域和所述第二区域分别对应的波束形成信号,确定所述第一说话人的第一语音时频掩膜和所述第二说话人的第一语音时频掩膜,包括:
3.根据权利要求1所述的多说话人语音分离方法,其特征在于,还包括:
4.根据权利要求3所述的多说话人语音分离方法,其特征在于,所述根据所述第一说话人的第一语音时频掩膜和所述第二说话人的第一语音时频掩膜,同时结合所述第一说话人的第二语音时频掩膜和所述第二说话人的第二语音时频掩膜,
...【技术特征摘要】
1.一种多说话人语音分离方法,其特征在于,包括:
2.根据权利要求1所述的多说话人语音分离方法,其特征在于,所述根据所述相位差以及所述第一区域和所述第二区域分别对应的波束形成信号,确定所述第一说话人的第一语音时频掩膜和所述第二说话人的第一语音时频掩膜,包括:
3.根据权利要求1所述的多说话人语音分离方法,其特征在于,还包括:
4.根据权利要求3所述的多说话人语音分离方法,其特征在于,所述根据所述第一说话人的第一语音时频掩膜和所述第二说话人的第一语音时频掩膜,同时结合所述第一说话人的第二语音时频掩膜和所述第二说话人的第二语音时频掩膜,从所述多说话人语音信号的任一通道的信号中分离出所述第一说话人的语音信号和所述第二说话人的语音信号,包括:
5.根据权利要求4所述的多说话人语音分离方法,其特征在于,所述第一说话人的第一语音时频掩膜、所述第二说话人的第一语音时频掩膜、所述第一说话人的第二语音时频掩膜以及所述第二说话人的第二语音时频掩膜均为帧级别的语音时频掩膜;
6.根据权利要求4所述的多说话人语音分离方法,其特征在于,所述第一说话人的目标语音时频掩膜和所述第二说话人的目标语音时频掩膜均为帧级别的语音时频掩膜;
7.根据权利要求6所述的多说话人语音分离方法,其特...
【专利技术属性】
技术研发人员:陈左龙,马峰,高建清,李明子,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。