【技术实现步骤摘要】
角色分离方法、电子设备及计算机存储介质
[0001]本申请实施例涉及语音处理
,尤其涉及角色分离方法、电子设备及计算机存储介质。
技术介绍
[0002]在许多应用场景中,例如会议场景、语音通话场景等,为了向用户反馈发言人的角色信息,需要根据发言人的语音数据确定其身份或角色。通常根据不同角色的声纹特征,可以区分不同角色的语音数据。但是,在实现上述角色分离的过程中,如果两个发言人的声纹特征较为相近,在角色分离时就会产生比较大的误差,向用户反馈错误信息。
技术实现思路
[0003]有鉴于此,本申请实施例提供一种角色分离方案,以解决上述部分或全部问题。
[0004]根据本申请实施例的第一方面,提供了一种角色分离方法,包括:获取目标语音数据的声源信息及声纹特征;根据声源信息确定与声源位置对应的至少一个候选位置;计算候选位置对应的角色的声纹特征与目标语音数据的声纹特征的相似度;根据相似度确定目标语音数据对应的目标角色。
[0005]根据本申请实施例的第二方面,提供了一种角色分离装置,包括:获取模块, ...
【技术保护点】
【技术特征摘要】
1.一种角色分离方法,其包括:获取目标语音数据的声源信息及声纹特征;根据所述声源信息确定与声源位置对应的至少一个候选位置;计算所述候选位置对应的角色的声纹特征与所述目标语音数据的声纹特征的相似度;根据相似度确定所述目标语音数据对应的目标角色。2.根据权利要求1所述的方法,其中,根据相似度确定所述目标语音数据对应的目标角色,包括:将所述候选位置对应的角色中,声纹特征的相似度最大的角色确定为所述目标角色。3.根据权利要求1所述的方法,其中,所述根据所述声源信息确定与声源位置对应的至少一个候选位置,包括:当所述目标语音数据的帧数大于预设帧数时,确定所述目标语音数据是否为第一个语音数据;如果所述目标语音数据不是第一个语音数据,则根据所述声源信息确定与声源位置对应的至少一个候选位置;否则,根据所述目标语音数据的声源信息生成新的位置作为候选位置。4.根据权利要求3所述的方法,其中,所述如果所述目标语音数据不是第一个语音数据,则根据所述声源信息确定与声源位置对应的至少一个候选位置,包括:如果所述目标语音数据不是第一个语音数据,根据所述声源信息计算所述目标语音数据相对于方位最接近的位置的方位变化差值;如果所述方位变化差值大于预设变化差值,则将已经存在的位置确定为候选位置;否则,将方位最接近的位置确定为所述候选位置。5.根据权利要求3所述的方法,其中,所述根据相似度确定所述目标语音数据对应的目标角色,包括:如果所述目标语音数据不是第一个语音数据,根据所述声源信息计算所述目标语音数据相对于方位最接近的位置的方位变化差值;如果所述方位变化差值小于等于预设变化差值,且所述相似度大于预设相似度,将所述相似度对应的角色确定为所述目标角色;如果所述方位变化差值小于等于所述预设变化差值,且所述相似度小于等于预设相似度,则计算所述候选位置所在区域内的其他位置对应的声纹特征与所述目标语音数据的声纹特征的相似度,将相似度大于所述预设相似度的声纹特征对应的角色确定为所述目标角色。6.根据权利要求5所述的方法,其中,所述方法还包括:如果对于所述候选位置所在区域内的其他位置,声纹特征的相似度均小于等于所述预设相似度,则计算其他区域内的位置对应的声纹特征与所述目标语音数据的声纹特征的相似度,将相似度大于所...
【专利技术属性】
技术研发人员:琚炜,
申请(专利权)人:阿里巴巴达摩院杭州科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。