语音对话的角色识别方法、电子设备及存储介质技术

技术编号:45082313 阅读:32 留言:0更新日期:2025-04-25 18:21
本申请提供了一种语音对话的角色识别方法、电子设备及存储介质,其方法包括:获取待识别语音对话;对所述待识别语音对话进行语音分离,获得多个说话人对应的多条单通道语音,其中,一条单通道语音包含一个说话人的声音;对所述多条单通道语音中的每条单通道语音分别进行角色判断,确定所述每条单通道语音对应的说话人的角色。该方法可以将语音对话中不同说话人的语音分离出来,将语音对话拆分成多个说话人对应的多条单通道语音,使得一条单通道语音里只包含一个说话人的语音,再根据单通道语音来进行角色识别,针对多人同时说话的场景,能够更为准确地识别出说话人的角色。

【技术实现步骤摘要】

本申请涉及语音识别,尤其涉及一种语音对话的角色识别方法、电子设备及存储介质


技术介绍

1、随着人工智能、智能通讯、互联网技术以及5g通信的不断发展,语音识别技术已经被广泛应用到生活中的各类场景,比如智能家居,网络通话等智能语音的应用。在智能语音的应用中,对语音对话中的说话人进行身份识别的场景非常典型和普遍,尤其是智能客服的客服/客户的语音分离及客服质检。目前,业界主流的角色识别方法,有些方法直接基于数据建立声纹模型并进行识别,然而在超短语句的快速切换下,声纹识别容易出现误判且误判率非常高。有些方法通过将语音会话分割成多个语音片段,然后采用k-means等聚类方法将属于同一说话人身份的语音片段聚类在一起,并根据聚类结果得到语音会话中各说话人的角色,然而这种片段分割的方式对于多个说话人同时说话的场景,角色识别的准确率很低。


技术实现思路

1、有鉴于此,本申请实施例提供了一种语音对话的角色识别方法、电子设备及存储介质,针对多人同时说话的场景,能够更为准确地识别出说话人的角色。

2、本申请实施例的第一方本文档来自技高网...

【技术保护点】

1.一种语音对话的角色识别方法,其特征在于,包括:

2.根据权利要求1所述的语音对话的角色识别方法,其特征在于,所述对所述多条单通道语音中的每条单通道语音分别进行角色判断,确定所述每条单通道语音对应的说话人的角色的步骤,包括:

3.根据权利要求2所述的语音对话的角色识别方法,其特征在于,所述对所述每条单通道语音各自对应的文本分别进行角色判断,确定所述每条单通道语音对应的说话人的角色的步骤,包括:

4.根据权利要求2所述的语音对话的角色识别方法,其特征在于,所述对所述每条单通道语音各自对应的文本分别进行角色判断,确定所述每条单通道语音对应的说话人的角色的...

【技术特征摘要】

1.一种语音对话的角色识别方法,其特征在于,包括:

2.根据权利要求1所述的语音对话的角色识别方法,其特征在于,所述对所述多条单通道语音中的每条单通道语音分别进行角色判断,确定所述每条单通道语音对应的说话人的角色的步骤,包括:

3.根据权利要求2所述的语音对话的角色识别方法,其特征在于,所述对所述每条单通道语音各自对应的文本分别进行角色判断,确定所述每条单通道语音对应的说话人的角色的步骤,包括:

4.根据权利要求2所述的语音对话的角色识别方法,其特征在于,所述对所述每条单通道语音各自对应的文本分别进行角色判断,确定所述每条单通道语音对应的说话人的角色的步骤,包括:

5.根据权利要求4所述的语音对话的角色识别方法,其特征在于,所述将每条单通道语音对应的文本输入至角色预测模型中进行角色预测的步骤之前,还包括:

6.根据权利要求2所述的语音对话的角色识别方法,...

【专利技术属性】
技术研发人员:倪旭彤
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1