声纹识别的方法、装置、设备、存储介质以及程序产品制造方法及图纸

技术编号：28059066 阅读：30 留言：0更新日期：2021-04-14 13:34

本公开提供了一种声纹识别的方法、装置、设备、存储介质以及程序产品，涉及大数据以及语音识别等领域。具体实现方案为：获取多个对话音频，各对话音频中分别包括有第一发言人的语音片段和第二发言人的语音片段；根据各对话音频对应的第一发言人的身份标识，将多个对话音频划分为多组，每组对话音频对应于相同的第一发言人；对目标组对话音频中各语音片段的声纹进行聚类，得到多个聚类结果；选取包含语音片段数量最多的聚类结果确定为候选聚类结果；将候选聚类结果对应的声纹确定为目标组对话音频对应的第一发言人的声纹。根据本公开的声纹识别的方法具有人力成本低、声纹的提取及识别效率高等优点，有利于缩减声纹库的建立周期。期。期。

全部详细技术资料下载

【技术实现步骤摘要】
声纹识别的方法、装置、设备、存储介质以及程序产品

[0001]本公开涉及人工智能
，尤其涉及大数据和语音识别领域。

技术介绍

[0002]相关技术中，针对客服业务中所涉及的多个对话场景，在建立客服和客户的声纹库的过程中，通常采用人工方式对多个对话音频进行切割和标注，存在人力成本高、效率低以及建库周期长的缺陷。

技术实现思路

[0003]本公开提供了一种用于声纹识别的方法、装置、设备、存储介质以及程序产品。
[0004]根据本公开的一方面，提供了一种声纹识别的方法，包括
[0005]获取多个对话音频，各对话音频中分别包括有第一发言人的语音片段和第二发言人的语音片段；
[0006]根据各对话音频对应的第一发言人的身份标识，将多个对话音频划分为多组，每组对话音频对应于相同的第一发言人；
[0007]对目标组对话音频中各语音片段的声纹进行聚类，得到多个聚类结果；
[0008]选取包含语音片段数量最多的聚类结果确定为候选聚类结果；
[0009]将候选聚类结果对应的声...

【技术保护点】

【技术特征摘要】
1.一种声纹识别的方法，包括：获取多个对话音频，各对话音频中分别包括有第一发言人的语音片段和第二发言人的语音片段；根据各对话音频对应的第一发言人的身份标识，将多个对话音频划分为多组，每组对话音频对应于相同的第一发言人；对目标组对话音频中各语音片段的声纹进行聚类，得到多个聚类结果；选取包含语音片段数量最多的聚类结果确定为候选聚类结果；将所述候选聚类结果对应的声纹确定为所述目标组对话音频对应的第一发言人的声纹。2.根据权利要求1所述的方法，其中，对目标组对话音频中各语音片段的声纹进行聚类，包括：对所述目标组对话音频中的各对话音频进行语音分割，得到第一语音片段和第二语音片段；分别对各所述第一语音片段和各所述第二语音片段进行声纹特征提取，得到多个声纹；对各所述声纹进行聚类，得到所述多个聚类结果。3.根据权利要求1所述的方法，将所述候选聚类结果对应的声纹确定为所述目标组对话音频对应的第一发言人的声纹之后，还包括：将所述目标组对话音频中各语音片段的声纹，与所述目标组对话音频对应的第一发言人的声纹进行相似性比较；根据比较结果确定与所述目标组对话音频所对应的各第二发言人的声纹。4.根据权利要求3所述的方法，其中，将所述目标组对话音频中各语音片段的声纹，与所述目标组对话音频对应的第一发言人的声纹进行相似性比较，包括：从目标组对话音频中获取目标对话音频；对所述目标对话音频进行语音分割，得到第一目标语音片段和第二目标语音片段；将所述第一目标语音片段的声纹与所述目标组对话音频对应的第一发言人的声纹进行相似性比较。5.根据权利要求4所述的方法，其中，根据比较结果确定与所述目标组所对应的各第二发言人的声纹，包括：在所述比较结果为不相似的情况下，将所述第一目标语音片段的声纹确定为所述目标对话音频对应的第二发言人的声纹。6.根据权利要求4所述的方法，其中，根据比较结果确定与所述目标组所对应的各第二发言人的声纹，包括：在所述比较结果为相似的情况下，将所述第二目标语音片段的声纹确定为所述目标对话音频对应的第二发言人的声纹。7.一种声纹识别的装置，包括：对话音频获取模块，用于获取多个对话音频，各对话音频中分别包括有第一发言人的语音片段和第二发言人的语音片段；分组模块，用于根据各对话音频对应的第一发言人的身份标识，将多个对话音频划分
为多组，每组对话音频对应于相同的第一发言人；聚类模块，用于对目标组对话音频中各语音片段...

【专利技术属性】
技术研发人员：赵情恩，曾新贵，熊新雷，陈蓉，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人