声纹聚类方法、装置、存储介质及电子装置制造方法及图纸

技术编号：33403559 阅读：32 留言：0更新日期：2022-05-11 23:26

本发明专利技术公开了一种声纹聚类方法、装置、存储介质及电子装置。其中，该声纹聚类方法包括：获取已知目标声纹的用户的第一标识信息；提取每个语音片段的声纹信息，使用声纹模型，计算两两声纹之间的相似度；通过已知目标声纹修正相似度；将每个语音片段基于损失函数进行聚类，得到目标语音片段；确定已知目标声纹信息之间相似度满足预设条件的目标语音片段，并将目标语音片段与已知目标声纹进行聚类，即利用已知信息，人为修改他们之间的相似度，由于已分组的组的距离无穷大，这样相当于增大组间的边界，从而间接的减少分类错误的概率，解决了现有技术中，由于原始语音短，提取声纹信息不准确导致的聚类结果错误率高的技术问题。准确导致的聚类结果错误率高的技术问题。准确导致的聚类结果错误率高的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
声纹聚类方法、装置、存储介质及电子装置

[0001]本专利技术涉及金融相关领域，具体而言，涉及一种声纹聚类方法、装置、存储介质及电子装置。

技术介绍

[0002]随着社会的发展，各种语音信息的识别应用在更多的领域中，语音识别设计语音的聚类，聚类后的语音识别将会更准确。其中，主流的声纹聚类流程是：输入待聚类声纹集
‑
>计算声纹两两之间的相似度
‑
>基于声纹之间的相似度进行盲聚类(例如：层次聚类，谱聚类，K
‑
means等)。
[0003]根据盲聚类的原理，聚类开始的状态，每个声纹自成一组，此时假如有些声纹信息扰动较大，跟其他声纹做出错误的合并，这个错误会继续影响接下来的合并，这样一步步下去，错误会越来越严重，导致最后聚类错误率很高。
[0004]针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种声纹聚类方法、装置、存储介质及电子装置，以至少解决现有技术中，由于原始语音...

【技术保护点】

【技术特征摘要】
1.一种声纹聚类方法，其特征在于，包括：获取已知目标声纹的用户的第一标识信息；提取每个语音片段的声纹信息，使用声纹模型，计算两两声纹之间的相似度；通过所述已知目标声纹修正所述相似度；将所述每个语音片段基于损失函数进行聚类，得到目标语音片段；确定所述已知目标声纹信息之间相似度满足预设条件的目标语音片段，并将所述目标语音片段与所述已知目标声纹进行聚类。2.根据权利要求1所述的方法，其特征在于，所述提取每个语音片段的声纹信息，包括：从所述每个语音片段中提取语音特征；将所述语音特征送入x
‑
vector网络，输出所述每个语音片段的声纹信息。3.根据权利要求1所述的方法，其特征在于，所述通过所述已知目标声纹修正所述相似度，包括：将与所述已知声纹一致的语音片段的相似度，设置为无穷大；将与所述已知声纹不一致的语音片段的相似度设置为无穷小。4.根据权利要求1所述的方法，其特征在于，所述将所述每个语音片段基于损失函数进行聚类，得到目标语音片段，包括：使用plda score的相反数作为所述损失函数，对所述每个语音片段集合中的声纹进行聚类，得到所述目标语音片段，其中，所述目标语音片段包括一个或多个。5.根据权利要求3中所述的方法，其特征在于，所述方法还包括：在所述目标语音片段包括多个的情况下，确定每个目标语音片段的第二标识信息：将与所述第一标识信息一致的第二标识信息，确定为所述已知目标声纹聚类的目标语音片段。6.一种声纹聚类装置，其特征在于，包括：获取单元，用于获取已知目标声纹的用户的第一标识信息；计算单元，用于提取每个语音片段的声纹信息，使用声纹模型，计算两两声纹之间的相似度；修正单元，用于通过所述已知目标声纹修正所述相似度；...

【专利技术属性】
技术研发人员：王明明，梁家恩，
申请(专利权)人：云知声智能科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人