语音数据的说话人的识别方法、装置及相关设备制造方法及图纸

技术编号:40480814 阅读:20 留言:0更新日期:2024-02-26 19:15
本申请公开了一种语音数据的说话人的识别方法、装置及相关设备,属于人工智能技术领域。所述方法包括:获取待识别语音数据;将所述待识别语音数据对输入到预先训练得到的声纹特征识别模型中进行特征提取,得到多个特征向量,所述特征向量与说话人对应,所述声纹特征识别模型为用于进行特征提取的模型;将所述多个特征向量进行语音聚类处理,得到声纹聚类信息,所述声纹聚类信息包括所述说话人在至少一个时间段内的语音数据。在本申请实施例中,利用预先训练得到的声纹特征识别模型,识别语音数据的声纹特征再进行分类,根据语音聚类结果,就能将语音数据与对应的说话人进行匹配,与相关技术中通过人工依次匹配的方式相比,提高了匹配效率。

【技术实现步骤摘要】

本申请属于人工智能,具体涉及一种语音数据的说话人的识别方法、装置及相关设备


技术介绍

1、随着人工智能技术的发展,语音识别技术也得到了迅速的普及和应用。目前,语音识别技术已经广泛应用到如智能家居、智能客服、自动驾驶、语音转文字等多个领域。

2、相关技术中,利用时延神经网络(time delay neural network,tdnn)能够识别语音数据并得到语音文本的具体内容,但是在某一时间短内具有多段语音且对应不同的说话人时,在识别语音文本后需要通过人工的方式将多段语音数据与不同的说话人进行身份匹配,导致匹配效率较低。


技术实现思路

1、本申请实施例的目的是提供一种语音数据的说话人的识别方法、装置及相关设备,能够解决现有方法对相似语音数据的说话人的身份识别结果的准确度较低的问题。

2、第一方面,本申请实施例提供了一种语音数据的说话人的识别方法,所述方法包括:

3、获取待识别语音数据;

4、将所述待识别语音数据输入到预先训练得到的声纹特征识别模型中进行特征提取,本文档来自技高网...

【技术保护点】

1.一种语音数据的说话人的识别方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述声纹特征识别模型为孪生神经网络模型去除尾端网络模型之后的骨干网络模型。

3.如权利要求1所述的方法,其特征在于,所述将所述待识别语音数据输入到预先训练得到的声纹特征识别模型中进行特征提取,得到多个特征向量之前,所述方法还包括:

4.如权利要求3所述的方法,其特征在于,所述孪生神经网络模型包括两个骨干网络模型和一个尾端网络模型;

5.如权利要求4所述的方法,其特征在于,所述尾端网络模型包括多层感知机、余弦相关层和输出层;

6...

【技术特征摘要】

1.一种语音数据的说话人的识别方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述声纹特征识别模型为孪生神经网络模型去除尾端网络模型之后的骨干网络模型。

3.如权利要求1所述的方法,其特征在于,所述将所述待识别语音数据输入到预先训练得到的声纹特征识别模型中进行特征提取,得到多个特征向量之前,所述方法还包括:

4.如权利要求3所述的方法,其特征在于,所述孪生神经网络模型包括两个骨干网络模型和一个尾端网络模型;

5.如权利要求4所述的方法,其特征在于,所述尾端网络模型包括多层感知机、余弦相关层和输出层;

6.如权利要求4所述的方法,其特征在于,所述骨干网络模型包括依...

【专利技术属性】
技术研发人员:张润清卢慧君蔡敦波黄智国
申请(专利权)人:中移苏州软件技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1