基于通道加权的说话人确认方法、系统及设备技术方案

技术编号:43004773 阅读:18 留言:0更新日期:2024-10-18 17:13
基于通道加权的说话人确认方法、系统及设备,属于生物特征识别技术领域。为了解决基于语音信号直接识别方式存在语音信号特征利用不充分影响识别准确率的问题。本发明专利技术首先提取MFCC特征矩阵,再利用通道分段学习网络CSLN进行处理得到说话人低维特征向量,CSLN中的通道分段学习块学习特征权重;然后利用包括减性角边距损失和加性角边距损失的总损失函数进行训练模型。使用时利用CSLN得到两条语音的说话人低维特征向量,根据二者相似度判断第一语音与第二语音是否为同一说话人,进而最终用确定语音的说话人。

【技术实现步骤摘要】

本专利技术属于生物特征识别,具体涉及一种说话人的确认方法、系统及设备。


技术介绍

1、说话人识别又称为话者识别或声纹识别,是指通过对说话人语音信号的分析处理,自动确认说话人是否在所记录的话者集合中,以及进一步确认说话人是谁的过程。它是根据语音信号的特征来识别说话人的自动过程。其中,说话人确认已经逐渐成为说话人识别领域重要的科学问题,有着广阔的应用前景。一个标准的说话人确认系统测量一个人的声音或语音的特征,以确定该人的身份特征。还可以进行语音拨号、网上银行、电话购物、安全控制、司法鉴定等应用。

2、近年来,随着深度学习的快速发展,图像处理、说话人识别等领域都在深度神经网络下大放异彩。由于其能够区分复杂特征,极大地提高了对复杂样本的分类准确性,在说话人确认领域中也取得了不错的成果。一个典型的说话人确认系统主要包括三个阶段:预处理、前端特征提取和说话人建模。常见的语音特征提取有mfcc、fbank和plp等。往往对于语音信号的直接输入无法具有较高的准确度,并且说话人特征向量过长,也不利于对语音的识别。


技术实现思路本文档来自技高网...

【技术保护点】

1.一种基于通道加权的说话人确认方法,其特征在于,包括:

2.根据权利要求1所述的一种基于通道加权的说话人确认方法,其特征在于,根据z1、z2的相似度判断第一语音与第二语音是否为同一说话人的过程包括:

3.根据权利要求1所述的一种基于通道加权的说话人确认方法,其特征在于,累加通道分段和得到的当k=1时,

4.根据权利要求3所述的一种基于通道加权的说话人确认方法,其特征在于,针对s′t,k再通过通道分段加权向量累加得到的

5.根据权利要求1至4任意一项所述的一种基于通道加权的说话人确认方法,其特征在于,所述通道分段学习网络CSLN是预先训练好...

【技术特征摘要】

1.一种基于通道加权的说话人确认方法,其特征在于,包括:

2.根据权利要求1所述的一种基于通道加权的说话人确认方法,其特征在于,根据z1、z2的相似度判断第一语音与第二语音是否为同一说话人的过程包括:

3.根据权利要求1所述的一种基于通道加权的说话人确认方法,其特征在于,累加通道分段和得到的当k=1时,

4.根据权利要求3所述的一种基于通道加权的说话人确认方法,其特征在于,针对s′t,k再通过通道分段加权向量累加得到的

5.根据权利要求1至4任意一项所述的一种基于通道加权的说话人确认方法,其特征在于,所述通道分段学习网络csln是预先训练好的,通道分段学习网络csln的训练过程包括以下步骤:

6.根据权...

【专利技术属性】
技术研发人员:陈晨仪志鑫李东源李骜杨海陆陈德运
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1