【技术实现步骤摘要】
本专利技术属于声纹识别,涉及基于残差网络带二维注意力和语义增强的说话人识别方法。
技术介绍
1、说话人验证是一种通过比较两个语音样本以验证它们是否由同一个说话人发出的技术。作为生物识别的一种重要方式,它被广泛应用于安全、认证和监测等领域。近年来,基于深度学习的声纹识别系统在性能上有了很大的提高。说话人系统由三个模块组成:计算说话人嵌入的特征提取模块,训练时的评分模块,以及推理时的校准模块。其中特征提取模块是最重要的组件,将高维的输入语音转换为一个紧凑的向量,即嵌入,来表示说话人特定的特征,之后再由后面的模块进行评分以迭代或者推理以判别。因此,为了取得更好的性能,对说话人特定特征提取和增强的对于说话人识别任务至关重要。随着深度学习技术的发展,基于深度学习的声纹识别系统在性能上得到了显著提升。
2、传统的说话人验证技术通常面临数据量不足和过拟合问题,这限制了模型的泛化能力。为了解决这些问题,研究者们提出了各种数据增强技术,如通过对输入音频的预处理来增加训练样本的多样性。然而,这些方法往往在计算成本和可靠性方面存在不足。
< ...【技术保护点】
1.基于残差网络带二维注意力和语义增强的说话人识别方法,其特征在于:该方法包括以下步骤:
2.根据权利要求1所述的基于残差网络带二维注意力和语义增强的说话人识别方法,其特征在于:所述S2中,第一特征提取层包括:二维卷积层、归一化层和非线性激活层,使用二维卷积层来处理输入特征,使用归一化层来调整特征的尺度,并通过非线性激活函数增强特征表示。
3.根据权利要求1所述的基于残差网络带二维注意力和语义增强的说话人识别方法,其特征在于:所述S2中,通道-频率注意力模块,引入频率的关注度和频率间依赖关系来充分利用信息,并使用压缩注意力模块SE计算频率的注意
...【技术特征摘要】
1.基于残差网络带二维注意力和语义增强的说话人识别方法,其特征在于:该方法包括以下步骤:
2.根据权利要求1所述的基于残差网络带二维注意力和语义增强的说话人识别方法,其特征在于:所述s2中,第一特征提取层包括:二维卷积层、归一化层和非线性激活层,使用二维卷积层来处理输入特征,使用归一化层来调整特征的尺度,并通过非线性激活函数增强特征表示。
3.根据权利要求1所述的基于残差网络带二维注意力和语义增强的说话人识别方法,其特征在于:所述s2中,通道-频率注意力模块,引入频率的关注度和频率间依赖关系来充分利用信息,...
【专利技术属性】
技术研发人员:李鹏华,刘学超,侯杰,项盛,辛飞洋,苏沁伟,陈思睿,王宇豪,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。