声纹识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：40544609 阅读：24 留言：0更新日期：2024-03-05 19:01

本申请提供一种声纹识别方法、装置、电子设备及存储介质，涉及计算机的技术领域。声纹识别方法，包括：获取待检测音频信号；提取所述待检测音频信号的STFT特征；将所述STFT特征输入预先训练好的VAD模型中，得到表征所述待检测音频信号为人声的概率值；当所述概率值大于预设阈值的情况下，基于所述概率值、所述概率值对应的STFT特征以及预先训练好的声纹识别模型，得到表征声音对象的输出结果。本方案仅需要对待检测音频信号提取一次特征，声纹识别模型的输入数据由VAD模型输出的概率值和STFT特征融合得到。相较于现有技术中需要分别提取两次特征的方式，本方案能减少提取特征的次数。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机的，具体而言，涉及一种声纹识别方法、装置、电子设备及存储介质。

技术介绍

1、vad(voice activity detection，语音活动检测)与声纹识别方案一般通过级联训练好的vad模型及训练好的声纹识别模型来解决。具体的，现有技术首先对输入的原始语音信号做滤波、去均值等预处理，再计算预处理后的语音信号的mfcc(mel-scalefrequency cepstral coefficients，梅尔频率倒谱系数)、stft(short-time fouriertransform，短时傅里叶变换)等特征，将mfcc、stft等特征输入至预训练好的vad模型得到每帧语音信号的标签，接着基于标记为人声的语音信号提取声纹识别模型所需的特征，如i-vector/d-vector/x-vector等特征，最后将i-vector/d-vector/x-vector等特征输入声纹识别模型进行身份匹配识别，得到最终结果。但提取mfcc、stft等特征，以及提取i-vector/d-vector/x-vector等特征需要耗费较多的计算资源。

<本文档来自技高网...

【技术保护点】

1.一种声纹识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述待检测音频信号有N个，N为正整数；

3.根据权利要求2所述的方法，其特征在于，将记录的H个所述概率值和H个STFT特征融合，得到目标特征，包括：

4.根据权利要求3所述的方法，其特征在于，将所述第一初始特征和所述第二初始特征融合，得到目标特征，包括：

5.根据权利要求3所述的方法，其特征在于，将所述第一初始特征和所述第二初始特征融合，得到目标特征，包括：

6.根据权利要求1-5任一项所述的方法，其特征在于，所述VAD模型和所述声纹识别模型通过...

【技术特征摘要】

1.一种声纹识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述待检测音频信号有n个，n为正整数；

3.根据权利要求2所述的方法，其特征在于，将记录的h个所述概率值和h个stft特征融合，得到目标特征，包括：

4.根据权利要求3所述的方法，其特征在于，将所述第一初始特征和所述第二初始特征融合，得到目标特征，包括：

5.根据权利要求3所述的方法，其特征在于，将所述第一初始特征和所述第二初始特征融合，得到目标特征，包括：

6.根...

【专利技术属性】
技术研发人员：刘畅，赵凌超，李倩，
申请(专利权)人：恒玄科技上海股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人