声纹识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40544609 阅读:24 留言:0更新日期:2024-03-05 19:01
本申请提供一种声纹识别方法、装置、电子设备及存储介质,涉及计算机的技术领域。声纹识别方法,包括:获取待检测音频信号;提取所述待检测音频信号的STFT特征;将所述STFT特征输入预先训练好的VAD模型中,得到表征所述待检测音频信号为人声的概率值;当所述概率值大于预设阈值的情况下,基于所述概率值、所述概率值对应的STFT特征以及预先训练好的声纹识别模型,得到表征声音对象的输出结果。本方案仅需要对待检测音频信号提取一次特征,声纹识别模型的输入数据由VAD模型输出的概率值和STFT特征融合得到。相较于现有技术中需要分别提取两次特征的方式,本方案能减少提取特征的次数。

【技术实现步骤摘要】

本申请涉及计算机的,具体而言,涉及一种声纹识别方法、装置、电子设备及存储介质


技术介绍

1、vad(voice activity detection,语音活动检测)与声纹识别方案一般通过级联训练好的vad模型及训练好的声纹识别模型来解决。具体的,现有技术首先对输入的原始语音信号做滤波、去均值等预处理,再计算预处理后的语音信号的mfcc(mel-scalefrequency cepstral coefficients,梅尔频率倒谱系数)、stft(short-time fouriertransform,短时傅里叶变换)等特征,将mfcc、stft等特征输入至预训练好的vad模型得到每帧语音信号的标签,接着基于标记为人声的语音信号提取声纹识别模型所需的特征,如i-vector/d-vector/x-vector等特征,最后将i-vector/d-vector/x-vector等特征输入声纹识别模型进行身份匹配识别,得到最终结果。但提取mfcc、stft等特征,以及提取i-vector/d-vector/x-vector等特征需要耗费较多的计算资源。

<本文档来自技高网...

【技术保护点】

1.一种声纹识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述待检测音频信号有N个,N为正整数;

3.根据权利要求2所述的方法,其特征在于,将记录的H个所述概率值和H个STFT特征融合,得到目标特征,包括:

4.根据权利要求3所述的方法,其特征在于,将所述第一初始特征和所述第二初始特征融合,得到目标特征,包括:

5.根据权利要求3所述的方法,其特征在于,将所述第一初始特征和所述第二初始特征融合,得到目标特征,包括:

6.根据权利要求1-5任一项所述的方法,其特征在于,所述VAD模型和所述声纹识别模型通过...

【技术特征摘要】

1.一种声纹识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述待检测音频信号有n个,n为正整数;

3.根据权利要求2所述的方法,其特征在于,将记录的h个所述概率值和h个stft特征融合,得到目标特征,包括:

4.根据权利要求3所述的方法,其特征在于,将所述第一初始特征和所述第二初始特征融合,得到目标特征,包括:

5.根据权利要求3所述的方法,其特征在于,将所述第一初始特征和所述第二初始特征融合,得到目标特征,包括:

6.根...

【专利技术属性】
技术研发人员:刘畅赵凌超李倩
申请(专利权)人:恒玄科技上海股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1