【技术实现步骤摘要】
本申请涉及计算机的,具体而言,涉及一种声纹识别方法、装置、电子设备及存储介质。
技术介绍
1、vad(voice activity detection,语音活动检测)与声纹识别方案一般通过级联训练好的vad模型及训练好的声纹识别模型来解决。具体的,现有技术首先对输入的原始语音信号做滤波、去均值等预处理,再计算预处理后的语音信号的mfcc(mel-scalefrequency cepstral coefficients,梅尔频率倒谱系数)、stft(short-time fouriertransform,短时傅里叶变换)等特征,将mfcc、stft等特征输入至预训练好的vad模型得到每帧语音信号的标签,接着基于标记为人声的语音信号提取声纹识别模型所需的特征,如i-vector/d-vector/x-vector等特征,最后将i-vector/d-vector/x-vector等特征输入声纹识别模型进行身份匹配识别,得到最终结果。但提取mfcc、stft等特征,以及提取i-vector/d-vector/x-vector等特征需要耗费较多的
<本文档来自技高网...【技术保护点】
1.一种声纹识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述待检测音频信号有N个,N为正整数;
3.根据权利要求2所述的方法,其特征在于,将记录的H个所述概率值和H个STFT特征融合,得到目标特征,包括:
4.根据权利要求3所述的方法,其特征在于,将所述第一初始特征和所述第二初始特征融合,得到目标特征,包括:
5.根据权利要求3所述的方法,其特征在于,将所述第一初始特征和所述第二初始特征融合,得到目标特征,包括:
6.根据权利要求1-5任一项所述的方法,其特征在于,所述VAD模型和
...【技术特征摘要】
1.一种声纹识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述待检测音频信号有n个,n为正整数;
3.根据权利要求2所述的方法,其特征在于,将记录的h个所述概率值和h个stft特征融合,得到目标特征,包括:
4.根据权利要求3所述的方法,其特征在于,将所述第一初始特征和所述第二初始特征融合,得到目标特征,包括:
5.根据权利要求3所述的方法,其特征在于,将所述第一初始特征和所述第二初始特征融合,得到目标特征,包括:
6.根...
【专利技术属性】
技术研发人员:刘畅,赵凌超,李倩,
申请(专利权)人:恒玄科技上海股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。