【技术实现步骤摘要】
声纹信息提取方法、装置、电子设备及存储介质
[0001]本申请涉及音频处理
,更具体地,涉及一种声纹信息提取方法、装置、电子设备及存储介质。
技术介绍
[0002]声纹识别是一种借助声音完成对语音用户身份识别的技术,是语音领域重要的研究方向之一。随着计算机技术的不断发展,声纹识别在近年来得到很大的发展,加上方便有效的特点,其已然成为一种高效的身份识别方法,在公安、银行、智能家居中都有着广泛地应用。
[0003]目前,可以通过样本对深度神经网络进行训练,得到声纹提取模型,然后通过声纹提取模型对待提取语音信息进行声纹提取。但是,采用该方法对待提取语音信息进行声纹提取,提取的声纹信息的准确率较低。
技术实现思路
[0004]有鉴于此,本申请实施例提出了一声纹信息提取方法、装置、电子设备及存储介质。
[0005]第一方面,本申请实施例提供了一种声纹信息提取方法,所述方法包括:通过声纹提取模型对目标语音信息进行处理,得到对应所述目标语音信息的目标协方差、目标方差以及目标均值;通过所述声纹提取模型中 ...
【技术保护点】
【技术特征摘要】
1.一种声纹信息提取方法,其特征在于,所述方法包括:通过声纹提取模型对目标语音信息进行处理,得到对应所述目标语音信息的目标协方差、目标方差以及目标均值;通过所述声纹提取模型中的双线性参数层对所述目标协方差进行降维处理,得到目标一维数据;对所述目标方差、所述目标均值以及所述目标一维数据进行拼接操作,得到目标拼接结果;通过所述声纹提取模型对所述目标拼接结果进行处理,得到对应所述目标语音信息的声纹信息。2.根据权利要求1所述的方法,其特征在于,所述声纹提取模型的训练方法,包括:通过目标模型对样本语音信息进行处理,得到对应所述样本语音信息的协方差、方差以及均值;通过所述目标模型中的双线性参数层对所述协方差进行降维处理,得到降维后的结果,并对所述降维后的结果进行平方根规整操作,得到一维数据;对所述方差、所述均值以及所述一维数据进行拼接操作,得到拼接结果;根据所述拼接结果对所述目标模型进行训练,得到声纹提取模型。3.根据权利要求2所述的方法,其特征在于,所述样本语音信息包括多个音频帧;所述通过目标模型对样本语音信息进行处理,得到对应所述样本语音信息的协方差、方差以及均值,包括:通过所述目标模型对所述多个音频帧进行特征提取,得到与所述多个音频帧一一对应的多个音频帧特征;根据所述多个音频帧特征,得到对应所述样本语音信息的协方差、方差以及均值。4.根据权利要求2所述的方法,其特征在于,所述目标模型中的双线性参数层包括参数矩阵;所述通过所述目标模型中的双线性参数层对所述协方差进行降维处理,得到降维后的结果,包括:通过所述参数矩阵,对所述协方差中的每列数据进行转换,得到所述协方差中的每列数据各自对应的转换结果;对所述协方差中的每列数据各自对应的转换结果进行拼接操作,得到所述降维后的结果。5.根据权利要求4所述的方法,其特征在于,所述通过所述参数矩阵,对所述协方差中的每列数据进行转换,得到所述协方差中的每列数据各自对应的转换结果,包括:通过所述参数矩阵,根据公式一,对所述协方差中的每列数据进行转换,得到所述协方差中的每列数据各自对应的转换结果;所述公式一为:其中,w
j
是所述参数矩阵的第j列,为w
j
的转置矩阵,C为所述协方差,z
j
【专利技术属性】
技术研发人员:黎荣晋,陈东鹏,
申请(专利权)人:深圳市声扬科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。