训练方法及装置、用户特征识别方法及装置制造方法及图纸

技术编号:37353215 阅读:29 留言:0更新日期:2023-04-27 07:04
本公开提供了训练方法及装置、用户特征识别方法及装置,该训练方法通过语音合成引擎生成表达用户特征的音频数据,对音频数据进行特征提取,得到音频特征,将音频特征输入训练好的声纹模型,得到声纹嵌入码,依据声纹嵌入码训练用户特征识别模型,通过语音合成引擎来生成表达不同性别和年龄的音频数据,提升了训练数据的多样性、数量和数据质量,解决了标注数据不足的问题,同时训练得到的用户特征识别模型能够准确识别发音人的性别和年龄,并且识别的准确率较高,解决了性别分类和年龄分类的准确性较低的问题,提升了识别和分类的效果。提升了识别和分类的效果。提升了识别和分类的效果。

【技术实现步骤摘要】
训练方法及装置、用户特征识别方法及装置


[0001]本公开涉及计算机
,尤其涉及训练方法及装置、用户特征识别方法及装置。

技术介绍

[0002]目前通过语音来识别用户特征的方式,主要是采用神经网络进行识别,例如通过神经网络来对说话人的性别和年龄进行识别。在实现本公开的过程中,专利技术人发现,上述识别方式存在有标注数据不足的问题,导致性别与年龄的分类准确性较低,分类效果难以满足要求。
[0003]需要说明的是,本
技术介绍
部分中公开的信息仅用于理解本公开构思的
技术介绍
,并且因此,它可以包含不构成现有技术的信息。

技术实现思路

[0004]为了解决上述技术问题中的至少一个,本公开提供了训练方法及装置、用户特征识别方法及装置。
[0005]本公开第一方面提出了一种用户特征识别模型的训练方法,包括:通过语音合成引擎生成表达用户特征的音频数据;对所述音频数据进行特征提取,得到音频特征;将所述音频特征输入训练好的声纹模型,得到声纹嵌入码;依据所述声纹嵌入码训练所述用户特征识别模型。
[0006]根据本公开的一个实本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用户特征识别模型的训练方法,其特征在于,包括:通过语音合成引擎生成表达用户特征的音频数据;对所述音频数据进行特征提取,得到音频特征;将所述音频特征输入训练好的声纹模型,得到声纹嵌入码;依据所述声纹嵌入码训练所述用户特征识别模型。2.根据权利要求1所述的方法,其特征在于,所述用户特征包括性别和年龄。3.根据权利要求2所述的方法,其特征在于,所述用户特征识别模型包括性别分类器和年龄分类器,依据所述声纹嵌入码训练所述用户特征识别模型,包括:依据所述声纹嵌入码训练所述性别分类器;依据所述声纹嵌入码训练所述年龄分类器。4.根据权利要求3所述的方法,其特征在于,所述性别分类器和/或所述年龄分类器为基于深度神经网络的分类器。5.根据权利要求1所述的方法,其特征在于,在将所述音频特征输入所述声纹模型之前,所述方法还包括:依据音频数据训练集对声纹模型进行训练。6.根据权利要求1或5所述的方法,其特征在于,所述声纹模型为ECAPA

TDNN声纹模型。7.根据权利要求1所述的方法,其特征在于,对所述音频数据进行特征提取,得到音...

【专利技术属性】
技术研发人员:宋熙康李媛媛
申请(专利权)人:上海墨百意信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1