【技术实现步骤摘要】
训练方法及装置、用户特征识别方法及装置
[0001]本公开涉及计算机
,尤其涉及训练方法及装置、用户特征识别方法及装置。
技术介绍
[0002]目前通过语音来识别用户特征的方式,主要是采用神经网络进行识别,例如通过神经网络来对说话人的性别和年龄进行识别。在实现本公开的过程中,专利技术人发现,上述识别方式存在有标注数据不足的问题,导致性别与年龄的分类准确性较低,分类效果难以满足要求。
[0003]需要说明的是,本
技术介绍
部分中公开的信息仅用于理解本公开构思的
技术介绍
,并且因此,它可以包含不构成现有技术的信息。
技术实现思路
[0004]为了解决上述技术问题中的至少一个,本公开提供了训练方法及装置、用户特征识别方法及装置。
[0005]本公开第一方面提出了一种用户特征识别模型的训练方法,包括:通过语音合成引擎生成表达用户特征的音频数据;对所述音频数据进行特征提取,得到音频特征;将所述音频特征输入训练好的声纹模型,得到声纹嵌入码;依据所述声纹嵌入码训练所述用户特征识别模型。
[0006 ...
【技术保护点】
【技术特征摘要】
1.一种用户特征识别模型的训练方法,其特征在于,包括:通过语音合成引擎生成表达用户特征的音频数据;对所述音频数据进行特征提取,得到音频特征;将所述音频特征输入训练好的声纹模型,得到声纹嵌入码;依据所述声纹嵌入码训练所述用户特征识别模型。2.根据权利要求1所述的方法,其特征在于,所述用户特征包括性别和年龄。3.根据权利要求2所述的方法,其特征在于,所述用户特征识别模型包括性别分类器和年龄分类器,依据所述声纹嵌入码训练所述用户特征识别模型,包括:依据所述声纹嵌入码训练所述性别分类器;依据所述声纹嵌入码训练所述年龄分类器。4.根据权利要求3所述的方法,其特征在于,所述性别分类器和/或所述年龄分类器为基于深度神经网络的分类器。5.根据权利要求1所述的方法,其特征在于,在将所述音频特征输入所述声纹模型之前,所述方法还包括:依据音频数据训练集对声纹模型进行训练。6.根据权利要求1或5所述的方法,其特征在于,所述声纹模型为ECAPA
‑
TDNN声纹模型。7.根据权利要求1所述的方法,其特征在于,对所述音频数据进行特征提取,得到音...
【专利技术属性】
技术研发人员:宋熙康,李媛媛,
申请(专利权)人:上海墨百意信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。