【技术实现步骤摘要】
一种声纹模型训练方法和装置以及设备
本专利技术涉及声纹
,尤其涉及一种声纹模型训练方法和装置以及设备。
技术介绍
声纹是用电声学仪器显示的携带言语信息的声波频谱。现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。实验证明,每个人的声纹各不相同,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不同。但是,专利技术人发现现有技术中至少存在如下问题:现有的声纹模型训练方案,一般都是先采集至少一个用户的语音数据,接着对该采集的每个用户的语音数据进行声纹特征提取,然后对该提取的声纹特征进行训练得到声纹特征训练集,之后,根据该声纹特征训练集,形成声纹模型,该采集的语音数据中一般都包含环境噪声,该环境噪声贯穿整个声纹模型的形成过程,导致该形成的声纹模型的准确率一般。
技术实现思路
有鉴于此,本专利技术的目的在于提出一种声纹模型训练方法和装置以及设备,能够实现提高所形成的声纹模型的准确率。根据本专利技 ...
【技术保护点】
1.一种声纹模型训练方法,其特征在于,包括:/n采集至少一个用户的语音数据;/n获取所述采集的每个用户的语音数据中的环境噪声数据;/n根据所述环境噪声数据,消除所述采集的每个用户的语音数据中的环境噪声;/n对所述经消除环境噪声后的每个用户的语音数据进行声纹特征提取;/n对所述提取的声纹特征进行训练得到声纹特征训练集;/n根据所述声纹特征训练集,形成声纹模型。/n
【技术特征摘要】
1.一种声纹模型训练方法,其特征在于,包括:
采集至少一个用户的语音数据;
获取所述采集的每个用户的语音数据中的环境噪声数据;
根据所述环境噪声数据,消除所述采集的每个用户的语音数据中的环境噪声;
对所述经消除环境噪声后的每个用户的语音数据进行声纹特征提取;
对所述提取的声纹特征进行训练得到声纹特征训练集;
根据所述声纹特征训练集,形成声纹模型。
2.如权利要求1所述的声纹模型训练方法,其特征在于,所述获取所述采集的每个用户的语音数据中的环境噪声数据,包括:
通过预设的通用环境噪声模型,获取所述采集的每个用户的语音数据中的环境噪声数据。
3.如权利要求1所述的声纹模型训练方法,其特征在于,所述对所述提取的声纹特征进行训练得到声纹特征训练集,包括:
通过长短期记忆网络和卷积神经网络,对所述提取的声纹特征进行训练得到声纹特征训练集。
4.如权利要求1所述的声纹模型训练方法,其特征在于,所述根据所述声纹特征训练集,形成声纹模型,包括:
根据所述声纹特征训练集,形成所述经消除环境噪声后的每个用户的语音数据的声纹模型和/或所述经消除环境噪声后的所有用户的语音数据的声纹模型。
5.如权利要求1所述的声纹模型训练方法,其特征在于,在所述根据所述声纹特征训练集,形成声纹模型之后,还包括:
通过预设次数的迭代,对所述形成的声纹模型进行优化。
6.一种声纹模型训练装置,其特征在...
【专利技术属性】
技术研发人员:肖龙源,李稀敏,刘晓葳,谭玉坤,叶志坚,
申请(专利权)人:厦门快商通科技股份有限公司,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。