基于语音图谱和深度学习的实时性别识别方法技术

技术编号：22058710 阅读：23 留言：0更新日期：2019-09-07 16:34

本发明专利技术涉及语音识别领域，尤其涉及于语音图谱和深度学习的实时性别识别方法，包括以下步骤：S1：基于深度学习算法建立模型；S2：语音对话过程中实时获取音频流；S3：将获取的音频流通过VAD切除静音部分；S4：通过fbank提取音频的数字特征；S5：将数字特征转换成语音图谱，将语音图谱通过模型进行性别预测，得到性别识别结果。本发明专利技术针对语音可以实时性别识别，同时提升了性别识别的准确率。

Real-time gender recognition based on speech atlas and in-depth learning

全部详细技术资料下载

【技术实现步骤摘要】
基于语音图谱和深度学习的实时性别识别方法
本专利技术涉及语音识别领域，尤其涉及基于语音图谱和深度学习的实时性别识别方法。
技术介绍
随着大数据和深度学习技术的发展，语音识别和声纹识别越来越多的运用于各行各业，包括目标任务确认，语音开锁，智能语音机器人等行业，还包括智能人机交互，声控机器人，智能家居语音唤醒等，随着深度学习技术的不断发展，声纹识别和语音识别技术已经出现了很多影响人们生活的产品，越来越大的影响了人类生活。而在性别识别这块也有一些传统的方法尝试，例如：直接基于声音的基音频率差异，按男女不同范围的基音频率识别男女；采用多个传统模型融合的方式去实现，特征不断变换多个融合模型共同发挥作用。但是这些方法存在以下问题：基音频率差异这种方式，因为男女本身的基音频率就存在交叉，而且由于个体的特殊性导致准确率特别低；多模型融合方式的过程往往特别复杂，模型可解释性不强，而且预测时间特别长，没办法做到实时的性别识别；对话的音频信息往往含有一些外界噪音和背景音，或者是第二个人的说话信息以上方法在这个场景下准确率低下；对话中含有大量的静音部分(包括对话中单声道填充和对话人本身的停顿部分)，会影响识别的准确率。
技术实现思路
为解决上述问题，本专利技术提出涉及基于语音图谱和深度学习的实时性别识别方法。基于语音图谱和深度学习的实时性别识别方法，包括以下步骤：S1：基于深度学习算法建立模型；S2：语音对话过程中实时获取音频流；S3：将获取的音频流通过VAD切除静音部分；S4：通过fbank提取音频的数字特征；S5：将数字特征转换成语音图谱，将语音图谱通过模型进行性别预测，得到性别...

【技术保护点】
1.基于语音图谱和深度学习的实时性别识别方法，其特征在于，包括以下步骤：S1：基于深度学习算法建立模型；S2：语音对话过程中实时获取音频流；S3：将获取的音频流通过VAD切除静音部分；S4：通过fbank提取音频的数字特征；S5：将数字特征转换成语音图谱，将语音图谱通过模型进行性别预测，得到性别识别结果。

【技术特征摘要】
1.基于语音图谱和深度学习的实时性别识别方法，其特征在于，包括以下步骤：S1：基于深度学习算法建立模型；S2：语音对话过程中实时获取音频流；S3：将获取的音频流通过VAD切除静音部分；S4：通过fbank提取音频的数字特征；S5：将数字特征转换成语音图谱，将语音图谱通过模型进行性别预测，得到性别识别结果。2.根据权利要求1所述的基于语音图谱和深度学习的实时性别识别方法，其特征在于，所述基于深度学习算法建立模型包括以下步骤：S11：语音图谱结合打标标签生成样本信息，按照设定比例划分训练集合和测试集合；S12：对语音图谱作归一化和正则化处理，...

【专利技术属性】
技术研发人员：王磊，
申请(专利权)人：浙江百应科技有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人