基于语音的性别年龄识别方法、装置、设备和存储介质制造方法及图纸

技术编号：26508337 阅读：47 留言：0更新日期：2020-11-27 15:36

本发明专利技术实施例公开了一种基于语音的性别年龄识别方法、装置、设备和存储介质。该方法包括：获取目标用户发出的语音信号；将所述语音信号转换为声纹特征图；将所述声纹特征图输入至预先训练好的年龄识别神经网络模型以得到所述目标用户的识别年龄，并将所述声纹特征图输入至预先训练好的性别识别神经网络模型以得到所述目标用户的识别性别。本发明专利技术实施例实现了快速准确的实时获取用户的年龄和性别。

全部详细技术资料下载

【技术实现步骤摘要】
基于语音的性别年龄识别方法、装置、设备和存储介质
本专利技术实施例涉及识别技术，尤其涉及一种基于语音的性别年龄识别方法、装置、设备和存储介质。
技术介绍
随着互联网的发展，产品销售方式也都从线下搬到了线上，但是传统的电话销售方式被未被替代，不过也解放了人力，由人工客服转为了AI(ArtificialIntelligence，人工智能)客服，基于语义的自动电话销售已经成为行业常态，凭借其对人类语言的强大理解能力，以及海量的商品素材库，能做到实时化对不同电销客户的精准推送，大大降低获客成本，提升用户活跃度，增强变现能力。电话销售始于预先准备的电销名单，名单相当于用户画像，存在该用户的性别、年龄、喜好等等先验知识，但是现实中存在更换手机号、接听电话的非本人等情况，用户画像就会失效。比如公司对A的画像显示性别为女，自动电销就会为其推送女性化妆用品、生理用品等适合女性的产品，可是A早就注销了这个手机号，现在这个手机号被B买到了，不幸的是B为男性，那么如果仍旧按照之前的画线推送女性用品，必将是一次失败的销售，因此对用户的画像修正的需求大大提高，而为了修正用户画像需要能够快速的实时重新获取用户画像，即用户的年龄和性别。为了实时获取用户画像，可以采用声音识别的方式，现有技术中采用了传统的MFCC(MelFrequencyCepstrumCoefficient，梅尔频率倒谱系数)特征，训练GMM-UBM(GaussianMixtureMode-UniversalBackgroundModel，高斯混合模型-联合背景模型...

【技术保护点】
1.一种基于语音的性别年龄识别方法，其特征在于，包括：/n获取目标用户发出的语音信号；/n将所述语音信号转换为声纹特征图；/n将所述声纹特征图输入至预先训练好的年龄识别神经网络模型以得到所述目标用户的识别年龄，并将所述声纹特征图输入至预先训练好的性别识别神经网络模型以得到所述目标用户的识别性别。/n

【技术特征摘要】
1.一种基于语音的性别年龄识别方法，其特征在于，包括：
获取目标用户发出的语音信号；
将所述语音信号转换为声纹特征图；
将所述声纹特征图输入至预先训练好的年龄识别神经网络模型以得到所述目标用户的识别年龄，并将所述声纹特征图输入至预先训练好的性别识别神经网络模型以得到所述目标用户的识别性别。

2.根据权利要求1所述的方法，其特征在于，所述将所述语音信号转换为声纹特征图包括：
将所述语音信号分解为谐波信号和冲击波信号；
将所述语音信号、谐波信号和冲击波信号分别转换为第一梅尔能量谱图、第二梅尔能量谱图和第三梅尔能量谱图；
将所述第一梅尔能量谱图、第二梅尔能量谱图和第三梅尔能量谱图进行折叠以得到声纹特征图。

3.根据权利要求1所述的方法，其特征在于，所述将所述声纹特征图输入至预先训练好的年龄识别神经网络模型以得到所述目标用户的识别年龄，并将所述声纹特征图输入至预先训练好的性别识别神经网络模型以得到所述目标用户的识别性别之后包括：
基于所述识别年龄和所述识别性别对预设用户画像进行修正。

4.根据权利要求3所述的方法，其特征在于，所述基于所述识别年龄和所述识别性别对预设用户画像进行修正之后包括：
基于修正后的预设用户画像调整针对所述目标用户的通话语音类型。

5.一种基于语音的性别年龄识别装置，其特征在于，包括：
信号获取模块，用于获取目标用户发出的语音信号；...

【专利技术属性】
技术研发人员：杨楠，
申请(专利权)人：深圳市卡牛科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人