【技术实现步骤摘要】
基于标签分布的年龄预测方法、装置、设备及存储介质
[0001]本申请涉及人工智能
,特别是涉及一种基于标签分布的年龄预测方法、装置、设备及存储介质。
技术介绍
[0002]随着人工智能技术的发展,智能语音交互设备越来越普及,如音箱、故事机等。使用音箱或故事机等智能语音交互设备的,可能是儿童,也可能是成人,还可能是老人等,对于不同年龄类别(儿童、成人等)的用户输入的语音数据即语音query,按照现有处理方式,返回的服务内容通常都是一样的。如果能够区分出用户的年龄类别,然后有针对性地返回与用户的年龄类别相对应的服务内容,无疑能够提升智能语音交互设备的智能性和趣味性。并且,其还可应用于智慧医疗,可以支持疾病辅助诊断、健康管理等功能。
[0003]目前对于说话人年龄识别问题,业内通行作法是基于分类模块或者回归模块进行模型训练。按此模块进行训练的模型,由于未充分利用年龄标签的信息(例如邻近相关性、有序性),模型的准确率较低。因为标签通常具有一定的顺序,而且具有一定的模糊性,即一个人的年龄不是一个确切的标量值,在回归和分类 ...
【技术保护点】
【技术特征摘要】
1.一种基于标签分布的年龄预测方法,其特征在于,包括:获取说话人说话时的语音信号,并对所述语音信号进行随机时长切割得到至少一段短音频,再从所述至少一段短音频中提取得到基于时间序列的至少一短音频信息,所述随机时长小于预设时长阈值;将所述至少一段音频信息转换为定长的至少一个向量信息;分别输入所述至少一个向量信息至预先训练好的年龄预测模型进行预测,得到每个预设年龄段对应的至少一个预测概率,所述年龄预测模型基于标签分布学习并结合音频样本训练得到;对每个所述预设年龄段的至少一个预测概率取均值,再将概率值最大的预测年龄段作为第一年龄预测结果。2.根据权利要求1所述的基于标签分布的年龄预测方法,其特征在于,所述获取说话人说话时的语音信号,并对所述语音信号进行随机时长切割得到至少一段短音频,再从所述至少一段短音频中提取得到基于时间序列的至少一短音频信息,所述随机时长小于预设时长阈值,包括:获取所述说话人的所述语音信号,并将所述语音信号转换为初始音频信息;将所述初始音频信息按照随机的时长切割范围进行切割,得到至少一段音频信息,所述随机的时长切割范围小于所述预设时长阈值;对所述至少一段音频信息分别进行分帧和加窗处理,再通过预设的梅尔滤波器从分帧和加窗处理后的每帧音频信息中提取音频特征,得到至少一段音频频谱;对所述至少一段音频频谱在时域维度和频域维度进行随机增强,再将增强后的所述音频频谱转换为所述基于时间序列的音频信息。3.根据权利要求1所述的基于标签分布的年龄预测方法,其特征在于,所述年龄预测模型的训练方法包括:获取预先准备的语音信号样本和对应的真实年龄,并从所述语音信号样本中提取得到基于时间序列的音频信息样本;将所述音频信息样本转换为定长的向量信息样本;将所述向量信息样本输入至待训练的所述年龄预测模型中,得到所述语音信号样本对应的预测年龄标签分布,所述预测年龄标签分布包括每个标签值对应的预测概率,所述标签值指预设年龄段中的每个年龄值;利用所述标签值和对应的所述预测概率计算得到预测年龄;基于所述预测年龄和所述真实年龄,利用预先设定好的损失函数对所述待训练的所述年龄预测模型进行反向传播更新。4.根据权利要求3所述的基于标签分布的年龄预测方法,其特征在于,所述预测年龄标签分布表示为:其中,所述是概率密度函数,x是所述向量信息样本,μ是实际年龄标签分布的方差,σ是实际年龄标签分布的均值,所述实际年龄标签分布是所述实际年龄基于预设的标签的高斯分布。
5.根据权利要求3所述的基于标签分布的年龄预测方法,其特...
【专利技术属性】
技术研发人员:郑棉洲,彭俊清,王健宗,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。