用户年龄信息预测方法、装置、电子设备及介质制造方法及图纸

技术编号:25551650 阅读:30 留言:0更新日期:2020-09-08 18:51
本申请提供一种用户年龄信息预测方法及装置、一种电子设备以及一种计算机可读存储介质。其中,所述方法包括:获得第一用户的第一标注信息;对所述第一用户的第一标注信息进行归类操作,获得所述第一用户的第二标注信息;根据所述第二标注信息,确定所述第一用户对应的至少一个年龄特征标签;在预设的年龄概率分布信息集合中,查询每个所述年龄特征标签分别对应的年龄概率分布信息;基于所述第一用户对应的至少一个所述年龄特征标签及对应年龄概率分布信息进行年龄偏向加权计算,预测所述第一用户所处的年龄段。本申请方案不需要用户提供年龄信息,即可准确对用户的年龄信息进行预测。

【技术实现步骤摘要】
用户年龄信息预测方法、装置、电子设备及介质
本申请涉及数据处理
,具体涉及一种用户年龄信息预测方法及装置、一种电子设备以及一种计算机可读存储介质。
技术介绍
随着互联网技术的快速发展和普及,个性化推荐已逐步成为信息服务商向用户进行信息及服务推荐的主流技术,由于不同年龄的用户对信息的偏好是有较大的区别的,因此,年龄信息可以成为个性化推荐的参考因素之一,有助于为用户提供更加精准的个性化信息推荐内容。现有技术,出于对用户隐私的保护,除非用户主动提供,否则,大部分信息提供商难以获取用户的年龄信息,也就无法根据年龄信息向用户进行信息推荐。因此,需要提供一种不需要用户提供年龄信息,即可准确对用户的年龄信息进行预测的技术方案。
技术实现思路
本申请的目的是提供一种用户年龄信息预测方法及装置、一种电子设备以及一种计算机可读存储介质。本申请第一方面提供一种用户年龄信息预测方法,包括:获得第一用户的第一标注信息;对所述第一用户的第一标注信息进行归类操作,获得所述第一用户的第二标注信息;...

【技术保护点】
1.一种用户年龄信息预测方法,其特征在于,包括:/n获得第一用户的第一标注信息;/n对所述第一用户的第一标注信息进行归类操作,获得所述第一用户的第二标注信息;/n根据所述第二标注信息,确定所述第一用户对应的至少一个年龄特征标签;/n在预设的年龄概率分布信息集合中,查询每个所述年龄特征标签分别对应的年龄概率分布信息,所述年龄概率分布信息包括所述年龄特征标签对应在各个年龄段的分布概率;/n基于所述第一用户对应的至少一个所述年龄特征标签及对应年龄概率分布信息进行年龄偏向加权计算,预测所述第一用户所处的年龄段。/n

【技术特征摘要】
1.一种用户年龄信息预测方法,其特征在于,包括:
获得第一用户的第一标注信息;
对所述第一用户的第一标注信息进行归类操作,获得所述第一用户的第二标注信息;
根据所述第二标注信息,确定所述第一用户对应的至少一个年龄特征标签;
在预设的年龄概率分布信息集合中,查询每个所述年龄特征标签分别对应的年龄概率分布信息,所述年龄概率分布信息包括所述年龄特征标签对应在各个年龄段的分布概率;
基于所述第一用户对应的至少一个所述年龄特征标签及对应年龄概率分布信息进行年龄偏向加权计算,预测所述第一用户所处的年龄段。


2.根据权利要求1所述的方法,其特征在于,所述获得第一用户的第一标注信息,包括:
获取第一用户的社交账号在第二用户通讯录中的至少一条自定义标注信息;
对获取的所述自定义标注信息进行精确标注的去重操作,获得所述第一用户的第一标注信息。


3.根据权利要求2所述的方法,其特征在于,所述对获取的所述自定义标注信息进行精确标注的去重操作,获得所述第一用户的第一标注信息,包括:
对获取的所述自定义标注信息进行分词处理,得到多个标注分词;
根据预设的数据清洗规则,对所述多个标注分词进行数据清洗,得到所述第一用户对应的标准标注分词;
对所述标准标注分词进行去重操作,获得所述第一用户的第一标注信息。


4.根据权利要求1所述的方法,其特征在于,所述在预设的年龄概率分布信息集合中,查询每个所述年龄特征标签分别对应的年龄概率分布信息之前,还包括:
获得样本数据,所述样本数据包括多个样本用户的社交账号在其他用户通讯录中的自定义标注信息,以及所述多个样本用户的实际年龄信息;
根据所述自定义标注信息确定每个所述样本用户对应的年龄特征标签;
根据所有所述样本用户的实际年龄信息与所述年龄特征标签之间的对应关系,生成年龄概率分布信息集合,所述年龄概率信息集合包括每个所述年龄特征标签对应的年龄概率分布信息。


5.根据权利要求4所述的方法,其特征在于,所述根据所述自定义标注信息确定每个所述样本用户对应的年龄特征标签,包括:
对每个所述样本用户对应的所述自定义标注信息进行分词处理,得到多个标注分词;
根据预设的数据清洗规则,对所述多个标注分词进行数据清洗,得到每个所述样本用户对应的标准标注分词;
对所述标准标注分词进行去重操作,获得每个所述样本用户对应的第一标注信息;
对每个所述样本用户对应的第一标注信息进行归类操作,获得每个所述样本用户对应的第二标注信息;
基于预设的第二标注信息与年龄特征标签之间的映射关系,根据每个所述样本用户对应的所述第二标注信息确定每个所述样本用户对应的年龄特征标签。


6.根据权利要求3或5所述的方法,其特征在于,所述根据预设的数...

【专利技术属性】
技术研发人员:许文龙
申请(专利权)人:上海连尚网络科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1