目标人群挖掘方法、装置、服务器及可读存储介质制造方法及图纸

技术编号:19905141 阅读:48 留言:0更新日期:2018-12-26 03:26
本说明书实施例提供了一种目标人群挖掘方法,采用两级(弱分类器和强分类器)的分类方式,可针对大量用户数据做到较为精准的挖掘;而且,通过从待识别用户集中筛选出初级目标用户集,可缩小识别的范围,另外,根据目标人群的共通性确定出的目标人群特征向量,可准确的描述目标人群的特征,使得识别结果较为精准。

【技术实现步骤摘要】
目标人群挖掘方法、装置、服务器及可读存储介质
本说明书实施例涉及机器学习
,尤其涉及一种目标人群挖掘方法、装置、服务器及可读存储介质。
技术介绍
随着互联网及智能终端的普及,人们越来越依赖手机等智能终端进行生活及工作相关事务,例如,相较于传统金融、购物等,人们更加普遍采用各类专门APP或网站进行网上操作或交易。为了向用户提供更加有针对性的服务,各类APP或网站需要进行特定的目标人群挖掘,从而可推广业务,以及提高服务精准度。
技术实现思路
本说明书实施例提供及一种目标人群挖掘方法、装置、服务器及可读存储介质。第一方面,本说明书实施例提供一种目标人群挖掘方法,包括:针对待识别用户集,根据用户自然属性信息及用户社会属性信息,筛选出初级目标用户集;针对所述初级目标用户集,提取出目标人群特征向量;针对所述目标人群特征向量,基于预先训练的第一级弱分类器进行识别,得到中级目标用户集;针对所述中级目标用户集,基于预先训练的第二级强分类器进行识别,确定出属于目标人群的终极目标用户集。第二方面,本说明书实施例提供一种目标人群挖掘方法,包括:针对待识别用户集,根据用户自然属性信息及用户社会属性信息,筛选本文档来自技高网...

【技术保护点】
1.一种目标人群挖掘方法,包括:针对待识别用户集,根据用户自然属性信息及用户社会属性信息,筛选出初级目标用户集;针对所述初级目标用户集,提取出目标人群特征向量;针对所述目标人群特征向量,基于预先训练的第一级弱分类器进行识别,得到中级目标用户集;针对所述中级目标用户集,基于预先训练的第二级强分类器进行识别,确定出属于目标人群的终极目标用户集。

【技术特征摘要】
1.一种目标人群挖掘方法,包括:针对待识别用户集,根据用户自然属性信息及用户社会属性信息,筛选出初级目标用户集;针对所述初级目标用户集,提取出目标人群特征向量;针对所述目标人群特征向量,基于预先训练的第一级弱分类器进行识别,得到中级目标用户集;针对所述中级目标用户集,基于预先训练的第二级强分类器进行识别,确定出属于目标人群的终极目标用户集。2.根据权利要求1所述的方法,所述方法还包括:训练所述第一级弱分类器及所述第二级强分类器:获取目标人群的正样本,并获取未打标样本;对于所述正样本及所述未打标样本,提取出目标人群特征向量;基于根据所述正样本及所述未打标样本提取出的目标人群特征向量,训练第一级弱分类器;使用所述第一级弱分类器对所述未打标样本进行分类,确定出目标人群的负样本;基于所述正样本以及所述负样本,训练第二级强分类器。3.根据权利要求1或2所述的方法,所述初级目标用户集或未打标样本的获取方式为:根据用户年龄信息以及用户活动区域信息,确定出初级目标用户集或未打标样本。4.根据权利要求所述1或2所述的方法,所述提取出目标人群特征向量,包括:针对所述初级目标用户集,或所述正样本及所述未打标样本,提取出用户的静态特征及动态特征;由所述静态特征及动态特征构成所述目标人群特征向量。5.根据权利要求4所述的方法,所述静态特征包括:用户年龄、用户家乡城市、用户在线余额中的一项或多项,所述动态特征包括:用户特定时间段内针对特定区域的网络链接信息、用户特定时间段内新增好友、用户地址、LBS信息中的一项或多项。6.根据权利要求5所述的方法,所述用户特定时间段内针对特定区域的网络链接信息的获取方式为:确定已标记为目标人群的用户网络链接信息为所述针对特定区域的网络链接信息;统计所述用户在特定时间内针对所述特定区域的网络链接信息。7.根据权利要求1或2所述的方法,所述第一级弱分类器应用的算法包括朴素贝叶斯、逻辑回归、boost中的一项,所述第二级强分类器应用的算法包括支持向量机、深度神经网络、梯度提升决策树、xgboost中的一项。8.一种目标人群挖掘方法,包括:针对待识别用户集,根据用户自然属性信息及用户社会属性信息,筛选出初级目标用户集;针对所述初级目标用户集,提取出目标人群特征向量;针对所述目标人群特征向量,基于预先训练的强分类器进行识别,确定出属于目标人群的终极用户集。9.根据权利要求8所述的方法,所述方法还包括:训练所述强分类器:获取目标人群的正样本,并获取未打标样本;从所述未打标样本中选取出预置比例的样本作为负样本;对于所述正样本及所述负样本,提取出目标人群特征向量;基于根据所述正样本及所述负样本提取出的目标人群特征向量,训练强分类器。10.根据权利要求8或9所述的方法,所述初级目标用户集或未打标样本的获取方式为:根据用户年龄信息、用户活动区域信息、用户特定时间段内针对特定区域的网络链接次数、用户特定时间段内新增好友数量、用户地址是否属于特定区域中的一项或多项,确定出初级目标用户集或未打标样本。11.根据权利要求所述8或9所述的方法,所述提取出目标人群特征向量,包括:针对所述初级目标用户集,或所述正样本及所述负样本,提取出用户的静态特征及动态特征;由所述静态特征及动态特征构成所述目标人群特征向量。12.根据权利要求11所述的方法,所述静态特征包括:用户年龄、用户家乡城市、用户在线余额中的一项或多项,所述动态特征包括:用户特定时间段内针对特定区域的网络链接信息、用户特定时间段内新增好友、用户地址、LBS信息中的一项或多项。13.根据权利要求12所述的方法,所述用户特定时间段内针对特定区域的网络链接信息的获取方式为:确定已标记为目标人群的用户网络链接信息为所述针对特定区域的网络链接信息;统计所述用户在特定时间内针对所述特定区域的网络链接信息。14.根据权利要求8或9所述的方法,所述强分类器应用的算法包括支持向量机、深度神经网络、梯度提升决策树、xgboost中的一项。15.一种目标人群挖掘装置,包括:初级目标用户集筛选单元,用于针对待识别用户集,根据用户自然属性信息及用户社会属性信息,筛选出初级目标用户集;目标人群特征向量提取单元,用于针对...

【专利技术属性】
技术研发人员:王思萌王盛顾进杰
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1