构建用户画像标签的方法及其系统技术方案

技术编号:23085002 阅读:30 留言:0更新日期:2020-01-11 01:07
本申请公开了一种构建用户画像标签的方法及其系统。该方法包括:获取包括多个用户特征的用户特征库;获取被预先标定用户画像标签的样本数据的样本集合,根据样本集合中的样本数据计算用户特征的稳定性指标和有效性指标;根据稳定性指标和有效性指标从用户特征库中选择N个用户特征;使用样本集合中样本数据的N个用户特征在机器学习模型中进行有监督训练;将非样本数据的N个用户特征输入训练好的机器学习模型,机器学习模型输出非样本数据的用户画像标签。

The method and system of constructing user portrait label

【技术实现步骤摘要】
构建用户画像标签的方法及其系统
本说明书涉及大数据

技术介绍
用户画像是通过数据对用户进行精准的刻画,包括用户的基本信息、社会属性、行为信息、关系信息、地理位置信息等。一个用户画像包括多个用户画像标签(本说明书中有时简称为标签)。标签的例子包括:年龄段,性别,是否有房,是否有车,是否有孩子等。例如,一个用户的用户画像可以包括以下标签:35-40岁、男性、有房、无车、有孩子。用户画像是互联网公司的基础数据资产,是营销、风控等业务的数据底盘。用户画像一般包括成百上千的标签,传统的用户画像标签通过人工一个一个开发,比较耗时耗力,如何批量快速构建用户画像标签是互联网公司面临的重要问题。
技术实现思路
本说明书提供了一种构建用户画像标签的方法及其系统,可以批量自动地快速构建用户画像标签。本申请公开了一种构建用户画像标签的方法,包括:获取包括多个用户特征的用户特征库;获取被预先标定用户画像标签的样本数据的样本集合,根据所述样本集合中的样本数据计算所述用户特征的稳定性指标和有效性指标;根据本文档来自技高网...

【技术保护点】
1.一种构建用户画像标签的方法,包括:/n获取包括多个用户特征的用户特征库;/n获取被预先标定用户画像标签的样本数据的样本集合,根据所述样本集合中的样本数据计算所述用户特征的稳定性指标和有效性指标;/n根据所述稳定性指标和所述有效性指标从所述用户特征库中选择N个用户特征,其中N为大于1的整数;/n使用所述样本集合中样本数据的所述N个用户特征在机器学习模型中进行有监督训练;/n将非样本数据的所述N个用户特征输入训练好的所述机器学习模型,所述机器学习模型输出所述非样本数据的用户画像标签。/n

【技术特征摘要】
1.一种构建用户画像标签的方法,包括:
获取包括多个用户特征的用户特征库;
获取被预先标定用户画像标签的样本数据的样本集合,根据所述样本集合中的样本数据计算所述用户特征的稳定性指标和有效性指标;
根据所述稳定性指标和所述有效性指标从所述用户特征库中选择N个用户特征,其中N为大于1的整数;
使用所述样本集合中样本数据的所述N个用户特征在机器学习模型中进行有监督训练;
将非样本数据的所述N个用户特征输入训练好的所述机器学习模型,所述机器学习模型输出所述非样本数据的用户画像标签。


2.如权利要求1所述的构建用户画像标签的方法,其中,所述稳定性指标为群体稳定性指标,所述有效性指标为信息价值。


3.如权利要求2所述的构建用户画像标签的方法,其中,所述根据所述稳定性指标和所述有效性指标从所述用户特征库中选择N个用户特征,进一步包括:
从所述用户特征库的用户特征中选择群体稳定性指标值大于预定门限且信息价值的值排名前N的用户特征。


4.如权利要求1所述的构建用户画像标签的方法,其中,所述使用所述样本集合中样本数据的所述N个用户特征在机器学习模型中进行有监督训练,包括:
预先为所述机器学习模型的至少一个超参数设置多个选项;
根据所述多个选项建立超参数不同的多个机器学习模型;
将所述样本集合中样本数据的所述N个用户特征和标签分别输入到所述多个机器学习模型中进行有监督训练;
从所述多个机器学习模型中选择一个训练效果最好的,作为最终使用的机器学习模型。


5.如权利要求4所述的构建用户画像标签的方法,其中,所述机器学习模型是包括以下任一:随机森林模型、xgboost、lightGBM、深度神经网络模型。


6.如权利要求1所述的构建用户画像标签的方法,其中,所述用户特征库中的用户特征是根据历史累积的业务数据预先构建的通用用户特征。


7.如权利要求1所述的构建用户画像标签的方法,其中,构建多个不同的用户画像标签时使用同一个所述用户特征库。


8.一种构建用户画像标签的系统,包括:
存储用户特征库的存储器,该用户特征库包括多个用户特征;
存储样本集合的存储器,该样...

【专利技术属性】
技术研发人员:于兴彬温亿明
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1