【技术实现步骤摘要】
一种预测用户性别画像的方法和装置
本专利技术涉及计算机
,尤其涉及一种预测用户性别画像的方法和装置。
技术介绍
近年来,随着互联网的不断发展和快速完善,流量成本越来越贵,拉新成本越来越高,老顾客忠诚度也越来越低,在这种形势下,只有精细化运营每一个客户,才能使品牌保持持续性增长。电商领域的精细化运营,指的是通过用户分群,对不同需求的用户匹配不同的服务和内容,从而满足其个性化的需求。用户画像可以从多个维度来描绘用户特征,不同的产品类型,用户画像的维度也有不同,更快速更准确的画像信息,可以帮助电商精准的定位实际用户群体。性别作为人类差异最大的特征之一,其重要性和价值性不言而喻,每个用户画像产品的构建,基本都会遇到性别标签的识别需求。用户画像的数据来源主要来自两个方面:用户的个人资料及日常行为标签的累加。对于后者,往往根据规则进行数据算法的计算从而获得用户的画像标签。在电商领域,一般将画像标签的获取分为离线画像和实时画像两部分,离线画像一般基于hadoop及hive环境,通过分析海量的用户历史行为,得到用户的画像数据。 ...
【技术保护点】
1.一种预测用户性别画像的方法,其特征在于,包括:/n从线上产生的实时数据流中提取实时行为特征;/n使用所述实时行为特征对获取的历史行为特征进行特征处理以生成训练样本;/n通过对所述训练样本进行训练以确定预测模型的模型参数,并根据所述模型参数更新所述预测模型;/n使用所述预测模型来预测用户的性别画像。/n
【技术特征摘要】
1.一种预测用户性别画像的方法,其特征在于,包括:
从线上产生的实时数据流中提取实时行为特征;
使用所述实时行为特征对获取的历史行为特征进行特征处理以生成训练样本;
通过对所述训练样本进行训练以确定预测模型的模型参数,并根据所述模型参数更新所述预测模型;
使用所述预测模型来预测用户的性别画像。
2.根据权利要求1所述的方法,其特征在于,使用所述实时行为特征对获取的历史行为特征进行特征处理以生成训练样本包括:
获取预定数量或预定时间段内的历史行为特征,并使用用户的实时行为特征中包括的物品性别对所述历史行为特征进行打标以进行特征处理,从而生成训练样本。
3.根据权利要求1所述的方法,其特征在于,通过对所述训练样本进行训练以确定预测模型的模型参数包括:
采用基于梯度的分布式批处理的方案来对所述训练样本进行训练以确定预测模型的模型参数。
4.根据权利要求3所述的方法,其特征在于,所述基于梯度的分布式批处理的方案包括:
将所述训练样本分发到多个线程中;
每个线程对所分发的训练样本进行处理以得到所分发的训练样本的梯度,其中,每个线程采用FTRL权重更新算法来计算所分发的训练样本的梯度;
对每个线程所分发的训练样本的梯度进行计算整合以实现分布式批处理。
5.一种预测用户性别画像的装置,其特征在于,包括:
特征提取模块,用于从线上产生的实时数据流中提取实时行为特征;
特征处理模块,用于使用所述实时行为特征对获取的历史行为特征进行...
【专利技术属性】
技术研发人员:李越,
申请(专利权)人:北京沃东天骏信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。