用户数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:21514940 阅读:28 留言:0更新日期:2019-07-03 09:19
本公开实施例公开了一种用户数据处理方法、装置、电子设备及存储介质,方法包括:获取预设时间段内的多个用户样本数据;根据预设标注规则,获取每个用户样本数据的标注取值;根据用户画像和商户画像获取每个用户样本数据的场景特征;根据每个用户样本数据的标注取值、场景特征和预设损失函数,训练概率数据模型;根据概率数据模型确定目标用户的下单概率。该方案能够克服用户样本数据标注精确度不高的问题,在同时考虑点击行为和下单行为的情况下训练出的概率数据模型也提高了该概率数据模型的离线模型AUC和线上转化率。

User Data Processing Method, Device, Electronic Equipment and Storage Media

【技术实现步骤摘要】
用户数据处理方法、装置、电子设备及存储介质
本公开涉及信息处理
,具体涉及一种用户数据处理方法、装置、电子设备及存储介质。
技术介绍
随着互联网技术的快速发展,网络早已经成为现代人日常生活中不可或缺的部分,网络购物由于其独有的便捷性和直观性,使得越来越多的用户选择通过网络购物解决日常购物问题,该货物可以为食品、卫生用品、衣物等任何物品。目前常见的形式是用户通过用户终端,比如电脑或手机,在购物平台上搜索所需的货物,该购物平台即可向用户推荐该用户可能感兴趣的商户,即在终端的屏幕上显示该用户可能感兴趣的商户列表。用户可以通过浏览该商户列表选择目标商户进行下单行为并付款,商户接收到订单后,准备货物,包装货物,并将包装好的货物交给物流人员,最后由物流的送货人员将货物送至用户手中。
技术实现思路
本公开实施例提供一种用户数据处理方法、装置、电子设备及计算机可读存储介质。第一方面,本公开实施例中提供了一种用户数据处理方法。具体的,所述用户数据处理方法,包括:获取预设时间段内的多个用户样本数据,所述预设时间段包括多个预设时间窗口,每个所述用户样本数据包括预设时间窗口内用户在商户的多种行为;根据预设本文档来自技高网...

【技术保护点】
1.一种用户数据处理方法,其特征在于,包括:获取预设时间段内的多个用户样本数据,所述预设时间段包括多个预设时间窗口,每个所述用户样本数据包括预设时间窗口内用户在商户的多种行为;根据预设标注规则,获取每个所述用户样本数据的标注取值,所述预设标注规则为根据用户在预设时间窗口内对商户的点击行为和下单行为设置的规则;根据用户画像和商户画像获取每个用户样本数据的场景特征;根据所述每个用户样本数据的标注取值、场景特征和预设损失函数,训练概率数据模型;根据所述概率数据模型确定目标用户的下单概率。

【技术特征摘要】
1.一种用户数据处理方法,其特征在于,包括:获取预设时间段内的多个用户样本数据,所述预设时间段包括多个预设时间窗口,每个所述用户样本数据包括预设时间窗口内用户在商户的多种行为;根据预设标注规则,获取每个所述用户样本数据的标注取值,所述预设标注规则为根据用户在预设时间窗口内对商户的点击行为和下单行为设置的规则;根据用户画像和商户画像获取每个用户样本数据的场景特征;根据所述每个用户样本数据的标注取值、场景特征和预设损失函数,训练概率数据模型;根据所述概率数据模型确定目标用户的下单概率。2.根据权利要求1所述的方法,其特征在于,所述根据预设标注规则,获取每个所述用户样本数据的标注取值包括:将所述多个用户样本数据中预设时间窗口内用户在商户存在下单行为的N个用户样本数据的标注取值设置为正用户样本数据值,所述N为大于或等于0的整数;将所述多个用户样本数据除所述N个用户样本数据外的其余用户样本数据中预设时间窗口内用户在商户存在点击行为的M个用户样本数据的标注取值设置为正用户样本数据值,所述M为大于或等于0的整数;将所述多个用户样本数据除所述N个用户样本数据和所述M个用户样本数据外的其余S个用户样本数据的标注取值设置为负用户样本数据值,所述S为大于或等于0的整数。3.根据权利要求1或2所述的方法,其特征在于,所述根据用户画像和商户画像获取每个用户样本数据的场景特征包括:根据用户画像和商户画像获取每个用户样本数据包括的用户的用户特征和商户的商户特征;根据每个用户样本数据包括的用户的用户特征和商户的商户特征获取每个用户样本数据的场景特征。4.根据权利要求3所述的方法,其特征在于,所述根据所述每个用户样本数据的标注取值、场景特征和预设损失函数,训练概率数据模型包括:将所述每个用户样本数据的标注取值和每个用户样本数据的场景特征输入至概率数据模型,通过所述概率数据模型计算每个用户样本数据在其场景特征的条件下出现其标注取值的概率;将每个用户样本数据在其场景特征的条件下出现其标注取值的概率带入所述预设损失函数,计算所述概率数据模型的损失值,所述预设损失函数包括根据所述点击行为和所述下单行为设置的权重值;根据所述损失值,确定所述概率数据模型是否训练完成。5.根据权利要求4所述的方法,其特征在于,所述预设损失函数为Loss=∑(1-α*P(y|W))2;其中,所述Loss为损失值;所述α为根据用户样本数据的点击行为和下单行为设置的权重值;所述P(y|W)为每个用户样本数据在其场景...

【专利技术属性】
技术研发人员:姜谷雨
申请(专利权)人:上海拉扎斯信息科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1