【技术实现步骤摘要】
点击率预估方法及其系统、计算机系统及计算机可读介质
本公开涉及个性化推荐领域,更具体地,涉及一种点击率预估方法及其系统,计算机系统及计算机可读介质。
技术介绍
随着大数据、人工智能技术的发展,“千人千面”应运而生,即为每一位用户推荐的商品是根据该用户的历史行为预测的,认为用户会感兴趣的商品。计算用户对圈定范围内的商品的点击概率的点击率预估是一种实现这个目的的机器学习方法,其中点击概率值大的商品会被判定为用户会点击的商品。在点击率预估领域,一种方法是构建用户-商品的交互矩阵(交互指浏览,点击,加购,购买等行为),通过矩阵分解对矩阵中的缺失值进行填充,得到用户对商品的预测评分从而实现推荐。在实现本公开构思的过程中,专利技术人发现相关技术中至少存在以下缺陷:点击率预估方法缺乏可解释性,阻碍前台运营人员和中台技术人员之间的沟通,导致技术人员无法解释推荐商品的逻辑性。针对相关技术中的上述问题,目前还未提出有效的解决方案。公开内容有鉴于此,本公开提供了一种点击率预估方法、一种点击率预估系统、一种计 ...
【技术保护点】
1.一种点击率预估方法,包括:/n基于目标用户的第一属性和目标对象的第二属性,构建多组训练样本,其中,所述第一属性包括所述目标用户的固有属性和针对所述目标对象的操作数据;/n针对所述多组训练样本,构建多个集成树模型,其中,各集成树模型与所述多组训练样本中的各组训练样本一一对应;/n将所述各组训练样本分别输入至对应的集成树模型,以得到多个点击率中间预估结果;以及/n将所述多个点击率中间预估结果输入至逻辑回归模型,以得到点击率最终预估结果。/n
【技术特征摘要】
1.一种点击率预估方法,包括:
基于目标用户的第一属性和目标对象的第二属性,构建多组训练样本,其中,所述第一属性包括所述目标用户的固有属性和针对所述目标对象的操作数据;
针对所述多组训练样本,构建多个集成树模型,其中,各集成树模型与所述多组训练样本中的各组训练样本一一对应;
将所述各组训练样本分别输入至对应的集成树模型,以得到多个点击率中间预估结果;以及
将所述多个点击率中间预估结果输入至逻辑回归模型,以得到点击率最终预估结果。
2.根据权利要求1所述的方法,其中,所述基于目标用户的第一属性和目标对象的第二属性,构建多组训练样本包括:
基于目标用户的第一属性和目标对象的第二属性,构建多个训练特征组;
获取初始训练样本;以及
基于所述多个训练特征组,拆分所述初始训练样本,以构建多组训练样本,其中,所述多组训练样本中的各组训练样本与所述多个训练特征组中的各训练特征组一一对应。
3.根据权利要求2所述的方法,其中,所述多个训练特征组包括用户画像特征组、对所述目标用户与所述目标对象之间的关联加以表征的特征组、对象画像特征组和对所述目标用户与所述品类之间的关联加以表征的特征组中的至少一个,所述基于目标用户的第一属性和目标对象的第二属性,构建多个训练特征组包括:
基于所述第一属性中包括的固有属性,构建所述目标用户的用户画像特征组;
基于所述第一属性中包括的所述操作数据,构建对所述目标用户与所述目标对象之间的关联加以表征的特征组;
基于所述第二属性,构建所述目标对象的对象画像特征组;
基于所述第二属性,获取所述目标对象所属品类的品类属性;
基于所述品类属性,构建对所述目标用户与所述品类之间的关联加以表征的特征组。
4.根据权利要求1所述的方法,其中,所述方法还包括:
针对所述多个集成树模型,确定各集成树模型对应的初始权重值;以及
基于所述初始权重值,构建所述逻辑回归模型,以使得所述逻辑回归模型基于所述多个点击率中间预估结果生成所述点击率最终预估结果。
5.根据权利要求4所述的方法,其中,所述方法还包括:
基于所述点击率最终预估结果,调整所述初始权重值,以确定所述各集成树模型对应的当前权重值;以及
基于所述当前权重值,更新所述逻辑回归模型。
6.一种点击率预估系统,包括:
第一构建模块,被配置为基于目标用户的第一属性和目标对象的第二属性,构建多组训练样本,其中,所述第一属性包括所述目标用户的固有属性和针对所述目标对象的操作数据;
第二构建模块,被配置为针对所述多组训练样本,构建多个集成树模型...
【专利技术属性】
技术研发人员:吴远安,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。