【技术实现步骤摘要】
一种信息推送方法及装置
本专利技术涉及电子商务
,特别涉及一种信息推送方法及装置。
技术介绍
在个性化商品推荐领域,目前的推荐算法包含:1、基于热度(流行度)的推荐,根据浏览量、销量、社会热点等定义热度,能有效解决冷启动问题。2、基于协同过滤推荐,仅依赖用户行为,不需要对商品特征或元数据进行深入理解。覆盖率高,能有效解决长尾问题,给用户以惊喜。3、基于内容/规则/知识推荐,依赖于完整的、充分归类的内容/规则/知识体系和结构化的数据特征。时效性高,推荐理由有较合理的解释,用户信任度高。4、基于以上推荐算法的组合,优势互补,可以规避冷启动、数据稀疏和数据非结构化问题,适用范围较广。对于现有技术,包括基于热度(流行度)的推荐、基于协同过滤推荐、基于内容/规则/知识推荐,以及这些推荐算法的组合,由于将推荐结果输出给用户展示后,并未根据用户反馈(如是否点击、是否购买等),进行推荐策略的动态调整,导致推荐效果不太理想。另外,由于没有考虑商品所特有的复购周期因素(一般来说,耐耗品的复购周期大于 ...
【技术保护点】
1.一种信息推送方法,其特征在于,该方法包括:/n获取用户信息、商品信息、用户历史行为商品序列信息;/n根据所获取的信息,采用强化学习的方法训练用户-商品兴趣模型;采用深度学习的方法训练用户-商品复购周期模型;/n当前用户进行在线访问时,查找当前用户的用户信息、商品信息、用户历史行为商品序列信息,根据用户-商品兴趣模型和用户-商品复购周期模型得到当前用户对商品列表中各商品的复购周期;/n根据当前用户的历史购买记录时间,与商品列表中各商品的复购周期进行比较,对商品列表中的非复购商品进行过滤后,得到当前用户的推荐商品列表。/n
【技术特征摘要】
1.一种信息推送方法,其特征在于,该方法包括:
获取用户信息、商品信息、用户历史行为商品序列信息;
根据所获取的信息,采用强化学习的方法训练用户-商品兴趣模型;采用深度学习的方法训练用户-商品复购周期模型;
当前用户进行在线访问时,查找当前用户的用户信息、商品信息、用户历史行为商品序列信息,根据用户-商品兴趣模型和用户-商品复购周期模型得到当前用户对商品列表中各商品的复购周期;
根据当前用户的历史购买记录时间,与商品列表中各商品的复购周期进行比较,对商品列表中的非复购商品进行过滤后,得到当前用户的推荐商品列表。
2.如权利要求1所述的方法,其特征在于,采用强化学习的方法训练用户-商品兴趣模型具体包括:
构建eval神经网络和target神经网络两个相同的神经网络,其中eval神经网络用于获取推荐商品列表以及推荐结果好坏程度的预测值,target神经网络用于完成对eval神经网络参数的更新;
初始化eval神经网络参数θQ和θμ;初始化target神经网络参数θQ′=θQ,θμ′=θμ;
将每一用户的用户信息、商品信息、用户历史行为商品序列信息,作为一条训练数据si;将(si,ai,ri,si+1)作为强化学习训练集N个样本中的第i个样本;其中,ai为第i个样本的推荐商品列表,ri为第i个样本的用户反馈,si+1为第i个样本下一状态的用户信息、商品信息、用户历史行为商品序列信息;
根据第i个样本的推荐结果好坏程度的目标值和推荐结果好坏程度的预测值,构造第一损失函数;在eval神经网络中,将第一损失函数取小值进行优化,更新eval神经网络参数θQ;
在eval神经网络中,将用户反馈的期望函数取小值进行优化,更新eval神经网络参数θμ;
根据θQ和θμ更新target神经网络的参数为θQ′和θμ′,得到训练后的用户-商品兴趣模型。
3.如权利要求1所述的方法,其特征在于,采用深度学习的方法训练用户-商品复购周期模型具体包括:
将每一用户的用户信息和用户所买商品信息作为深度学习训练集M个样本中的第i个样本,i∈M,M为自然数;
将第i个样本的用户信息和用户所买商品信息输入用户-商品复购周期模型,得到商品复购周期训练值;
根据第i个样本的商品复购周期训练值和复购周期真实值,构造第二损失函数,对第二损失函数取最小值进行优化,更新网络权值参数,得到训练后的用户-商品复购周期模型。
4.如权利要求1所述的方法,其特征在于,所述当前用户进行在线访问时,查找当前用户的用户信息、商品信息、用户历史行为商品序列信息,根据用户-商品兴趣模型和用户-商品复购周期模型得到当前用户对商品列表中各商品的复购周期,具体包括:
当前用户进行访问时,根据当前用户标识获取用户信息、商品信息、用户历史行为商品序列信息;
将所述用户信息、商品信息、用户历史行为商品序列信息输入到用户-商品兴趣模型,得到当前用户的商品列表;
将当前用户信息和商品列表中的商品信息分别输入到用户-商品复购周期模型,得到当前用户对商品列表中各商品的复购周期。
5.一种信息推送装置,其特征在于,该装置包括:
数据管理模块,用于获取用户信息、商品信息、用户历史行为商品序列信息;
模型训练模块,用于根据数据管理模块中获取的信息,采用强化学习的方法训练用户-商...
【专利技术属性】
技术研发人员:周东,雷章明,汤桢伟,兰华勇,古川,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。