【技术实现步骤摘要】
本专利技术涉及商品推荐,更具体的说,它涉及一种基于动态模拟器的深度强化商品推荐方法。
技术介绍
1、近年来,随着物联网、云计算等技术的迅猛发展,信息的规模开始出现爆炸式的增长,现代社会已经被大规模的数据所包围。根据互联网数据中心(internet data center,idc)统计,2019年的全球数据总量已达到42zb,而到2022年底这一项数据预计将会达到163zb,综合增长率为令人震惊的57%。随着数据量的不断增长,用户无法有效的利用如此多的信息,即产生了信息过载问题。在互联网平台中,由于用户无法快速找到自己所感兴趣的内容,信息过载问题将会严重影响用户体验,这也制约着各行各业的发展。推荐方法由此产生,推荐方法能够针对用户的不同偏好,在海量的信息中为其推荐可能感兴趣的内容,从而巨幅提升了用户对信息的利用率,减少了信息过载造成的问题。
2、研究发现,生活中的各个行业都依赖推荐方法来帮助用户对大量内容进行分类,并为其推荐所感兴趣的一小部分内容,这个问题极具挑战性,因为可以推荐的项目数量巨大。相比于搜索引擎等方法,推荐方法更
...【技术保护点】
1.一种基于动态模拟器的深度强化商品推荐方法,其特征在于:包括客户端、服务端、云端,客户端与服务端通过云端连接通信;云端会接收客户端与服务端的数据,并反馈推荐商品信息给客户端和将处理数据传输至服务端;云端包括动态模拟器和推荐智能体,其具体运作如下:
2.根据权利要求1所述的一种基于动态模拟器的深度强化商品推荐方法,其特征在于:步骤102)中,在用户u与推荐智能体RA之间的每次数据交互中,在交互时刻t,推荐智能体RA在为用户推荐一个项目商品it之后,用户会给系统一个即时反馈rt,推荐智能体根据该反馈生成新的状态st+1,并为用户推荐下一项目商品,重复该过程。
3.根...
【技术特征摘要】
1.一种基于动态模拟器的深度强化商品推荐方法,其特征在于:包括客户端、服务端、云端,客户端与服务端通过云端连接通信;云端会接收客户端与服务端的数据,并反馈推荐商品信息给客户端和将处理数据传输至服务端;云端包括动态模拟器和推荐智能体,其具体运作如下:
2.根据权利要求1所述的一种基于动态模拟器的深度强化商品推荐方法,其特征在于:步骤102)中,在用户u与推荐智能体ra之间的每次数据交互中,在交互时刻t,推荐智能体ra在为用户推荐一个项目商品it之后,用户会给系统一个即时反馈rt,推荐智能体根据该反馈生成新的状态st+1,并为用户推荐下一项目商品,重复该过程。
3.根据权利要求2所述的一种基于动态模拟器的深度强化商品推荐方法,其特征在于:整个推荐过程为一条轨迹ξ={s0,i0,r0,...,st,it,rt},推荐智能体ra的目标是将学习轨迹ξ的奖励值最大化的策略π,具体公式如下所示:
4.根据权利要求3所述的一种基于动态模拟器的深度强化商品推荐方法,其特征在于:动态模拟器通过最小化真实奖励值与预测奖励值之间的误差来进行学习,动态模拟器中的误差函数如下:
5.根据权利要...
【专利技术属性】
技术研发人员:何旭明,廖智,周国买,方勇,周建洪,陈卓,
申请(专利权)人:杭州思亿欧科技集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。