【技术实现步骤摘要】
基于Double DQN算法的产品推荐方法及装置
[0001]本专利技术涉及产品推荐
,特别是涉及基于Double DQN算法的产品推荐方法及装置。
技术介绍
[0002]本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
,并不必然构成现有技术。
[0003]近年来,随着互联网技术的快速发展,产品推荐系统迅速的发展,目前已经广泛应用于电子商务服务、理财产品推荐服务等各种服务之中。
[0004]目前的产品的推荐方法一般是基于用户信息的推荐方法,这些方法分析用户的风险偏好等数据来获得用户和产品的相似度,从而根据相似度进行相应的产品推荐。然而现存的产品推荐方法并没有充分分析用户购买过的产品本身的信息,比如产品的历史购买数据及产品的价格变化情况等,没有实现产品的精准推荐,导致产品没有被精准推荐给需要的客户。
[0005]因此在现有技术中,产品的推荐方式及装置未能进行良好的设计,无法满足用户的需求,无法提供用户满意的体验。
技术实现思路
[0006]为了解决现有技术的不足,本专利技术提供了 ...
【技术保护点】
【技术特征摘要】
1.基于Double DQN算法的产品推荐方法,其特征是,包括:获取目标用户的基本信息;对目标用户的基本信息进行处理,提取其特征;将代表目标用户基本信息的特征,输入到训练后的深度强化学习模型中,得到每个产品的预测满意度;按照预测满意度由大到小的顺序对产品进行排序,将排序后的产品推荐给目标用户;其中,深度强化学习模型,是指Double DQN算法。2.如权利要求1所述的基于Double DQN算法的产品推荐方法,其特征是,获取目标用户的基本信息;具体包括:获取目标用户的月平均收入、历史产品购买次数、历史产品购买频率、历史购买产品的风险等级和历史购买产品的价格波动数据。3.如权利要求1所述的基于Double DQN算法的产品推荐方法,其特征是,对目标用户的基本信息进行处理,提取其特征;具体包括:通过卷积神经网络进行特征提取。4.如权利要求1所述的基于Double DQN算法的产品推荐方法,其特征是,将代表目标用户基本信息的特征,输入到训练后的深度强化学习模型中,得到每个产品的预测满意度;训练步骤包括:构建训练集,所述训练集为已知产品历史购买满意度的用户基本信息;将训练集中用户基本信息进行预处理,将预处理后得到的用户基本信息状态特征和已知产品历史购买满意度作为深度强化学习模型的输入值,对该模型进行训练,得到训练后的深度强化学习模型。5.如权利要求1所述的基于Double DQN算法的产品推荐方法,其特征是,所述将训练集中用户基本信息进行预处理,具体包括:将训练集中用户的月平均收入、历史产品购买次数、历史产品购买频率、历史购买产品的风险等级和价格波动数据,均以N个时间单位进行分割,得到分割后的若干个数据s
t
,下标t表示时间点,以此来记录该状态表示的数据的时间区间;将分割后的同一个时间单位下的所有数据,均通过卷积神经网络CNN来进行特征提取,得到月平均收入特征、历史产品购买次数特征、历史产品购买频率特征、历史购买产品的风险等级特征和价格波动数据特征;将月平均收入特征、历史产品购买次数特征、历史产品购买频率特征、历史购买产品的风险等级特征和价格波动数据特征进行串联拼接,得到同一个时间单位对应的状态特征χ(s
t
),同理,得到所有时间单位下的状态特征。6.如权利要求1所述的基于Double DQN算法的产品推荐方法...
【专利技术属性】
技术研发人员:王光臣,张衡,张盼盼,王宇,潘宇光,
申请(专利权)人:山东大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。