基于强化学习算法的动态陈列调整方法及系统技术方案

技术编号:42596708 阅读:43 留言:0更新日期:2024-09-03 18:09
本发明专利技术提供一种基于强化学习算法的动态陈列调整方法及系统,涉及动态陈列技术领域,包括获取目标场所的历史数据,并按照时间序列进行排序,基于因果表示学习构建销售预测模型,通过因果驱动的预测算法得到销售预测值;构建商品关联模型,基于预设的不同商品之间的关联规则,通过计算商品相似度,确定互补关系和替代关系,计算商品推荐得分;以商品的当前陈列数据为基础,确定状态空间;基于商品的陈列动作,确定动作空间;确定奖励函数,构建动态陈列模型;确定待调整的状态特征,输入动态陈列模型,通过计算动作的概率分布,结合探索衰减因子和软化因子,从动作空间中选择最优动作,确定最优动态陈列策略,进行陈列调整。

【技术实现步骤摘要】

本专利技术涉及动态陈列,尤其涉及一种基于强化学习算法的动态陈列调整方法及系统


技术介绍

1、物品的陈列方式对人的行为有着重要的影响,通常采用固定的布局和规则,缺乏灵活性和适应性。随着偏好的不断变化和环境的快速演变,静态的陈列方式难以满足需求和提升用户体验。

2、在现有技术中,一些陈列优化方法主要依赖于人工经验和数据分析,通过销售数据分析和人工调整来优化物品摆放位置和数量。然而,这些方法通常是离线进行的,无法实时响应人们行为的变化,且优化效果有限;尝试应用机器学习算法,如关联规则挖掘和协同过滤,来发现商品之间的关联性和顾客的偏好,从而优化商品推荐和陈列。但是这些方法主要基于历史数据,缺乏对未来销售趋势的预测能力,且难以适应动态变化的环境。

3、综上所述,亟需一种能够动态适应变化,综合考虑多个目标,并能持续优化商品陈列策略的方法,本专利技术能够解决现有技术中的问题。


技术实现思路

1、本专利技术实施例提供一种基于强化学习算法的动态陈列调整方法及系统,能够解决现有技术中的问题。

...

【技术保护点】

1.基于强化学习算法的动态陈列调整方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,基于因果表示学习构建销售预测模型,通过因果驱动的预测算法得到销售预测值包括:

3.根据权利要求1所述的方法,其特征在于,构建商品关联模型,基于预设的不同商品之间的关联规则,通过计算商品相似度,确定互补关系和替代关系,计算商品推荐得分包括:

4.根据权利要求1所述的方法,其特征在于,基于所述状态空间,确定待调整的状态特征,输入动态陈列模型,通过计算动作的概率分布,结合探索衰减因子和软化因子,从动作空间中选择最优动作,确定最优动态陈列策略包括:

...

【技术特征摘要】

1.基于强化学习算法的动态陈列调整方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,基于因果表示学习构建销售预测模型,通过因果驱动的预测算法得到销售预测值包括:

3.根据权利要求1所述的方法,其特征在于,构建商品关联模型,基于预设的不同商品之间的关联规则,通过计算商品相似度,确定互补关系和替代关系,计算商品推荐得分包括:

4.根据权利要求1所述的方法,其特征在于,基于所述状态空间,确定待调整的状态特征,输入动态陈列模型,通过计算动作的概率分布,结合探索衰减因子和软化因子,从动作空间中选择最优动作,确定最优动态陈列策略包括:

【专利技术属性】
技术研发人员:刘勇
申请(专利权)人:深圳市秦丝科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1