一种基于强化学习的商品折扣的确定方法及装置制造方法及图纸

技术编号:37403525 阅读:11 留言:0更新日期:2023-04-30 09:30
本申请提供了一种基于强化学习的商品折扣的确定方法及装置,该基于强化学习的商品折扣的确定方法包括:获取目标商品的历史K周的商品销售数据和N个初始商品折扣值;分别将N个初始商品折扣值确定为第K+1周至第F周的商品折扣值,其中,F为商品销售周期;基于目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值进行强化学习,得到初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,得到N个初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值;将奖励值最大的初始商品折扣值对应的商品折扣参数确定为目标商品的设置商品折扣参数。本申请能够提高商品折扣的确定效率。品折扣的确定效率。品折扣的确定效率。

【技术实现步骤摘要】
一种基于强化学习的商品折扣的确定方法及装置


[0001]本申请涉及图像处理
,具体涉及一种基于强化学习的商品折扣的确定方法及装置。

技术介绍

[0002]根据已经开发并训练好的商品调价模型,可以预测出商品在生命周期内的每周的销量。但是不同的折扣会影响预测出来的销售,所以不同折扣的组合会造就不同商品不同的销售情况。寻找最优的折扣方案可以造就最优的销售情况。但是对于某个商品而言,生命周期有30周,每一周的折扣假设有20,那就是有20的30次方种方案。很明显,使用人工的方法找出最优折扣进行设置的效率较低
[0003]现有技术中,现有技术中商品折扣的确定方法效率不高。

技术实现思路

[0004]本申请旨在提供一种基于强化学习的商品折扣的确定方法及装置,旨在解决现有技术中商品折扣的确定方法效率不高的问题。
[0005]一方面,本申请提供一种基于强化学习的商品折扣的确定方法,所述基于强化学习的商品折扣的确定方法包括:
[0006]获取目标商品的历史K周的商品销售数据和N个初始商品折扣值;
[0007]分别将N个初始商品折扣值确定为第K+1周至第F周的商品折扣值,其中,F为商品销售周期;
[0008]基于目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值进行强化学习,得到初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,得到N个初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值;
[0009]将奖励值最大的初始商品折扣值对应的商品折扣参数确定为目标商品的设置商品折扣参数。
[0010]可选地,所述基于目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值进行强化学习,得到初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,得到N个初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,包括:
[0011]将目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值输入销量预测模型,得到第K+1周的商品销量值;
[0012]将目标商品的历史K周的商品销售数据、第K+1周的商品销量值、第K+2周至第F周的商品折扣值输入销量预测模型,得到第K+2周的商品销量值;
[0013]将第一次模型输入得到的第K+1周的商品销量值至第八次模型输入得到的第K+8周的商品销量值确定为初始商品折扣值对应的商品销量参数。
[0014]可选地,所述基于目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值进行强化学习,得到初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励
值,得到N个初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,包括:
[0015]将目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值输入折扣预测模型,得到第K+2周至第F周的商品折扣值;
[0016]将目标商品的历史K周的商品销售数据、第K+1周的商品销量值、第K+2周至第F周的商品折扣值输入折扣预测模型,得到第K+3周至第F周的商品折扣值;
[0017]将第一次模型输入得到的第K+1周至第F周的商品折扣值至第八次模型输入得到的第F

14周至第F周的商品折扣值确定为初始商品折扣值对应的商品折扣参数。
[0018]可选地,所述基于目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值进行强化学习,得到初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,得到N个初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,包括:
[0019]基于商品销量参数和对应的库存值确定奖励值。
[0020]可选地,K=9,F=30。
[0021]可选地,所述获取目标商品的历史K周的商品销售数据和N个初始商品折扣值,之前,包括:
[0022]获取多个种类的商品;
[0023]将各个种类的商品分别确定为目标商品。
[0024]可选地,每周的所述商品销售数据包括年份、年第几周、折扣、周对应的季节、系列、原系列、品类、中品类、版型、销售第几周、销售数量、库存数量、周的天数。
[0025]一方面,本申请提供一种基于强化学习的商品折扣的确定装置,所述基于强化学习的商品折扣的确定装置包括:
[0026]获取单元,用于获取目标商品的历史K周的商品销售数据和N个初始商品折扣值;
[0027]第一确定单元,用于分别将N个初始商品折扣值确定为第K+1周至第F周的商品折扣值,其中,F为商品销售周期;
[0028]强化学习单元,用于基于目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值进行强化学习,得到初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,得到N个初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值;
[0029]第二确定单元,用于将奖励值最大的初始商品折扣值对应的商品折扣参数确定为目标商品的设置商品折扣参数。
[0030]可选地,所述基于目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值进行强化学习,得到初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,得到N个初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,包括:
[0031]将目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值输入销量预测模型,得到第K+1周的商品销量值;
[0032]将目标商品的历史K周的商品销售数据、第K+1周的商品销量值、第K+2周至第F周的商品折扣值输入销量预测模型,得到第K+2周的商品销量值;
[0033]将第一次模型输入得到的第K+1周的商品销量值至第八次模型输入得到的第K+8周的商品销量值确定为初始商品折扣值对应的商品销量参数。
[0034]可选地,所述基于目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值进行强化学习,得到初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励
值,得到N个初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,包括:
[0035]将目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值输入折扣预测模型,得到第K+2周至第F周的商品折扣值;
[0036]将目标商品的历史K周的商品销售数据、第K+1周的商品销量值、第K+2周至第F周的商品折扣值输入折扣预测模型,得到第K+3周至第F周的商品折扣值;
[0037]将第一次模型输入得到的第K+1周至第F周的商品折扣值至第八次模型输入得到的第F

14周至第F周的商品折扣值确定为初始商品折扣值对应的商品折扣参数。
[0038]可选地,所述基于目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值进行强化学习,得到初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,得到N个初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的商品折扣的确定方法,其特征在于,所述基于强化学习的商品折扣的确定方法包括:获取目标商品的历史K周的商品销售数据和N个初始商品折扣值;分别将N个初始商品折扣值确定为第K+1周至第F周的商品折扣值,其中,F为商品销售周期;基于目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值进行强化学习,得到初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,得到N个初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值;将奖励值最大的初始商品折扣值对应的商品折扣参数确定为目标商品的设置商品折扣参数。2.根据权利要求1所述的基于强化学习的商品折扣的确定方法,其特征在于,所述基于目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值进行强化学习,得到初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,得到N个初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,包括:将目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值输入销量预测模型,得到第K+1周的商品销量值;将目标商品的历史K周的商品销售数据、第K+1周的商品销量值、第K+2周至第F周的商品折扣值输入销量预测模型,得到第K+2周的商品销量值;将第一次模型输入得到的第K+1周的商品销量值至第八次模型输入得到的第K+8周的商品销量值确定为初始商品折扣值对应的商品销量参数。3.根据权利要求1所述的基于强化学习的商品折扣的确定方法,其特征在于,所述基于目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值进行强化学习,得到初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,得到N个初始商品折扣值对应的商品折扣参数、商品销量参数以及奖励值,包括:将目标商品的历史K周的商品销售数据和第K+1周至第F周的商品折扣值输入折扣预测模型,得到第K+2周至第F周的商品折扣值;将目标商品的历史K周的商品销售数据、第K+1周的商品销量值、第K+2周至第F周的商品折扣值输入折扣预测模型,得到第K+3周至第F周的商品折扣值;将第一次模型输入得到的第K+1周至第F周的商品折扣值至第八次模型输入得到的第F

14周至第F周的商品折扣值确定为初...

【专利技术属性】
技术研发人员:秦华东黄俊雄
申请(专利权)人:广州飞狮数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1