数据驱动的组合决策模型参数更新方法和系统技术方案

技术编号:41802828 阅读:27 留言:0更新日期:2024-06-24 20:24
本公开提供一种数据驱动的组合决策模型参数更新方法和系统,包括:获得离线数据集,根据离线数据集对初始组合决策模型的当前模型参数进行迭代优化,得到满足预设结束迭代优化条件的目标模型参数,在第i次迭代优化中包括:根据离线数据集和第i次模型参数确定约束违反程度,并根据约束违反程度和离线数据集确定第i+1次模型参数,即提供了一种非梯度法对初始组合决策模型的模型参数进行更新的方法和系统,避免了相关技术中基于梯度法更新造成的收敛效率低的弊端,提高了模型参数更新的效率,且通过结合离线数据集中的历史组合决策相关信息确定约束违反程度,以使得目标组合决策模型的约束违反程度满足全局约束需求,从而提高组合决策的有效性和可靠性。

【技术实现步骤摘要】

本说明书涉及人工智能,尤其涉及一种数据驱动的组合决策模型参数更新方法和系统


技术介绍

1、primal-dual框架主要包括两部分内容:1)离线更新模型参数、2)固定模型参数进行在线决策。

2、其中,在部分1)中,标准框架通常采用梯度法(梯度下降或梯度上升法)更新对偶变量。

3、然而,在带有子模性质的在线组合决策场景中,次模组合优化存在梯度信息稀疏现象,导致梯度法收敛缓慢,在大规模数据或对模型参数迭代速度要求高的场景效率较低。

4、值得说明的是,上述相关技术的内容仅仅是专利技术人个人所知晓的信息,并不代表上述信息在本公开申请日之前已经进入公共领域,也不代表其可以成为本公开的现有技术。


技术实现思路

1、本公开提供一种数据驱动的组合决策模型参数更新方法和系统,用以避免上述技术问题。

2、第一方面,本公开提供一种数据驱动的组合决策模型参数更新方法,所述方法应用于具有子模性质和全局约束的组合决策场景,所述方法包括:

3、获得离线数据集,所述离线数据集用于本文档来自技高网...

【技术保护点】

1.一种数据驱动的组合决策模型参数更新方法,其特征在于,所述方法应用于具有子模性质和全局约束的组合决策场景,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述约束违反程度和所述离线数据集确定第i+1次模型参数,包括:

3.根据权利要求2所述的方法,其特征在于,所述第i次模型参数包括待更新分量和非更新分量;所述基于闭式解对所述离线数据集进行计算,得到阈值边界点集,包括:

4.根据权利要求3所述的方法,其特征在于,所述离线数据集中包括多个历史决策请求、以及与各历史决策请求各自对应的历史候选元素;所述确定在所述非更新分量固定的情况下,与所...

【技术特征摘要】

1.一种数据驱动的组合决策模型参数更新方法,其特征在于,所述方法应用于具有子模性质和全局约束的组合决策场景,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述约束违反程度和所述离线数据集确定第i+1次模型参数,包括:

3.根据权利要求2所述的方法,其特征在于,所述第i次模型参数包括待更新分量和非更新分量;所述基于闭式解对所述离线数据集进行计算,得到阈值边界点集,包括:

4.根据权利要求3所述的方法,其特征在于,所述离线数据集中包括多个历史决策请求、以及与各历史决策请求各自对应的历史候选元素;所述确定在所述非更新分量固定的情况下,与所述待更新分量对应的阈值边界点集,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述待更新分量和所述预设数量条收益线确定与所述当前决策请求对应的阈值边界点,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述各收益线和各收益值确定与所述当前决策请求对应的阈值边界点,包括:

7.根据权利要...

【专利技术属性】
技术研发人员:钱鸿卢星宇吴宇鹏朱志博周爱民周俊
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1