【技术实现步骤摘要】
本说明书涉及人工智能,尤其涉及一种数据驱动的组合决策模型参数更新方法和系统。
技术介绍
1、primal-dual框架主要包括两部分内容:1)离线更新模型参数、2)固定模型参数进行在线决策。
2、其中,在部分1)中,标准框架通常采用梯度法(梯度下降或梯度上升法)更新对偶变量。
3、然而,在带有子模性质的在线组合决策场景中,次模组合优化存在梯度信息稀疏现象,导致梯度法收敛缓慢,在大规模数据或对模型参数迭代速度要求高的场景效率较低。
4、值得说明的是,上述相关技术的内容仅仅是专利技术人个人所知晓的信息,并不代表上述信息在本公开申请日之前已经进入公共领域,也不代表其可以成为本公开的现有技术。
技术实现思路
1、本公开提供一种数据驱动的组合决策模型参数更新方法和系统,用以避免上述技术问题。
2、第一方面,本公开提供一种数据驱动的组合决策模型参数更新方法,所述方法应用于具有子模性质和全局约束的组合决策场景,所述方法包括:
3、获得离线数据集
...【技术保护点】
1.一种数据驱动的组合决策模型参数更新方法,其特征在于,所述方法应用于具有子模性质和全局约束的组合决策场景,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述约束违反程度和所述离线数据集确定第i+1次模型参数,包括:
3.根据权利要求2所述的方法,其特征在于,所述第i次模型参数包括待更新分量和非更新分量;所述基于闭式解对所述离线数据集进行计算,得到阈值边界点集,包括:
4.根据权利要求3所述的方法,其特征在于,所述离线数据集中包括多个历史决策请求、以及与各历史决策请求各自对应的历史候选元素;所述确定在所述非更新分
...【技术特征摘要】
1.一种数据驱动的组合决策模型参数更新方法,其特征在于,所述方法应用于具有子模性质和全局约束的组合决策场景,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述约束违反程度和所述离线数据集确定第i+1次模型参数,包括:
3.根据权利要求2所述的方法,其特征在于,所述第i次模型参数包括待更新分量和非更新分量;所述基于闭式解对所述离线数据集进行计算,得到阈值边界点集,包括:
4.根据权利要求3所述的方法,其特征在于,所述离线数据集中包括多个历史决策请求、以及与各历史决策请求各自对应的历史候选元素;所述确定在所述非更新分量固定的情况下,与所述待更新分量对应的阈值边界点集,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述待更新分量和所述预设数量条收益线确定与所述当前决策请求对应的阈值边界点,包括:
6.根据权利要求5所述的方法,其特征在于,所述根据所述各收益线和各收益值确定与所述当前决策请求对应的阈值边界点,包括:
7.根据权利要...
【专利技术属性】
技术研发人员:钱鸿,卢星宇,吴宇鹏,朱志博,周爱民,周俊,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。