【技术实现步骤摘要】
本专利技术涉及人工智能领域,特别是一种推理模型训练方法和设备。
技术介绍
1、运筹优化问题,尤其是组合优化问题在现实生产生活中广泛存在。同一大类问题的不同子问题往往包含不同的约束,即使单个约束的不同也会导致问题解空间的剧烈变化,因此存在通用性较差、速度较慢以及求解质量不高的问题。
技术实现思路
1、有鉴于此,本专利技术实施例提供了一种推理模型训练方法和设备,能够提高解决同一类优化问题下不同组合约束子问题的通用性、速度、求解质量。
2、第一方面,本专利技术实施例提供了一种推理模型训练方法,所述方法包括:
3、根据第一约束问题集合,确定第一约束共享向量;
4、基于所述第一约束问题集合和所述第一约束共享向量,采用多任务学习的方式训练与所述第一约束问题集合关联的第一约束问题数据集合得到推理模型。
5、本申请实施例基于同一大类优化问题下,不同子问题本质上是不同约束的组合,采用约束共享的思想,根据约束问题集合得到约束共享向量,并基于多任务学习框架,实现离
...【技术保护点】
1.一种推理模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述采用多任务学习的方式训练与所述第一约束问题集合关联的第一约束问题数据集合得到推理模型之后,还包括:
3.根据权利要求1所述的方法,其特征在于,所述第一约束问题集合包含至少一个第一约束,所述第一约束共享向量包含至少一个第一元素;
4.根据权利要求2所述的方法,其特征在于,所述第二约束问题集合包含至少一个第二约束,所述第二约束共享向量包含至少一个第二元素;所述第二约束共享向量中所述第二元素的数量和所述第一约束共享向量中第一元素的数量相同;
5.根...
【技术特征摘要】
1.一种推理模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述采用多任务学习的方式训练与所述第一约束问题集合关联的第一约束问题数据集合得到推理模型之后,还包括:
3.根据权利要求1所述的方法,其特征在于,所述第一约束问题集合包含至少一个第一约束,所述第一约束共享向量包含至少一个第一元素;
4.根据权利要求2所述的方法,其特征在于,所述第二约束问题集合包含至少一个第二约束,所述第二约束共享向量包含至少一个第二元素;所述第二约束共享向量中所述第二元素的数量和所述第一约束共享向量中第一元素的数量相同;
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述基于所述第一约束问题集合和所述第一约束共享向量,采用多任务学习的方式训练与所述第一约束问题集合关联的第一约束问题数据集合得到推理模型,包括:
6.根据权利要求5所述的方法,其特征在于,所述基于所述下一个动作的执行概率和所述第一约束问题集合,通过大规模语言模型对全部动作空间进行动作空间过滤,得到第二可行动作空间,包括:
7.根...
【专利技术属性】
技术研发人员:童夏良,袁明轩,柳斐,张青富,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。