一种资源分配系统的训练方法、装置及设备制造方法及图纸

技术编号:33071630 阅读:24 留言:0更新日期:2022-04-15 10:06
本发明专利技术公开了一种资源分配系统的训练方法、装置及设备,其中,所述方法包括:封装第一算法和第一仿真引擎,得到初始模型的第一执行程序;基于所述初始模型运行所述第一执行程序,生成至少一组态势数据;针对所述至少一组态势数据中的每一组态势数据执行训练操作,直到所述至少一组态势数据对应的执行结果均满足相应条件,得到所述资源分配系统。通过上述方式,本发明专利技术建立了一个可扩展可复用的资源分配系统,该资源分配系统能够实现多目标多资源动态分配的智能决策。动态分配的智能决策。动态分配的智能决策。

【技术实现步骤摘要】
一种资源分配系统的训练方法、装置及设备


[0001]本专利技术涉及人工智能
,具体涉及一种资源分配系统的训练方法、装置及设备。

技术介绍

[0002]多目标多资源分配(MOMRA)问题的核心是:短时间内需给出正确可靠的分配方案。但由于受到算法性能以及MOMRA环境复杂的约束,对多目标多资源分配问题的研究往往局限于静态、小规模场景。而多目标多资源动态分配(MOMRDA)问题是对多目标多资源分配(MOMRA)问题的重复,其复杂性随决策次数增加呈指数增长。
[0003]针对MOMRDA问题,学者提出通过专家系统知识库评估目标态势,然后利用启发式算法计算分配资源数量,总结出相应的规则来解决MOMRDA问题。但传统的专家系统存在逻辑单一,结构简单,知识库内容固定,可复用性差等缺点,且专家系统主要应用于推理、计划等前期预测活动,难以处理预期外情形。同时启发式算法又需要较长时间来获得优化后的分配方案,且处理的问题规模也有限,难以满足多目标的要求。
[0004]鉴于MOMRDA问题,如果对每一个环境都建立一个分配系统,将是一个非常繁重的工本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种资源分配系统的训练方法,其特征在于,所述方法包括:封装第一算法和第一仿真引擎,得到初始模型的第一执行程序;基于所述初始模型运行所述第一执行程序,生成至少一组态势数据;针对所述至少一组态势数据中的每一组态势数据执行以下训练操作,直到所述至少一组态势数据对应的执行结果均满足相应条件,得到所述资源分配系统,所述资源分配系统适配任意执行程序,所述任意执行程序通过封装第二算法和第二仿真引擎得到,所述第一算法和所述第二算法均是预设算法库中的任意算法,所述第一仿真引擎所述第二仿真引擎均是预设仿真引擎库中任意仿真引擎;所述训练操作包括:将相应态势数据分别输入至标准模型和待训练模型,得到所述标准模型输出的标准结果和所述待训练模型输出的参考结果,所述待训练模型与所述初始模型对应;若得到所述标准结果与所述参考结果后不满足预设停止条件,更新所述待训练模型的参数,得到新的待训练模型,重复执行将相应态势数据分别输入至标准模型和待训练模型,得到上述标准模型输出的标准结果和所述待训练模型输出的参考结果的步骤。2.根据权利要求1所述的资源分配系统的训练方法,其特征在于,封装第一算法和第一仿真引擎,得到初始模型的第一执行程序,包括:基于所述第一算法,重置所述第一仿真引擎的环境状态,获得第一状态值;根据所述第一状态值,得到第一动作;若得到所述第一动作后不满足所述预设停止条件,推进一个时间步长,获得所述第一状态值对应的第一奖励值,重复执行获得第一状态值的步骤。3.根据权利要求1所述的资源分配系统的训练方法,其特征在于,在得到所述待训练模型输出的参考结果之后,还包括:修改所述参考结果,得到修改后的修改结果。4.根据权利要求1所述的资源分配系统的训练方法,其特征在于,在得到所述资源分配系统之后,还包括:存储得到所述资源分配系统的过程所产生的训练数据。5.根据权利要求4所述的资源分配系统的训练方法,其特征在于,在存储得到所述资源分配系统的过程所产生的训练...

【专利技术属性】
技术研发人员:徐博宋金泽熊炫棠王燕娜徐波
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1