当前位置: 首页 > 专利查询>榆林学院专利>正文

一种露天矿多金属多目标配矿模型求解方法技术

技术编号:37348735 阅读:24 留言:0更新日期:2023-04-22 21:45
本发明专利技术公开了一种露天矿多金属多目标配矿模型求解方法,采用Python3.6,借助tensorflow机器学习平台,计算机配置为Intel Core i5 CPU、内存16G,采用基于行动器

【技术实现步骤摘要】
一种露天矿多金属多目标配矿模型求解方法


[0001]本专利技术涉及矿山智能化技术,具体涉及一种露天矿多金属多目标配矿模型求解方法。

技术介绍

[0002]目前,随着日益复杂的矿山生产作业需求,以往单目标规划已无法满足当前矿山企业多矿种精细化管理,亟需向多目标规划转变,多目标规划需要综合考虑多项生产指标,模型复杂、人工求解难度大,采用粒子群算法、进化算法等现代多目标求解算法存在的求解速度慢、易陷入局部最优等问题尤为严重。

技术实现思路

[0003]本专利技术的主要目的在于提供一种露天矿多金属多目标配矿模型求解方法,解决现代多目标求解多金属多目标配矿优化求解方法存在的收敛速度慢、易陷入局部最优等问题,环境一旦改变,可以对突发状况做出快速、高效的响应,实现在线控制、动态配矿。
[0004]本专利技术采用的技术方案是:一种露天矿多金属多目标配矿模型求解方法,包括:设EPISODE表示定义训练局数,STEP表示每个EPISODE包含的步数,与之对应,episode表示当前运行局数,step表示当前episode走的步数,train_step表示训练总步数,save_rate表示模型保存的频率,update_rate网络参数更新的频率,reward表示智能体奖励;步骤1:对系统参数EPISODE、STEP、save_rate、update_rate以及分配单位赋值;步骤2:令episode=0,step=0,reward=0,train_step=0步骤3:进入循环体,向多智能体深度强化学习算法输入所有智能体的联合局部状态;步骤4:多智能体深度强化学习算法输出配矿策略;步骤5:配矿参数更新,包括出矿点矿量增加,被分配到的收矿点矿量、氧化率、岩性、品位等参数相应变化;步骤6:获取环境最新状态,奖惩函数对智能体进行评价;步骤7:向经验池中存储本条经验数据;步骤8:step、train_step以及reward累加步骤9:若step≥STEP,episode累加1,重置环境,step和reward赋值0,否则继续;步骤10:若train_step%update_rate=0,更新算法的价值神经网络和策略神经网络,否则继续;步骤11:若episode%save_rate=0,保存当前网络结构,否则继续;步骤12:若EPISODE≤episode,保存最后一个episode中智能体获得的奖励,训练结束,否则转步骤3。
[0005]本专利技术的优点:
本专利技术将多金属品位、岩性作为目标函数,出矿点、收矿点生产能力、氧化率、品位偏差、岩性偏差作为约束条件建立配矿优化模型,更加贴近实际生产作业需求。采用多智能体深度强化学习算法对模型进行解算,可实现离线训练,在不断试错过程中学习到最优策略,在线控制,仅需根据本地局部状态信息便可得到计算结果。另外,该算法不依赖于精确的环境模型,面对未知环境,智能体通过本地状态信息可以实现实时决策控制。
[0006]本专利技术提高配矿求解速度和露天矿多金属短期质量控制水平。
[0007]除了上面所描述的目的、特征和优点之外,本专利技术还有其它的目的、特征和优点。下面将参照图,对本专利技术作进一步详细的说明。
附图说明
[0008]构成本申请的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0009]图1是本专利技术的配矿模型示意图;图2是本专利技术方法的流程图;图3是本专利技术方法奖励总和变化曲线图。
具体实施方式
[0010]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0011]本专利技术提出了一种基于多智能体深度强化学习的露天矿多金属多目标配矿优化模型及求解方法。
[0012]多金属配矿场景中有m个出矿点和n个收矿点,如图1所示,将出矿点集合表示为M
i
={M1,M2,

,M
m
},收矿点集合表示为C
j
={C1,C2,

,C
n
},第i个出矿点向第j个收矿点提供的矿量为x
ij
。由于不同出矿点矿石品位、氧化率以及岩性等参数不同,导致编制的配矿计划差异很大。每个出矿点有a种金属且每种金属的品位也不相同,出矿点供矿品位用集合表示为g
ik
={g
11
,g
12


,g
ma
},收矿点目标品位用集合表示为G
jk
={G
11
,G
12


,G
na
},矿石品位需要在品位偏差最小的约束下最大限度地接近目标品位;每个出矿点矿石的氧化率不同,出矿点矿石的氧化率用集合表示为h
i
={h1,h2,

,h
m
},收矿点矿石允许的氧化率用集合表示为I
j
={I1,I2,

,I
n
},收矿点矿石氧化率不能超过允许的氧化率;每个出矿点矿石岩性不同,将出矿点矿石岩性分组排列可将岩性表示为,配矿后每个收矿点矿石有多种岩性,目标岩性比例用集合表示为,矿石岩性需要在岩性偏差最小的约束下最大限度的接近目标岩性;出矿点和收矿点矿量需要满足生产任务要求。
[0013]本专利技术采用运筹学多目标非线性规划方法建立配矿优化模型,相关目标及约束如下:1、露天矿多金属多目标配矿模型的目标函数需要满足矿石品位偏差和岩性偏差最小要求。
[0014](1)收矿点品位的目标
[0015](2)收矿点岩性的目标
[0016]2、约束条件需要综合考虑出矿点、收矿点的生产能力、氧化率约束以及各目标量偏差等约束。
[0017](1)出矿点、收矿点生产能力约束
[0018]考虑到多金属露天矿配矿优化问题中,出矿点挖掘机的生产作业能力需要考虑实际生产作业需求,生产过多会导致单个作业班次任务无法完成,生产过少会导致其他设备长时间等待,收矿点破碎站的破碎能力直接决定整个环境中可动态流通矿石总量。为确保配矿模型计算所得工作量在出矿点、收矿点能力范围之内,需要为出矿点和收矿点设置一个合理的生产能力约束范围。
[0019][0020][0021]其中,式(3)表示出矿点任务量的约束条件,式(4)表示收矿点任务量的约束条件。、分别表示出矿点、收矿点生产能力的下限。、分别表示出矿点、收矿点生产能力的上限。
[0022](2)氧化率约束根据给出的氧化率限制指标,将从出矿点到收矿点的氧化率进行限制。
[0023][0024]式中,表示收矿点矿石氧化率上限。
[0025](3)矿石品位、岩性偏差约束考虑到矿石品位、岩性需要尽可能的接近目标值,品位偏差和岩性偏差需要有上下限本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种露天矿多金属多目标配矿模型求解方法,其特征在于,包括:设EPISODE表示定义训练局数,STEP表示每个EPISODE包含的步数,与之对应,episode表示当前运行局数,step表示当前episode走的步数,train_step表示训练总步数,save_rate表示模型保存的频率,update_rate网络参数更新的频率,reward表示智能体奖励;步骤1:对系统参数EPISODE、STEP、save_rate、update_rate以及分配单位赋值;步骤2:令episode=0,step=0,reward=0,train_step=0步骤3:进入循环体,向多智能体深度强化学习算法输入所有智能体的联合局部状态;步骤4:多智能体深度强化学习算法输出配矿...

【专利技术属性】
技术研发人员:冯治东刘格
申请(专利权)人:榆林学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1