控制方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39328774 阅读:25 留言:0更新日期:2023-11-12 16:05
本申请提供的一种控制方法、装置、电子设备及存储介质,通过获取目标港口的状态信息;将所述状态信息输入到训练好的神经网络模型中确定状态信息对应的动作信息;基于所述动作信息控制所述目标港口中目标机器的工作,能够实现自动进行调度,从而能够提高进出港作业的效率。效率。效率。

【技术实现步骤摘要】
控制方法、装置、电子设备及存储介质


[0001]本申请涉及码头排产
,特别地涉及一种控制方法、装置、电子设备及存储介质。

技术介绍

[0002]在当下,海运凭借着运量大、运费低的特点,依然是贸易运输的最主要方式。现有技术中,对码头进行排产调度时,通常采用人工调度的方式,采用人工调度的方式使得码头进出港作业的效率低,导致扩张码头的规模困难,有研究者基于启发式算法尝试解决这一问题,通过构建了基于规则的决策支持模型,并使用一天运营时间的小型数据集进行了检验,然而这类方法的寻优结果通常不具备全局特性、计算规模有限,并且设计过程需要大量有关调度实例的专业知识才能有效;优化模型固定,如生产过程特性发生改变,则需重新进行建模工作。

技术实现思路

[0003]针对上述相关技术中的问题本申请提供一种控制方法、装置、电子设备及存储介质,能够提高进出港作业的效率。
[0004]本申请实施例提供一种控制方法,包括:
[0005]获取目标港口的状态信息;
[0006]将所述状态信息输入到训练好的神经网络模型中确定状态信息对应的动作信息;
[0007]基于所述动作信息控制所述目标港口中目标机器的工作。
[0008]在一些实施例中,所述状态信息包括:任务特征和堆场特征,所述任务特征包括:船只的排水剩余时间、船只船舱需要的煤炭种类和数量,所述场存特征包括:煤堆的种类和数量、取料机的占用及故障信息、装船机的占用及故障信息、取料线的占用时间、装船机与取料机的对应关系、装船机与船舱的对应关系;所述目标机器包括:取料机、装船机。
[0009]在一些实施例中,每个动作与煤堆、取料机、装船机、船舱、泊位对应,所述动作信息包括动作索引值,所述基于所述动作信息控制所述目标港口中目标机器的工作,包括:
[0010]基于所述动作索引值确定动作对应的煤堆标识、取料机标识、装船机标识、泊位标识及船舱标识;
[0011]基于所述煤堆标识、所述泊位标识及所述船舱标识控制取料机标识对应的取料机和装船机标识对应的装车机工作。
[0012]在一些实施例中,所述方法还包括:
[0013]获取样本数据,所述样本数据包括:所述目标港口的状态信息及各个状态信息对应的动作;
[0014]选择各个状态信息对应的目标动作;
[0015]以回报函数的值越大为优化目标,将各个状态信息和各个状态信息对应的目标动作输入至神经网络模型中进行训练,得到训练好的神经网络模型,所述回报函数基于单步
动作占用的时间确定的,其中回报函数为:r=km

t
increase
,r为单步动作的回报函数值,t
increase
单步动作的运行时间,m为单步动作的煤运送量。
[0016]在一些实施例中,所述神经网络模型包括:
[0017][0018]其中,s代表选取合法动作时的状态,a代表法动作时的状态对应的动作,s

代表执行合法动作后的下一个状态,a

代表法下一个状态对应的动作,γ为在状s下采用动作a后的激励值,在动作对应的船舱有需求、煤堆的煤种与船舱需求对应、船舱对应的煤堆存量满足存量要求、动作对应的取料线和装船机空闲、装船机的装船顺序满足要求的情况下,确定所述动作信息对应的动作合法。
[0019]在一些实施例中,所述选择各个状态信息对应的目标动作,包括:
[0020]基于衰减速率公式减少采用随机选择法选择目标动作的比例,并增加采用贪心算法选择目标动作的比例,其中,所述衰减速率公式包括:
[0021]ε=(1

decay)*ε,其中,ε为衰减速率,decay为衰变值。
[0022]在一些实施例中,所述方法还包括:
[0023]基于各个状态信息对应的动作信息确定排产方案。
[0024]本申请实施例提供一种控制装置,包括:
[0025]获取模块,用于获取目标港口的状态信息;
[0026]确定模块,用于将所述状态信息输入到训练好的神经网络模型中确定状态信息对应的动作信息;
[0027]控制模块,用于基于所述动作信息控制所述目标港口中目标机器的工作。
[0028]本申请实施例提供一种电子设备,包括:
[0029]存储器和处理器,所述存储器上存储有计算机程序,该计算机程序被所述处理器执行时,执行上述任意一项所述控制方法。
[0030]本申请实施例提供一种存储介质,该存储介质存储的计算机程序,能够被一个或多个处理器执行,能够用来实现上述任一项所述控制方法。
[0031]本申请提供的一种控制方法、装置、电子设备及存储介质,通过获取目标港口的状态信息;将所述状态信息输入到训练好的神经网络模型中确定状态信息对应的动作信息;基于所述动作信息控制所述目标港口中目标机器的工作,能够实现自动进行调度,从而能够提高进出港作业的效率。
附图说明
[0032]在下文中将基于实施例并参考附图来对本申请进行更详细的描述。
[0033]图1为本申请实施例提供的一种控制方法的实现流程示意图;
[0034]图2为本申请实施例提供的电子设备的组成结构示意图。
[0035]在附图中,相同的部件使用相同的附图标记,附图并未按照实际的比例绘制。
具体实施方式
[0036]为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进
一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
[0037]在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
[0038]如果申请文件中出现“第一\第二\第三”的类似描述则增加以下的说明,在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
[0039]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
[0040]基于相关技术中存在的问题,本申请实施例提供一种控制方法,所述方法应用于电子设备,所述电子设备可以是移动终端、计算机、服务器等。
[0041]本申请实施例提供的控制方法所实现的功能可以通过电子设备的处理器调用程序代码来实现,其中,程序代码可以保存在计算机存储介质中。
[0042]本申请实施例提供一种控制方法,图1为本申请实施例提供的一种控制方法的实现流程示意图,如图1所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种控制方法,其特征在于,包括:获取目标港口的状态信息;将所述状态信息输入到训练好的神经网络模型中确定状态信息对应的动作信息;基于所述动作信息控制所述目标港口中目标机器的工作。2.根据权利要求1所述的方法,其特征在于,所述状态信息包括:任务特征和堆场特征,所述任务特征包括:船只的排水剩余时间、船只船舱需要的煤炭种类和数量,所述场存特征包括:煤堆的种类和数量、取料机的占用及故障信息、装船机的占用及故障信息、取料线的占用时间、装船机与取料机的对应关系、装船机与船舱的对应关系;所述目标机器包括:取料机、装船机。3.根据权利要求2所述的方法,其特征在于,每个动作与煤堆、取料机、装船机、船舱、泊位对应,所述动作信息包括动作索引值,所述基于所述动作信息控制所述目标港口中目标机器的工作,包括:基于所述动作索引值确定动作对应的煤堆标识、取料机标识、装船机标识、泊位标识及船舱标识;基于所述煤堆标识、所述泊位标识及所述船舱标识控制取料机标识对应的取料机和装船机标识对应的装车机工作。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取样本数据,所述样本数据包括:所述目标港口的状态信息及各个状态信息对应的动作;选择各个状态信息对应的目标动作;以回报函数值越大为优化目标,将各个状态信息和各个状态信息对应的目标动作输入至神经网络模型中进行训练,得到训练好的神经网络模型,所述回报函数基于单步动作占用的时间确定的,其中回报函数为:r=km

t
increase
,r为单步动作的回报函数值,t
increase
单步动作的运行时间,...

【专利技术属性】
技术研发人员:马占东李心阳王宪超张伟张羽霄吴思锐徐杰李长安宋郁珉刘军张思京王志东王向东梁琨白伟
申请(专利权)人:国能天津港务有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1