【技术实现步骤摘要】
产品作业动态调度的数字孪生虚实自适应迭代优化方法
本专利技术涉及了一种装备虚拟现实仿真数据处理方法,尤其是涉及了一种基于深度强化学习的产品作业动态调度的数字孪生虚实自适应迭代优化方法,属于系统调度管理领域。
技术介绍
调度优化是作业流程控制中的经典研究主题,是实现复杂产品中单元部件协调联动、资源充分利用的关键。复杂产品数字孪生构造中所要求的全生命周期虚实一致性和迭代优化能力对传统调度优化方法提出了新的问题,一是调度方法如何实现从虚拟仿真样机到实际物理产品的平滑部署,并保证产品服役中两者间的一致性;二是调度方法如何利用CPS等信息技术所采集的运行数据进行迭代优化,提高智能性,从而产生更符合真实服役环境的调度策略;此外,复杂产品运行的实时性要求也强调调度方法的计算效率。作为人工智能热点技术之一的强化学习方法,特别是深度强化学习方法,为解决数字孪生要求下的调度问题提供了新的途径。目前,已有一些研究将强化学习或深度强化学习应用在流程调度问题上,然而实际效果并不理想,主要存在两方面的原因,一是早期的深度强化学习直接在传统的Q学 ...
【技术保护点】
1.一种产品作业动态调度的数字孪生虚实自适应迭代优化方法,其特征在于:包括以下步骤:/nS1.针对产品数字孪生作业流程建立赋时S
【技术特征摘要】
1.一种产品作业动态调度的数字孪生虚实自适应迭代优化方法,其特征在于:包括以下步骤:
S1.针对产品数字孪生作业流程建立赋时S3PR网模型;
S2.构造赋时S3PR网模型中库所至变迁特征传播的第一子层结构;
S3.构造赋时S3PR网模型中变迁至库所特征传播的第二子层结构;
S4.利用第一子层结构和第二子层结构搭建神经网络,利用神经网络拟合赋时S3PR网模型的状态;
S5.将基于赋时S3PR网模型的产品数字孪生作业流程的动态调度问题转换为一个马尔科夫决策模型;
S6.利用深度Q值网络(DeepQ-network)强化学习方法求解S5中建立的马尔科夫决策模型,实现数字孪生虚实自适应迭代优化。
2.根据权利要求1所述的一种基于深度强化学习的产品作业动态调度的数字孪生虚实自适应迭代优化方法,其特征在于:
所述步骤S2中,构造一个2单元的共享卷积核计算每个变迁的前序操作库所特征与前序资源库所特征的加权和,以此作为第一子层结构的构造;具体实施中通过为自主变迁添加一个标识恒大于零的虚设资源库所,使得赋时S3PR网中所有变迁都具有相同的前序节点结构。
3.根据权利要求1所述的一种基于深度强化学习的产品作业动态调度的数字孪生虚实自适应迭代优化方法,其特征在于:
所述步骤S3中,根据线性移不变滤波器构造第二子层结构,具体实施中是利用有向加权图上线性移不变滤波器其中,F和分别是有向加权图上的原始信号和滤波后的信号,H是滤波器,A是有向...
【专利技术属性】
技术研发人员:刘振宇,胡亮,裘辿,陈俊奇,谭建荣,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。