融合强化学习和差分进化的产品变更路径多目标优选方法技术

技术编号：38239780 阅读：23 留言：0更新日期：2023-07-25 18:03

本发明专利技术公开了融合强化学习和差分进化的产品变更路径多目标优选方法，包括以下步骤：建立复杂产品网络模型，表明设计变更在产品网络模型中的传播过程；建立设计变更传播路径的多目标优化模型；利用双深度Q

全部详细技术资料下载

【技术实现步骤摘要】
融合强化学习和差分进化的产品变更路径多目标优选方法

[0001]本专利技术涉及产品设计
，尤其是涉及融合强化学习和差分进化的产品变更路径多目标优选方法。

技术介绍

[0002]设计变更在复杂产品研发过程中不可避免。由于客户需求、供应链中断、法律法规变化等原因，现实生产经常需要重新设计整个产品或其关键零部件。由于产品零部件之间复杂的依赖关系，一个零部件的设计变更可能导致其他零部件发生连锁变更，从而引发变更传播。如果不能有效控制产品设计变更过程，变更的不断传播会对产品综合性能、成本和研发工期产生负面影响。因此，研究复杂产品的设计变更问题十分必要。
[0003]现有的常见产品设计变更方案优选方法和工具，通常只考虑产品变更时的成本或工期，没有考虑产品变更时的产品综合性能影响程度，少数学者给出了多目标进化求解方法，但是大都是基于NSGA
‑
II，依然存在收敛速度慢、易于局部收敛等问题。
[0004]因此，需要一种技术，同时考虑多个优化目标如产品综合性能影响程度、变更成本、变更工期等建立多目标优化...

【技术保护点】

【技术特征摘要】
1.融合强化学习和差分进化的产品变更路径多目标优选方法，其特征在于，包括以下步骤：S1、建立复杂产品网络模型，表明设计变更在产品网络模型中的传播过程；S2、建立设计变更传播路径的多目标优化模型；S3、利用双深度Q
‑
网络帮助种群在不同阶段选择适合的进化策略，建立强化学习引导的差分进化算法即DDQN
‑
DE算法，进行多目标优化模型的求解。2.根据权利要求1所述的融合强化学习和差分进化的产品变更路径多目标优选方法，其特征在于，所述步骤S1中复杂产品网络模型建立过程包括如下步骤：S1
‑
1、根据复杂产品的组成，将其分解为部件的集合，将每个部件进一步分解为零件的集合，最终获得产品零件集合；S1
‑
2、根据区间直觉模糊集理论从节点之间的功能关系、节点间的物理结构关系、用户参与程度以及产品的可持续性和适应性方面计算零件之间的关联强度值；S1
‑
3、根据关联强度值和零件集合，建立问题的复杂产品网络模型。3.根据权利要求2所述的融合强化学习和差分进化的产品变更路径多目标优选方法，其特征在于：所述步骤S1
‑
2中关联强度值具体公式如下：其中，表示关联强度值，和h
s
分别表示两个节点之间的物理结构相关强度及其权重，和h
f
分别表示两个节点之间的功能相关强度及其权重，和h
cs
分别表示设计节点时用户的参与程度及其权重，和h
a
分别表示产品的可持续性和适应性及其权重。4.根据权利要求1所述的融合强化学习和差分进化的产品变更路径多目标优选方法，其特征在于，所述步骤S2中设计变更传播路径的多目标优化模型建立过程包括如下步骤：S2
‑
1、根据步骤S1中建立的复杂产品网络模型，求出每个产品零件的变更传播指数、加权聚集系数以及PageRank评分，根据产品设计变更数据库获取变更传播概率，对变更传播指数、加权聚集系数、PageRank评分和变更传播概率进行加权求和量化产品设计变更传播强度，从而间接描述产品零件变更对产品综合性能的影响程度；S2
‑
2、根据产品设计任务数据库，获得产品零件的变更工期和成本；S2
‑
3、对产品设计变更传播强度、变更成本和变更工期进行加权求和处理，构建多目标优化模型。5.根据权利要求4所述的融合强化学习和差分进化的产品变更路径多目标优选方法，其特征在于：所述步骤S2
‑
1中变更传播指数K
i
的计算公式为式中代表节点v
i
...

【专利技术属性】
技术研发人员：宋贤芳，张勇，杨扬，彭超，郑瑞钊，孙晓燕，
申请(专利权)人：中国矿业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人