一种模型结构的优化方法及装置制造方法及图纸

技术编号:38251591 阅读:19 留言:0更新日期:2023-07-27 10:17
本申请提供一种模型结构的优化方法,包括:获取待优化的业务模型的结构信息,业务模型基于目标业务的业务数据中的决策特征、约束条件和业务目标确定,结构信息包括业务模型对应的矩阵信息,矩阵信息包括多个列变量和多个行变量,列变量表征了业务模型的变量,变量基于业务数据中的决策特征确定,行变量表征了业务模型的约束,约束基于约束条件确定;将矩阵信息输入图神经网络,得到多个列变量和/或多个行变量对应的多个嵌入表示;将多个嵌入表示输入指针神经网络,得到多个嵌入表示的排序;基于多个嵌入表示的排序,对业务模型的结构进行优化。本申请通过对模型的结构优化,提高了求解器对优化后的模型的求解性能。求解器对优化后的模型的求解性能。求解器对优化后的模型的求解性能。

【技术实现步骤摘要】
一种模型结构的优化方法及装置


[0001]本申请涉及人工智能
,尤其涉及一种模型结构的优化方法及装置。

技术介绍

[0002]大量现实生活中的优化问题本质上都是离散或者连续的组合优化问题,比如机场调度、大学课程排课、护士排班、工厂排产、材料工艺控制、数据分配和电力系统的调度等业务。其中以多工厂排产业务问题为例,这类问题的特征是待求解的变量很多,业务约束多,对求解速度、求解质量以及鲁棒性要求较高。为解决上述问题,许多方法被提出来了,比如启发式方法、元启发算法(进化算法、邻域搜索等)以及数学规划算法。不同的方法有各自的局限性,比如启发式方法产生的结果不够好,需要大量的人工调整;元启发算法求得的结果好于启发式方法,但是其求解速度太慢。

技术实现思路

[0003]本申请的实施例提供一种模型结构的优化方法及装置,通过对模型的结构优化,提高了求解器对该优化后的模型的求解性能。
[0004]第一方面,本申请提供了一种模型结构的优化方法,包括获取待优化的业务模型的结构信息,业务模型基于目标业务的业务数据中的决策特征、约束条件和业务目标确定,结构信息包括业务模型对应的矩阵信息,矩阵信息包括多个列变量和多个行变量,列变量表征了所述业务模型的变量,变量基于业务数据中的决策特征确定,行变量表征了业务模型的约束,约束基于约束条件确定;将矩阵信息输入图神经网络,得到多个列变量和/或多个行变量对应的多个嵌入表示;将多个嵌入表示输入指针神经网络,得到多个嵌入表示的排序;基于多个嵌入表示的排序,对业务模型的结构进行优化,优化后的业务模型用于输入求解器,得到目标业务在实现最优业务目标时对应的决策。
[0005]在该实现中,通过对模型的结构优化,提高了求解器对优化后的模型的求解性能。
[0006]在一个可能的实现中,将矩阵信息输入图神经网络,得到多个列变量和/或多个行变量对应的多个嵌入表示,包括:确定矩阵信息的二部图,二部图包括多个列变量节点和多个行变量节点;提取二部图中各个列变量节点和/或行变量节点的特征,得到各个列变量节点和/或行变量节点对应的嵌入表示;基于各个列变量节点和/或行变量节点对应的嵌入表示,确定多个列变量和/或多个行变量对应的多个嵌入表示。
[0007]在一个可能的实现中,将所述多个嵌入表示输入指针神经网络,得到多个所述嵌入表示的排序,包括:将多个嵌入表示划分为多组嵌入表示;对多组嵌入表示中各组嵌入表示进行池化操作,得到多个池化特征;将多个池化特征输入指针神经网络,得到多个池化特征的排序;基于多个池化特征的排序,确定多个嵌入表示的排序。
[0008]在另一个可能的实现中,基于多个嵌入表示的排序,对业务模型的结构进行优化,包括:基于多个嵌入表示的排序,对矩阵信息中多个列变量和/或多个行变量进行排序,得到优化后的矩阵信息;基于优化后的矩阵信息,确定优化后的业务模型的结构信息。
[0009]在另一个可能的实现中,图神经网络为图卷积神经网络。
[0010]在另一个可能的实现中,图神经网络和指针神经网络基于强化学习或监督学习训练得到。
[0011]第二方面,本申请提供了一种模型结构的优化装置,包括:
[0012]获取模块,用于获取待优化的业务模型的结构信息,所述业务模型基于目标业务的业务数据中的决策特征、约束条件和业务目标确定,所述结构信息包括所述业务模型对应的矩阵信息,所述矩阵信息包括多个列变量和多个行变量,所述列变量表征了所述业务模型的变量,所述变量基于所述业务数据中的决策特征确定,所述行变量表征了所述业务模型的约束,所述约束基于所述约束条件确定;
[0013]嵌入表示提取模块,用于将所述矩阵信息输入图神经网络,得到所述多个列变量和/或多个行变量对应的多个嵌入表示;
[0014]排序模块,用于将所述多个嵌入表示输入指针神经网络,得到所述多个嵌入表示的排序;
[0015]优化模块,基于所述多个嵌入表示的排序,对所述业务模型的结构进行优化,优化后的所述业务模型用于输入求解器,得到所述目标业务在实现最优所述业务目标时对应的决策。
[0016]在一个可能的实现中,所述嵌入表示提取模块具体用于,确定所述矩阵信息的二部图,所述二部图包括多个列变量节点和多个行变量节点;
[0017]提取所述二部图中各个列变量节点和/或行变量节点的特征,得到所述各个列变量节点和/或行变量节点对应的嵌入表示;
[0018]基于所述各个列变量节点和/或行变量节点对应的嵌入表示,确定所述多个列变量和/或多个行变量对应的多个嵌入表示。
[0019]在另一个可能的实现中,所述排序模块具体用于,将所述多个嵌入表示划分为多组嵌入表示;
[0020]对所述多组嵌入表示中各组嵌入表示进行池化操作,得到多个池化特征;
[0021]将所述多个池化特征输入所述指针神经网络,得到所述多个池化特征的排序;
[0022]基于所述多个池化特征的排序,确定所述多个嵌入表示的排序。
[0023]在另一个可能的实现中,所述优化模块具体用于,基于所述多个嵌入表示的排序,对所述矩阵信息中多个列变量和/或多个行变量进行排序,得到优化后的矩阵信息;
[0024]基于所述优化后的矩阵信息,确定优化后的业务模型的结构信息。
[0025]在另一个可能的实现中,所述图神经网络为图卷积神经网络。
[0026]在另一个可能的实现中,所述图神经网络和所述指针神经网络基于强化学习或监督学习训练得到。
[0027]第三方面,本申请提供了一种计算设备,包括存储器和处理器,所述存储器中存储有指令,当所述指令被处理器执行时,使得第一方面所述的方法被实现。
[0028]第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在被处理器执行时,使得第一方面所述的方法被实现。
附图说明
[0029]图1为最优化业务的求解方法的流程示意图;
[0030]图2为本申请实施例提供的模型结构的优化方法的流程示意图;
[0031]图3为模型的矩阵信息(A,b,c)输入图神经网络后,在图神经网络中的处理过程示意图;
[0032]图4为图神经网络输出的多个嵌入表示在划分模块和池化模块的处理过程示意图;
[0033]图5为池化后的聚合嵌入表示信息,在指针神经网络中的处理以及处理后指导优化模型结构的过程示意图;
[0034]图6为图神经网络和指针神经网络采用强化学习的训练方式的训练过程示意图;
[0035]图7利用为本申请实施例提供的模型结构的优化方法优化后的模型结构在数据集上的验证结果;
[0036]图8为多工厂排产数据集中抽取32个线性规划问题作为训练集的规模统计示意图;
[0037]图9为多工厂排产数据集中抽取60个线性规划问题作为验证集的规模统计示意图;
[0038]图10为利用为本申请实施例提供的模型结构的优化方法优化后的模型结构在测试集上的求解时间示意图;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型结构的优化方法,其特征在于,包括:获取待优化的业务模型的结构信息,所述业务模型基于目标业务的业务数据中的决策特征、约束条件和业务目标确定,所述结构信息包括所述业务模型对应的矩阵信息,所述矩阵信息包括多个列变量和多个行变量,所述列变量表征了所述业务模型的变量,所述变量基于所述业务数据中的决策特征确定,所述行变量表征了所述业务模型的约束,所述约束基于所述约束条件确定;将所述矩阵信息输入图神经网络,得到所述多个列变量和/或多个行变量对应的多个嵌入表示;将所述多个嵌入表示输入指针神经网络,得到所述多个嵌入表示的排序;基于所述多个嵌入表示的排序,对所述业务模型的结构进行优化,优化后的所述业务模型用于输入求解器,得到所述目标业务在实现最优所述业务目标时对应的决策。2.根据权利要求1所述的方法,其特征在于,所述将所述矩阵信息输入图神经网络,得到所述多个列变量和/或多个行变量对应的多个嵌入表示,包括:确定所述矩阵信息的二部图,所述二部图包括多个列变量节点和多个行变量节点;提取所述二部图中各个列变量节点和/或行变量节点的特征,得到所述各个列变量节点和/或行变量节点对应的嵌入表示;基于所述各个列变量节点和/或行变量节点对应的嵌入表示,确定所述多个列变量和/或多个行变量对应的多个嵌入表示。3.根据权利要求1或2所述的方法,其特征在于,所述将所述多个嵌入表示输入指针神经网络,得到多个所述嵌入表示的排序,包括:将所述多个嵌入表示划分为多组嵌入表示;对所述多组嵌入表示中各组嵌入表示进行池化操作,得到多个池化特征;将所述多个池化特征输入所述指针神经网络,得到所述多个池化特征的排序;基于所述多个池化特征的排序,确定所述多个嵌入表示的排序。4.根据权利要求1

3任一项所述的方法,其特征在于,所述基于所述多个嵌入表示的排序,对所述业务模型的结构进行优化,包括:基于所述多个嵌入表示的排序,对所述矩阵信息中多个列变量和/或多个行变量进行排序,得到优化后的矩阵信息;基于所述优化后的矩阵信息,确定优化后的业务模型的结构信息。5.根据权利要求1

4任一项所述的方法,其特征在于,所述图神经网络为图卷积神经网络。6.根据权利要求1

5任一项所述的方法,其特征在于,所述图神经网络和所述指针神经网络基于强化学习或监督学习训练得到。7.一种模型结构的优化装置,其特征在于,包括:获取模块,用于获取待优化的业务模型的结构信息,所述业务模型基于目标业务的业务数据中的决策特征、...

【专利技术属性】
技术研发人员:李希君朱方舟甄慧玲付小津陆梦曾嘉袁明轩
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1