基于图卷积网络的软硬件划分和任务调度模型及其方法技术

技术编号:31984080 阅读:21 留言:0更新日期:2022-01-20 02:01
本发明专利技术公开了基于图卷积网络的软硬件划分和任务调度模型及其方法,模型包括数据处理模块、图神经网络模块、任务调度模块、主函数模块;方法中,采用余弦相似度表征相邻节点间的相似度,大大提高了建模精度;采用图卷积网络提取任务之间的依赖关系,进一步提高了准确率;采用软硬件划分与任务调度相结合,得到的模型的整合度更高;通过更具有划分意义的特征:硬件增益和单位面积增益,使得信息利用率得到大大提高。得到大大提高。得到大大提高。

【技术实现步骤摘要】
基于图卷积网络的软硬件划分和任务调度模型及其方法


[0001]本专利技术涉及软硬件划分的
,尤其涉及到基于图卷积网络的软硬件划分和任务调度模型及其方法。

技术介绍

[0002]在戈登
·
摩尔所预言的技术进步的推动下,集成电路的规模越来越大,逐渐出现了以SoC为代表的设计趋势。在市场竞争的驱使下,SOC需要更好、更快、更早上市才能保证其产品竞争力,因而对设计质量和设计周期提出了严格的要求。传统的先硬件后软件的设计模式已无法满足现代SOC快速上市的要求;且SoC的设计需要合理考虑软件与硬件的协同性,软硬件协同设计方法学便应运而生。软硬件划分作为软硬件协同设计中的关键环节,决定着整个协同设计结果的好坏。
[0003]大多数软硬件划分问题已被证明为NP

hard问题,为了解决这些问题,逐渐出现以遗传算法、模拟退火、禁忌搜索、蚁群算法、KL算法为代表的经典启发式划分算法。这些算法各有优缺点,解决问题的思想大同小异,但都普遍存模型复杂度较高、没有考虑任务图的连接关系、模型不可复用等不足之处。现代SoC的复杂度越来越高,所对应的软硬件划分问题规模也越来越大。为了更高效地处理大规模软硬件划分问题,提高软硬件划分算法的速度和质量,有必要将参数可复用、特征提取能力强、复杂度低的图卷积网络引入软硬件划分领域。

技术实现思路

[0004]本专利技术的目的在于克服现有技术的不足,提供一种信息利用率高、参数可复用、收敛速度快、划分效率和精度高的基于图卷积网络的软硬件划分和任务调度模型。
[0005]为实现上述目的,本专利技术所提供的技术方案为:
[0006]基于图卷积网络的软硬件划分和任务调度模型,包括数据处理模块、图神经网络模块、任务调度模块、主函数模块;
[0007]其中,
[0008]所述数据处理模块,用于读取任务图的特征矩阵F和邻接矩阵A,并对特征矩阵F和邻接矩阵A进行预处理;
[0009]所述图神经网络模块,用于接收来自数据处理模块的已经过预处理的任务图的特征矩阵F和邻接矩阵A,输出一个X∈R
N
×2的概率向量,X中的第一列表示每个任务属于软件实现的概率,第二列表示每个任务属于硬件实现的概率,且每一行的和为1;通过设定概率阈值,将概率向量转为划分标签向量;
[0010]所述任务调度模块,用于接收图神经网络模块输出的划分标签向量和对应的任务图数据,对划分后的任务图进行调度,通过任务调度得到划分标签向量对应的系统运行时间;
[0011]所述主函数模块,用于负责按运算顺序,整合数据处理模块、图神经网络模块和任
务调度模块为一个模型整体,设定训练次数、优化算法和损失函数,并对训练好的最终模型进行评估和测试。
[0012]进一步地,所述图神经网络模块(2)包括依次连接的第一图卷积层、第一Dropout层、第一RelU激活层、第二图卷积层、第二Dropout层、线性分类层、Softmax分类器;
[0013]所述第一图卷积层和第二图卷积层内均包含余弦相似度计算和邻域聚合操作两个部分。
[0014]为实现上述目的,本专利技术另外提供一种基于图卷积网络的软硬件划分和任务调度方法,包括以下步骤:
[0015]S1、通过数据处理模块读取任务图的特征矩阵F和邻接矩阵A,并对读取到的任务图的特征矩阵F和邻接矩阵A进行预处理;
[0016]S2、通过图神经网络模块接收来自数据处理模块的已经过预处理的任务图的特征矩阵和邻接矩阵,输出一个X∈R
N
×2的概率向量,N为任务图的节点数,X中的第一列表示每个任务属于软件实现的概率,第二列表示每个任务属于硬件实现的概率,且每一行的和为1;
[0017]S3、结合图卷积网络的输出,构建损失函数并求导,然后使用Adam优化算法对图卷积网络的参数进行更新;
[0018]S4、通过参数更新后的图卷积网络对任务图进行划分;
[0019]S5、通过设定概率阈值,将步骤S4所述的图卷积网络划分输出的概率向量转为划分标签向量;
[0020]S6、通过任务调度模块接收步骤S5输出的划分标签向量和对应的任务图数据,并对划分后的任务图进行调度,通过任务调度得到划分标签向量对应的系统运行时间。
[0021]进一步地,所述步骤S1中,
[0022]在读取阶段,采用numpy的genfromtxt函数分别从.content和.cites文件读取任务图的特征矩阵F和邻接矩阵A;
[0023]在预处理阶段,分别对邻接矩阵A和特征矩阵F按如下公式进行预处理:
[0024]A
sym
=A+A
T
ꢀꢀꢀ
(1)
[0025][0026][0027][0028]HG
i
=F
i0

F
i1
ꢀꢀ
(5)
[0029][0030]F

=F||HG||HGP
ꢀꢀ
(7)
[0031]式(1)表示对邻接矩阵A进行对称化处理,为了将有向图转为无向图;
[0032]式(2)表示对邻接矩阵A添加自环,以便在邻域聚合时,将节点自身的特征信息也包含进来并参与新节点特征的产生;I为NxN的单位矩阵,N为任务图的节点数;
[0033]式(3)、(4)表示对称化、添加自环后的A进行归一化;其中,第一步需要计算邻接矩阵A的度矩阵D,D为对角矩阵,且对角线元素的值为邻接矩阵A中对应行的非零元素之和,第
二步是对邻接矩阵A执行归一化操作,即在邻接矩阵A的左右两则同时与相乘;为对称化、添加自环的中第i行第j列的元素;
[0034]式(5)

(7)是对特征矩阵F的预处理;其中,式(5)根据原始特征定义硬件增益作为划分特征,硬件增益表示为每个任务的软件执行时间与硬件执行时间的差值,该值越大,表示该任务更倾向于硬件;式(6)在式(5)的基础上,将任务的硬件增益与硬件的面积相乘,定义单位面积增益,该值反映任务的硬件增益与硬件面积之间的制约关系;式(7)表示将这两列新特征合并到原始特征矩阵F中,构成新的特征矩阵F

;F
i0
、F
i1
、F
i2
分别为原始特征矩阵F中第i个任务的软件耗时、硬件耗时、硬件面积。
[0035]进一步地,所述步骤S2中,对图卷积网络进行建模,网络框架包括依次连接的第一图卷积层、第一Dropout层、第一RelU激活层、第二图卷积层、第二Dropout层、线性分类层、Softmax分类器;第一图卷积层和第二图卷积层内均包含余弦相似度计算和邻域聚合操作两个部分;
[0036]框架的公式表示如下:
[0037][0038][0039]H
l+1
=ReLu(Dropout(H
l+1
)),l=0,1,...本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于图卷积网络的软硬件划分和任务调度模型,其特征在于,包括数据处理模块(1)、图神经网络模块(2)、任务调度模块(3)、主函数模块(4);其中,所述数据处理模块(1),用于读取任务图的特征矩阵F和邻接矩阵A,并对特征矩阵F和邻接矩阵A进行预处理;所述图神经网络模块(2),用于接收来自数据处理模块(1)的已经过预处理的任务图的特征矩阵F和邻接矩阵A,输出一个X∈R
N
×2的概率向量,N为任务图的节点数,X中的第一列表示每个任务属于软件实现的概率,第二列表示每个任务属于硬件实现的概率,且每一行的和为1;通过设定概率阈值,将概率向量转为划分标签向量;所述任务调度模块(3),用于接收图神经网络模块(2)输出的划分标签向量和对应的任务图数据,对划分后的任务图进行调度,通过任务调度得到划分标签向量对应的系统运行时间;所述主函数模块(4),用于负责按运算顺序,整合数据处理模块(1)、图神经网络模块(2)和任务调度模块(3)为一个模型整体,设定训练次数、优化算法和损失函数,并对训练好的最终模型进行评估和测试。2.根据权利要求1所述的基于图卷积网络的软硬件划分和任务调度模型,其特征在于,所述图神经网络模块(2)包括依次连接的第一图卷积层、第一Dropout层、第一RelU激活层、第二图卷积层、第二Dropout层、线性分类层、Softmax分类器;所述第一图卷积层和第二图卷积层内均包含余弦相似度计算和邻域聚合操作两个部分。3.基于图卷积网络的软硬件划分和任务调度方法,其特征在于,包括以下步骤:S1、通过数据处理模块读取任务图的特征矩阵F和邻接矩阵A,并对读取到的任务图的特征矩阵F和邻接矩阵A进行预处理;S2、通过图神经网络模块接收来自数据处理模块的已经过预处理的任务图的特征矩阵和邻接矩阵,输出一个X∈R
N
×2的概率向量,N为任务图的节点数,X中的第一列表示每个任务属于软件实现的概率,第二列表示每个任务属于硬件实现的概率,且每一行的和为1;S3、结合图卷积网络的输出,构建损失函数并求导,然后使用Adam优化算法对图卷积网络的参数进行更新;S4、通过参数更新后的图卷积网络对任务图进行划分;S5、通过设定概率阈值,将步骤S4所述的图卷积网络划分输出的概率向量转为划分标签向量;S6、通过任务调度模块接收步骤S5输出的划分标签向量和对应的任务图数据,并对划分后的任务图进行调度,通过任务调度得到划分标签向量对应的系统运行时间。4.根据权利要求3所述的基于图卷积网络的软硬件划分和任务调度方法,其特征在于,所述步骤S1中,在读取阶段,采用numpy的genfromtxt函数分别从.content和.cites文件读取任务图的特征矩阵F和邻接矩阵A;在预处理阶段,分别对邻接矩阵A和特征矩阵F按如下公式进行预处理:A
sym
=A+A
T
ꢀꢀꢀꢀꢀꢀꢀ
(1)
HG
i
=F
i0

F
i1
ꢀꢀꢀꢀꢀꢀꢀꢀ
(5)F

=F||HG||HGP
ꢀꢀꢀꢀꢀꢀ
(7)式(1)表示对邻接矩阵A进行对称化处理,为了将有向图转为无向图;式(2)表示对邻接矩阵A添加自环,以便在邻域聚合时,将节点自身的特征信息也包含进来并参与新节点特征的产生;I为NxN的单位矩阵,N为任务图的节点数;式(3)、(4)表示对称化、添加自环后的A进行归一化;其中,第一步需要计算邻接矩阵A的度矩阵D,D为对角矩阵,且对角线元素的值为邻接矩阵A中对应行的非零元素之和,第二步是对邻接矩阵A执行归一化操作,即在邻接矩阵A的左右两则同时与相乘;为对称化、添加自环的中第i行第j列的元素;式(5)

(7)是对特征矩阵F的预处理;其中,式(5)根据原始特征定义硬件增益作为划分特征,硬件增益表示为每个任务的软件执行时间与硬件执行时间的差值,该值越大,表示该任务更倾向于硬件;式(6)在式(5)的基础上,将任务的硬件增益与硬件的面积相乘,定义单位面积增益,该值反映任务的硬件增益与硬件面积之间的制约关系;式(7)表示将这两列新特征合并到原始特征矩阵F中,构成新的特征矩阵F

;F
i0
、F
i1
、F
i2
分别为原始特征矩阵F中第i个任务的软件耗时、硬件耗时、硬件面积。5.根据权利要求3所述的基于图卷积网络的软硬件划分和任务调度方法,其特征在于,所述步骤S2中,对图卷积网络进行建模,网络框架包括依次连接的第一图卷积层、第一Dropout层、第一RelU激活层、第二图卷积层、第二Dropout层、线性分类层、Softmax分类器;第一图卷积层和第二图卷积层内均包含余弦相似度计算和邻域聚合操作两个部分;框架的公式表示如下:框架的公式表示如下:H
l+1
=ReLu(Dropout(H
l+1
)),l=0,1,...,L
‑1ꢀꢀꢀꢀꢀ
(10)H
L
=H
L
‑1W
ꢀꢀꢀꢀꢀꢀ
(11)X=Softmax(H
L
))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)上式...

【专利技术属性】
技术研发人员:郑欣梁守志熊晓明
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1