本发明专利技术公开了一种基于注意力机制的片上网络系统映射方法,在映射模型中将注意力机制和待映射任务图中节点间连接关系相结合,形成依赖节点间连接关系的局部注意力机制来避免映射模型在节点编码阶段引入不必要的信息干扰节点信息的编码;映射模型在解码阶段以最近映射节点和待映射节点间注意力值作为待映射节点的映射概率值,在训练模型时采用多项式抽样解码来增强模型映射结果的多样性,在测试模型时采用贪婪解解码的方式选择概率最大的待映射节点来得到最优的待映射节点。引入映射效果评价模型作为基线以强化学习的方法来对映射模型进行无监督训练。本发明专利技术构建的基于注意力机制的片上网络映射方法,具有针对同一NoC架构进行模型训练即可实现同类待映射问题快速且高效的求解。速且高效的求解。速且高效的求解。
【技术实现步骤摘要】
一种基于注意力机制的片上网络系统映射方法
[0001]本专利技术涉及片上网络(Network on chip,NoC)领域,具体涉及一种基于注意力机制的片上网络系统映射方法。
技术介绍
[0002]与总线架构片上系统(System on Chip,SoC)技术相比,NoC的技术优势主要表现在:(1)基于网络拓扑结构的NoC能够实现多任务的并行通信,大幅增加了片上系统的通信带宽。且NoC网络结构也使得片上系统地址空间不受限制,提升了电路的可扩展性。(2)NoC采用全局异步
‑
局部同步(GALS)的通讯机制避免了庞大时钟树的产生,有效解决了SoC时钟不同步的难题,也使得时钟网络功耗得以降低。(3)NoC完全分离了计算和通信两个行为,将系统从仅可重用计算单元扩展到能够同时重用计算和通信单元,系统可重用性大大增强,有益于缩短设计时间和降低开发成本。
[0003]映射方案确定了任务在NoC平台的位置,因此,映射算法的优化是实现NoC低功耗和低延时的重要手段,但是,NoC映射问题是NP难问题。对于规模较小的片上网络,利用穷举遍历的方法可以在较短的时间寻找出最优方案,然而,对于规模较大的NoC系统而言,遍历的方法就会变得非常耗时。基于以上的背景,映射问题受到了许多国内外科研机构的极大关注与重视,提出了相应的映射方案,也取得了较为理想的结果,但是这些方法在计算复杂度和优化效果上还存在着很多不足之处,因此如何高效地获得低功耗以及低延时的片上网络映射方案具有重要的研究价值。
技术实现思路
[0004]针对以上问题,本专利技术提出一种基于注意力机制的片上网络系统映射方法,其特点是改进了注意力机制的作用范围,并保留了注意力机制并行运算,计算高效的特点,将注意力机制应用于片上网络系统映射领域;在对编码器编码结果结合已映射节点进行解码时,针对模型训练情况和模型测试情况采用不同的解码策略,使映射模型在训练时富有探索性,在映射模型测试时根据现有情况选择最优节点作为下个映射节点。本专利技术包括:
[0005]步骤1、获得待映射任务图的邻接矩阵并对邻接矩阵做最小
‑
最大规范化,将规范化后的任务图邻接矩阵作为映射模型和映射效果评价模型的输入。
[0006]步骤2、映射模型编码器以范化后任务图邻接矩阵的每一行作为任务图中节点的原始信息,根据邻接矩阵获得各个节点的连接关系作为注意力运算的Mask矩阵,各节点间进行注意力运算得到任务图中每个节点的编码表达。
[0007]步骤3、将编码器得到的任务图中每个节点编码输入到解码器中,解码器将最近映射3个节点的编码表达作为Query向量,将未映射节点的编码表达作为Key向量来进行注意力运算,对得到的注意力值进行Softmax归一化处理得到每个未映射节点作为下个映射的概率值。
[0008]步骤4、在训练时,解码器采用多项式抽样的方式实现依概率值抽样,每个未映射
节点根据映射概率值被抽取,使得每个未映射节点都有可能被抽到作为下个映射节点,以此实现模型训练时的探索效果,在测试时,解码器采用贪婪抽样的方式抽取概率值最大的未映射节点作为下个映射节点,以此实现模型测试时的最佳效果。
[0009]步骤5、循环步骤4直至映射完成即可得到映射解序列即从1到n的数字排列,其中索引表示架构上的路由节点,元素表示任务图中的IP核,计算该解序列作为映射结果的通讯时延。
[0010]步骤6、映射效果评价模型由全连接神经网络构成,估计待映射任务图的通讯时延。
[0011]步骤7、将片上网络映射模型解序列计算出的通讯延时作为实际系统通讯延时L(π),映射效果评价模型估计的系统通讯延时作为基线b(s),通过梯度下降优化片上网络映射模型,公式如下:
[0012][0013]其中L(θ|s)=E
pθ(π|s)
[L(π)],L((θ|s)为待映射任务图通讯延时的期望。
[0014]步骤8:将片上网络映射模型解序列计算出的系统通讯延时L(π)作为实际值,映射效果评价模型估计的系统通讯延时b(s)作为预测值,通过均方误差(MSE)作为损失函数优化映射效果评价模型,公式如下:
[0015]MSE(L(π),b(s))=(L(π)
‑
b(s))2附图说明
[0016]图1是是本专利技术一种基于注意力机制的片上网络系统映射方法的系统框图;
[0017]图2是本专利技术片上网络映射模型的任务图输入与映射序列输出示意图;
[0018]图3是本专利技术片上网络映射模型的编码器部分示意图;
[0019]图4是本专利技术片上网络映射模型在训练模式下解码器示意图;
[0020]图5是本专利技术片上网络映射模型在测试模式下解码器示意图;
[0021]图6是同一任务图采用局部注意力机制和不采用局部注意力机制作为编码器,映射模型测试结果。
具体实施方式
[0022]下面将结合本专利技术实施例中的附图,对本专利技术具体实施例中的技术方案进行清楚、完整地描述:
[0023]如图1所示的是基于注意力机制的片上网络系统映射方法流程图,映射方案由映射模型和映射效果评价模型两部分组成,映射模型求解任务图映射解序列并计算解序列的实际通讯延时,映射效果评价模型对具体任务图的通讯延时进行评估,根据实际通讯延时与评估通讯延时对映射模型做梯度更新。
[0024]如图2所示,将包含四个IP核的待映射任务图映射到2
×
2Mesh架构,映射模型求解的解序列是m={C4,C1,C2,C3},解序列的含义是将IP核C4挂载到R1路由器,IP核C1挂载到R2路由器,IP核C2挂载到R3路由器,IP核C3挂载到R4路由器,其中索引表示架构上的路由节点,元素表示任务图中的IP核,后面详述这一求解过程。
[0025]映射模型由编码器器和解码器两部分组成,映射模型的编码器流程图如图3所示,首先将待映射任务图邻接矩阵做最小
‑
最大标准化处理,其公式为:
[0026][0027]其中x
′
为标准化后的值,x为原值,x
max
为邻接矩阵中的最大元素值,x
min
为邻接矩阵中的最小元素值。
[0028]根据邻接矩阵求得节点间连接关系的Mask矩阵,具体公式如下:
[0029][0030]将标准化后的邻接矩阵和Mask矩阵作为编码器输入,编码器根据Mask矩阵对输入做N层局部多头注意力机制,公式如下:
[0031]a
i
=f(Q,K
i
)
·
Mask,i∈{1
…
n}
[0032][0033][0034]N层局部多头注意力间采用残差网络和前馈全连接层连接,其公式分别为:
[0035]Sub_layer_output=LayerNorm(x+SubLayer(x))
[0036]FFN(x)=max(0,xW1+b1)W2+b本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于改进注意力机制的片上网络映射方法,其特征在于,包括以下步骤:步骤1、输入待映射任务图的邻接矩阵并对邻接矩阵做最小
‑
最大规范化,将规范化后的任务图邻接矩阵作为映射模型和映射效果评价模型的输入;步骤2、映射模型编码器以范化后任务图邻接矩阵的每一行作为任务图中节点的原始信息,根据邻接矩阵获得各个节点的连接关系作为注意力运算的Mask矩阵,各节点间进行注意力运算得到任务图中每个节点的编码表达;步骤3、将编码器得到的任务图中每个节点编码输入到解码器中,解码器将最近映射3个节点的编码表达作为Query向量,将未映射节点的编码表达作为Key向量来进行注意力运算,对得到的注意力值进行Softmax归一化处理得到每个未映射节点作为下个映射的概率值;步骤4、在训练时,解码器采用多项式抽样的方式实现依概率值抽样,每个未映射节点根据映射概率值被抽取,使得每个未映射节点都有可能被抽到作为下个映射节点,以此实现模型训练时的探索效果,在测试时,解码器采用贪婪抽样的方式抽取概率值最大未映射节点作为下个映射节点,以此实现模型测试时的最佳效果;步骤5、循环步骤4直至映射完成即可得到映射解序列即从1到n的数字排列,其中索引表示架构上的路由节点,元素表示任务图中的IP核,计算该解序列作为映射结果的通讯时延;步骤6、映射效果评价模型针由全连接神经网络构成,估计待映射...
【专利技术属性】
技术研发人员:许川佩,王阳,马贤,邓运辉,施秀丽,牛军浩,胡聪,
申请(专利权)人:桂林电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。