基于轻量化深度强化学习的芯片宏单元布局方法及系统技术方案

技术编号:33154301 阅读:23 留言:0更新日期:2022-04-22 14:10
本发明专利技术涉及一种基于轻量化深度强化学习的芯片宏单元布局方法及系统,通过将策略网络按通道划分为互相独立的多个子网络,不仅为策略网络的轻量化提供了多通道多层结构化剪枝的新思路,也为以后策略网络对数据进行分块处理提供了方法;通过在策略网络的目标函数中引入组正则子,对子网络的权值参数进行组内和组间的稀疏约束,并对稀疏化的策略网络进行剪枝压缩,能够更好地消除一些不重要的输入数据带来的梯度计算,解决网络权值参数冗余的问题,减少基于深度强化学习的芯片布局方法中的芯片宏单元布局过程对存储资源和计算资源的浪费,降低了芯片宏单元布局过程对硬件设备的要求,推进了硬件设计的更新发展。推进了硬件设计的更新发展。推进了硬件设计的更新发展。

【技术实现步骤摘要】
基于轻量化深度强化学习的芯片宏单元布局方法及系统


[0001]本专利技术涉及机器学习领域和芯片布局领域,特别是涉及一种基于轻量化深度强化学习的芯片宏单元布局方法及系统。

技术介绍

[0002]芯片,即集成电路的载体,其诞生需要经过设计、制造、封装和测试这四个重要的过程。芯片的显著进步推动了新能源汽车、物联网、人工智能、边缘计算等多个领域的快速发展,但是,我国作为一个科技大国,芯片需求量居世界第一,国产芯片的自给率却不到10%。因此,大力发展国产芯片,实现大部分商用芯片的国产替代化,进而促进我国制造业的转型升级,是我国实现科技强国的必经之路。然而,现在的芯片设计过程往往要花费数年的时间,其中又以将包含宏单元和标准单元信息的网表映射到芯片画布上的芯片布局阶段最为复杂和耗时。芯片布局的复杂性主要来源于三个方面:网表的大小,芯片画报的网格粒度以及真正目标指标过高的计算成本(使用行业标准的EDA工具评估需要花费几个小时甚至一天以上)。尽管对芯片布局问题进行了几十年的研究,但专家们使用现有的芯片布局工具仍要进行数周的迭代才能生成满足各方面设计标准的布局方案本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于轻量化深度强化学习的芯片宏单元布局方法,其特征在于,包括:根据宏单元特征和芯片的网列表信息生成三维状态空间;所述芯片的网列表信息包括网列表图和网列表元数据;训练一轻量化深度强化学习网络;所述轻量化深度强化学习网络包括一轻量化策略网络和一价值网络;所述价值网络用于指导所述轻量化策略网络进行训练;所述轻量化策略网络包括多个子网络,所述子网络通过引入组正则子,并通过剪枝操作和压缩操作训练反卷积网络得到;将所述三维状态空间作为输入,根据训练好的轻量化深度强化学习网络输出芯片宏单元的最优布局策略;根据所述最优布局策略指导宏单元按照大小顺序逐一映射至芯片画布上。2.根据权利要求1所述的基于轻量化深度强化学习的芯片宏单元布局方法,其特征在于,所述根据宏单元特征和芯片的网列表信息生成三维状态空间,具体包括:将所述宏单元特征和所述网列表图输入至图神经网络中,通过图卷积运算生成宏单元嵌入和边缘嵌入;将所述网列表元数据输入至全连接网络中,得到网列表元数据嵌入;降低所述边缘嵌入的平均值,得到图嵌入;将当前宏单元信息和所述宏单元嵌入融合,得到当前宏单元嵌入;将所述网列表元数据嵌入、所述图嵌入和所述当前宏单元嵌入输入至所述全连接网络中,得到当前的所述三维状态空间。3.根据权利要求1所述的基于轻量化深度强化学习的芯片宏单元布局方法,其特征在于,利用所述价值网络指导所述轻量化策略网络进行训练,具体包括:将当前的所述三维状态空间输入至所述轻量化策略网络中,得到当前宏单元的动作空间;在当前的动作空间中随机抽取一个动作并执行所述动作,获得下一个三维状态空间;将当前的所述三维状态空间和所述下一个三维状态空间输入至所述价值网络中,得到第一价值值和第二价值值;根据所述第一价值值、所述第二价值值和外界环境对当前动作的奖励值,得到时序差分误差;将所述时序差分误差代替所述轻量化策略网络的目标函数中的优势函数;根据替换后的目标函数指导所述轻量化策略网络训练。4.根据权利要求1所述的基于轻量化深度强化学习的芯片宏单元布局方法,其特征在于,所述轻量化策略网络包括多个子网络,所述子网络通过引入组正则子,并通过剪枝操作和压缩操作训练反卷积网络得到,具体包括:基于强化学习结构初始化反卷积网络,得到第一策略网络;对所述第一策略网络进行多通道多层结构化处理,得到第二策略网络;在所述第二策略网络的目标函数中引入组正则子,对所述子网络的权值参数进行组内和组间稀疏约束,得到稀疏化策略网络;对所述稀疏化策略网络进行剪枝和压缩操作,得到所述轻量化策略网络。5.根据权利要求4所述的基于轻量化深度强化学习的芯片宏单元布局方法,其特征在
于,所述第一策略网络包括网络层,所述网络层包括输入层、输出层和位于所述输入层和所述输出层之间的至少一层反卷积层;每一层所述网络层包括预设数量个通道;每一个所述通道的深度是其对应网络层的深度的...

【专利技术属性】
技术研发人员:李珍妮谢胜利王名为元荣凌家城
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1