一种提升AI计算芯片超分运算性能的方法技术

技术编号:37302300 阅读:24 留言:0更新日期:2023-04-21 22:47
本申请提供一种提升AI计算芯片超分运算性能的方法,属于存内超分运算性能领域,方法采用第一预设神经网络训练生成查找表,并将查找表预先存储至AI计算芯片中的SRAM存储器;按照预设的内存分配比例将SRAM存储器切分为输入内存、中间内存和输出内存;利用所述查找表对Real ESRGAN超分模型的输出插值算子进行优化,优化后的算子在推理的时候就可以合理排布到所述输入内存、中间内存和输出内存;获取待处理LR图像并输入所述AI计算芯片,依据芯片内部预设的组件排布运算流程对待处理LR图像进行推理运算,输出最终的HR图像。本申请提升了芯片的运算速度、降低了总线传输延时和芯片部署成本。署成本。署成本。

【技术实现步骤摘要】
一种提升AI计算芯片超分运算性能的方法


[0001]本申请属于存内超分运算性能领域,具体涉及一种提升AI计算芯片超分运算性能的方法。

技术介绍

[0002]现主流的超分模型都采用输入为LR图像,对LR图像做特征提取,最后输出Interpolate(插值)为HR,如比较典型的SR模型
‑‑‑
Real

ESRGAN,RealESRGAN的网络结构包含依次连接的输入层、RRDB模块和输出层。其中,如图2所示,RRDB模块(ResidualinResidualDenseBlock,中文简称残差密集块)的网络结构具体包括多个串联拼接的DenseBlock模块,每个DenseBlock模块中有五层结构,每层结构中均包含conv算子,前四层结构中还设有Lrelu算子。
[0003]传统冯
·
诺依曼架构下存储单元和运算单元分离,数据需在计算和存储单元之间频繁移动,数据搬运的时间甚至会达到计算时间的数百倍,并在此过程造成占比逾60%

90%的功耗。存内计算通过对存储器件进行改造,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种提升AI计算芯片超分运算性能的方法,其特征在于,包括:采用第一预设神经网络训练生成查找表,并将所述查找表预先存储至AI计算芯片中的SRAM存储器;按照预设的内存分配比例将所述SRAM存储器切分为输入内存、中间内存和输出内存;利用所述查找表对Real ESRGAN超分模型的输出插值算子进行优化,优化后的算子在推理的时排布至所述输入内存、中间内存和输出内存;获取待处理LR图像并输入所述AI计算芯片,依据芯片内部预设的组件排布运算流程对所述待处理LR图像进行推理运算,输出最终的HR图像。2.根据权利要求1所述的一种提升AI计算芯片超分运算性能的方法,其特征在于,所述采用第一预设神经网络训练生成查找表,并将所述查找表预先存储至AI计算芯片中的SRAM存储器具体包括:先利用预设的训练集对第一预设神经网络进行训练,获得具有小感受野的轻量级深度SR网络;所述第一预设神经网络具体为6个卷积层组成的深度网络;依据预设的采样间隔对LR训练图像的原始像素输入范围进行下采样处理;以下采样处理后LR训练图像的像素输入值作为查找表的索引,将预设LR图像的像素输入值输入所述轻量级深度SR网络进行学习,计算出对应的HR输出值并存储至所述查找表。3.根据权利要求1所述的一种提升AI计算芯片超分运算性能的方法,其特征在于,所述按照预设的内存分配比例将所述SRAM存储器切分为输入内存、中间内存和输出内存具体包括:依据所述SRAM存储器的内存大小,按照预设的内存分配比例将所述SRAM存储器内存空间切分为输入内存、中间内存和输出内存;所述预设的内存分配比例为1:4:1。4.根据权利要求1所述的一种提升AI计算芯片超分运算性能的方法,其特征在于,所述利用所述查找表对Real ESRGAN超分模型的输出插值算子进行优化,优化后的算子在推理的时排布至所述输入内存、中间内存和输出内存,具体包括:利用查表法对Real ESRGAN超分模型的输出插值算子进行优化,将输出插值算子的运算方式设置为查表,依据输出插值算子的输入值在所述查找表中查找出对应的输出值,并将查找出的输出值作为输出插值算子的运算结果;所述输出插值算子具体包括第一Lrelu算子、第二Lrelu算子、第三Lrelu算子、第一Upconv算子、第二Upconv算子、HRc...

【专利技术属性】
技术研发人员:章锦腾胡建伟周兵熊大鹏李涛
申请(专利权)人:亿铸科技杭州有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1