一种提升AI计算芯片超分运算性能的方法技术

技术编号：37302300 阅读：24 留言：0更新日期：2023-04-21 22:47

本申请提供一种提升AI计算芯片超分运算性能的方法，属于存内超分运算性能领域，方法采用第一预设神经网络训练生成查找表，并将查找表预先存储至AI计算芯片中的SRAM存储器；按照预设的内存分配比例将SRAM存储器切分为输入内存、中间内存和输出内存；利用所述查找表对Real ESRGAN超分模型的输出插值算子进行优化，优化后的算子在推理的时候就可以合理排布到所述输入内存、中间内存和输出内存；获取待处理LR图像并输入所述AI计算芯片，依据芯片内部预设的组件排布运算流程对待处理LR图像进行推理运算，输出最终的HR图像。本申请提升了芯片的运算速度、降低了总线传输延时和芯片部署成本。署成本。署成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种提升AI计算芯片超分运算性能的方法

[0001]本申请属于存内超分运算性能领域，具体涉及一种提升AI计算芯片超分运算性能的方法。

技术介绍

[0002]现主流的超分模型都采用输入为LR图像，对LR图像做特征提取，最后输出Interpolate（插值）为HR，如比较典型的SR模型
‑‑‑
Real
‑
ESRGAN，RealESRGAN的网络结构包含依次连接的输入层、RRDB模块和输出层。其中，如图2所示，RRDB模块（ResidualinResidualDenseBlock，中文简称残差密集块）的网络结构具体包括多个串联拼接的DenseBlock模块，每个DenseBlock模块中有五层结构，每层结构中均包含conv算子，前四层结构中还设有Lrelu算子。
[0003]传统冯
·
诺依曼架构下存储单元和运算单元分离，数据需在计算和存储单元之间频繁移动，数据搬运的时间甚至会达到计算时间的数百倍，并在此过程造成占比逾60%
‑
90%的功耗。存内计算通过...

【技术保护点】

【技术特征摘要】
1.一种提升AI计算芯片超分运算性能的方法，其特征在于，包括：采用第一预设神经网络训练生成查找表，并将所述查找表预先存储至AI计算芯片中的SRAM存储器；按照预设的内存分配比例将所述SRAM存储器切分为输入内存、中间内存和输出内存；利用所述查找表对Real ESRGAN超分模型的输出插值算子进行优化，优化后的算子在推理的时排布至所述输入内存、中间内存和输出内存；获取待处理LR图像并输入所述AI计算芯片，依据芯片内部预设的组件排布运算流程对所述待处理LR图像进行推理运算，输出最终的HR图像。2.根据权利要求1所述的一种提升AI计算芯片超分运算性能的方法，其特征在于，所述采用第一预设神经网络训练生成查找表，并将所述查找表预先存储至AI计算芯片中的SRAM存储器具体包括：先利用预设的训练集对第一预设神经网络进行训练，获得具有小感受野的轻量级深度SR网络；所述第一预设神经网络具体为6个卷积层组成的深度网络；依据预设的采样间隔对LR训练图像的原始像素输入范围进行下采样处理；以下采样处理后LR训练图像的像素输入值作为查找表的索引，将预设LR图像的像素输入值输入所述轻量级深度SR网络进行学习，计算出对应的HR输出值并存储至所述查找表。3.根据权利要求1所述的一种提升AI计算芯片超分运算性能的方法，其特征在于，所述按照预设的内存分配比例将所述SRAM存储器切分为输入内存、中间内存和输出内存具体包括：依据所述SRAM存储器的内存大小，按照预设的内存分配比例将所述SRAM存储器内存空间切分为输入内存、中间内存和输出内存；所述预设的内存分配比例为1:4:1。4.根据权利要求1所述的一种提升AI计算芯片超分运算性能的方法，其特征在于，所述利用所述查找表对Real ESRGAN超分模型的输出插值算子进行优化，优化后的算子在推理的时排布至所述输入内存、中间内存和输出内存，具体包括：利用查表法对Real ESRGAN超分模型的输出插值算子进行优化，将输出插值算子的运算方式设置为查表，依据输出插值算子的输入值在所述查找表中查找出对应的输出值，并将查找出的输出值作为输出插值算子的运算结果；所述输出插值算子具体包括第一Lrelu算子、第二Lrelu算子、第三Lrelu算子、第一Upconv算子、第二Upconv算子、HRc...

【专利技术属性】
技术研发人员：章锦腾，胡建伟，周兵，熊大鹏，李涛，
申请(专利权)人：亿铸科技杭州有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人