【技术实现步骤摘要】
一种面向AI智能SOC芯片的图像加速处理系统
本专利技术涉及计算机
,具体而言,涉及一种面向AI智能SOC芯片的图像加速处理系统。
技术介绍
近年来人工智能、机器学习随着移动互联网兴起,人脸识别,卫星图像处理,无人驾驶等涉及图像处理技术正在日益流行。图像处理算法需要大量的矩阵乘加运算,对大规模并行计算能力有很高的要求,CPU和传统计算框架无法满足对于并行计算能力的需求,需要特殊定制的AI智能SOC芯片。在现代系统的芯片上,图像处理优化工作分为两类,分别为系统级优化和内核级优化。系统级优化主要解决总体功耗,内存带宽加载,处理器间通信开销。内核级优化是围绕某一种图像处理函数进行优化,这只改进了单个函数的执行,并不一定会改进整个图像处理流程。在系统层级上,单纯的将各个图像任务链接并不会改善芯片内部ALU区域面积利用率提高并行度,仍然有大量的ALU处于空闲态,没有得到有效利用。在现有的加速处理算法可以很容易的实现单个设计节点的优化,但是无法从系统层级上根据原图像和最终给出的输出图像自动生成一组最优的解决方案。< ...
【技术保护点】
1.一种面向AI智能SOC芯片的图像加速处理系统,其特征在于:所述系统包括任务分析模块,任务链接模块,内部节点优化模块,寻找解决方案模块;/n任务分析模块用于自动确定本次图像处理所需要的执行的任务,并分析每个处理任务不同的内核实现所需要的开销;/n任务链接模块用于明确各个任务的执行顺序,根据任务的数据依赖关系将各个任务链接成图,并且将需要多次执行的任务拷贝副本;/n内部节点优化模块用于复制组合任务链接模块中的实现,以拓展解决方案;/n寻找解决方案模块用于根据生成的不同实现寻找本次图像处理任务的最优解决方案,最优解决方案根据芯片内部处理单元区域利用面积,吞吐量来衡量。/n
【技术特征摘要】
1.一种面向AI智能SOC芯片的图像加速处理系统,其特征在于:所述系统包括任务分析模块,任务链接模块,内部节点优化模块,寻找解决方案模块;
任务分析模块用于自动确定本次图像处理所需要的执行的任务,并分析每个处理任务不同的内核实现所需要的开销;
任务链接模块用于明确各个任务的执行顺序,根据任务的数据依赖关系将各个任务链接成图,并且将需要多次执行的任务拷贝副本;
内部节点优化模块用于复制组合任务链接模块中的实现,以拓展解决方案;
寻找解决方案模块用于根据生成的不同实现寻找本次图像处理任务的最优解决方案,最优解决方案根据芯片内部处理单元区域利用面积,吞吐量来衡量。
2.根据1所述面向AI智能SOC芯片的图像加速处理系统,其特征在于任务分析模块;通过分析输入图像和最终输出图像之间的关系,得到本次图像处理处理过程所用到的图像处理任务,为每一个任务生成不同的内核实现,并计算每种不同的实现使用芯片中ALU的数量以及吞吐量;对于每个内核都对主核心函数进行分析,以找到所有的并行度,然后进行严格的参数化;这可以通过标记所有循环并为每一个内核生成一组适当的属性信息,并将其保存为JSON文件来实现;具体步骤如下:
步骤1:将输入图像、任务要求等信息输入任务分析模块;
步骤2:任务分析模块自动生成本次图像处理所需要的图像处理任务;
步骤3:根据芯片内ALU利用面积和吞吐量的不同再为每一个任务生成不同的实现,并且记录相关信息,对于重复执行的任务节点做标记;
步骤4:将实现的具体属性信息保存到JSON文档中。
3.根据1所述的面向AI智能SOC芯片的图像加速处理系统其特征在于任务链接模块;
在执行整个图像处理过程中,在明确了所需要的任务后,需要确定任务处理的前后顺序,根据任务之间数据依赖关系,将各个任务链接成图,并为需要多次执行的任务在芯片内部存储器上拷贝副本,以减少芯片和内存之间的I/O次数...
【专利技术属性】
技术研发人员:季振洲,王佩锟,林灏铨,
申请(专利权)人:哈尔滨工业大学威海,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。