人工智能加速器、设备、芯片以及数据处理方法技术

技术编号:24707827 阅读:30 留言:0更新日期:2020-06-30 23:57
本申请实施例公开了一种人工智能加速器、设备、芯片以及数据处理方法,人工智能加速器包括指令解析单元、指令调度单元以及处理引擎集合;指令解析单元,用于读取目标长指令,目标长指令包括第一引擎标识集合、第一配置信息集合、第二引擎标识集合和第二配置信息集合;指令调度单元,用于按照第一引擎标识集合从处理引擎集合中抽取第一处理引擎子集,按照第二引擎标识集合从处理引擎集合中抽取第二处理引擎子集,根据第一配置信息集合调用第一处理引擎子集执行第一业务处理集合;当第一处理引擎子集中存在处理引擎执行完毕时,根据第二配置信息集合调用第二处理引擎子集执行第二业务处理集合。采用本申请,可以缩短对神经网络模型的处理时长。

【技术实现步骤摘要】
人工智能加速器、设备、芯片以及数据处理方法
本申请涉及互联网
,具体涉及人工智能
,尤其涉及一种人工智能加速器、一种人工智能加速设备、一种人工智能加速芯片及一种数据处理方法。
技术介绍
以卷积神经网络为代表的人工智能在图像识别、物体分类以及模式识别等领域均取得了成功应用。然而,随着深度学习算法的不断优化,模型的深度从几层扩展到上百层,随之而来的是计算量的同步膨胀。进一步地,在特定领域(例如,医疗领域或者高频视频领域),图片的分辨率已经达到2k*2k,甚至5k*5k,图片分辨率的增大,进一步增加了计算量。因此,如何对神经网络模型进行加速处理成为了亟待解决的重点问题。
技术实现思路
本申请实施例提供一种人工智能加速器、设备、芯片以及数据处理方法,可以缩短对神经网络模型的处理时长。本申请实施例一方面提供了一种人工智能加速器,包括指令解析单元、指令调度单元以及处理引擎集合;指令解析单元,用于读取目标长指令,目标长指令是对并行排布的目标神经网络模型进行适配生成的指令;目标长指令包括第一单位指令和第二本文档来自技高网...

【技术保护点】
1.一种人工智能加速器,其特征在于,包括指令解析单元、指令调度单元以及处理引擎集合;/n所述指令解析单元,用于读取目标长指令,所述目标长指令是对并行排布的目标神经网络模型进行适配生成的指令;所述目标长指令包括第一单位指令和第二单位指令;所述第一单位指令包括第一引擎标识集合以及第一配置信息集合;所述第二单位指令包括第二引擎标识集合以及第二配置信息集合;/n所述指令调度单元,用于按照所述第一引擎标识集合从所述处理引擎集合中抽取第一处理引擎子集,并按照所述第二引擎标识集合从所述处理引擎集合中抽取第二处理引擎子集;以及,根据所述第一配置信息集合调用所述第一处理引擎子集执行第一业务处理集合;当所述第一处...

【技术特征摘要】
1.一种人工智能加速器,其特征在于,包括指令解析单元、指令调度单元以及处理引擎集合;
所述指令解析单元,用于读取目标长指令,所述目标长指令是对并行排布的目标神经网络模型进行适配生成的指令;所述目标长指令包括第一单位指令和第二单位指令;所述第一单位指令包括第一引擎标识集合以及第一配置信息集合;所述第二单位指令包括第二引擎标识集合以及第二配置信息集合;
所述指令调度单元,用于按照所述第一引擎标识集合从所述处理引擎集合中抽取第一处理引擎子集,并按照所述第二引擎标识集合从所述处理引擎集合中抽取第二处理引擎子集;以及,根据所述第一配置信息集合调用所述第一处理引擎子集执行第一业务处理集合;当所述第一处理引擎子集中存在处理引擎执行完毕时,根据所述第二配置信息集合调用所述第二处理引擎子集执行第二业务处理集合。


2.根据权利1所述的人工智能加速器,其特征在于,对并行排布的目标神经网络模型进行适配生成的指令被存储在长指令集合中,所述目标长指令是所述长指令集合中的任意一个;
所述人工智能加速器还包括:指令编译单元、指令队列单元以及片外缓存单元;
指令编译单元,用于按照执行顺序将所述目标神经网络模型并行排布为多条短指令流水,将所述多条短指令流水编译为所述长指令集合,将所述长指令集合存储至所述片外缓存单元;
指令队列单元,用于从所述片外缓存单元读取所述目标长指令,并缓存所述目标长指令以供所述指令解析单元读取。


3.根据权利要求2所述的人工智能加速器,其特征在于,当所述目标长指令执行完毕时,所述指令解析单元从所述指令队列单元读取下一个目标长指令。


4.根据权利2所述的人工智能加速器,其特征在于,所述第一处理引擎子集包括搬入引擎、卷积引擎以及池化引擎;所述第一配置信息集合包括与所述搬入引擎对应的第一地址信息和第二地址信息、与所述卷积引擎对应的第三地址信息和第四地址信息,以及与所述池化引擎对应的第五地址信息和第六地址信息;所述第一业务处理集合包括数据搬入处理、数据卷积处理以及数据池化处理;
所述搬入引擎,用于将所述第一地址信息对应的第一存储单元所存储的待搬移数据搬入至所述第二地址信息对应的第二存储单元;
所述卷积引擎,用于对所述第三地址信息对应的第三存储单元存储的待卷积数据执行卷积处理,并将卷积处理后得到的卷积结果数据存储至所述第四地址信息对应的第四存储单元;所述待卷积数据是所述指令调度单元根据前一个目标长指令调用所述搬入引擎搬入至所述第三存储单元的;
所述池化引擎,用于对所述第五地址信息对应的第五存储单元所存储的待池化数据执行池化处理,并将池化处理后得到的池化结果数据存储至所述第六地址信息对应的第六存储单元;所述待池化数据是所述指令调度单元根据所述前一个目标长指令调用所述卷积引擎卷积处理后存储至所述第五存储单元的;所述搬入引擎、所述卷积引擎以及所述池化引擎是并发执行。
<...

【专利技术属性】
技术研发人员:孟玉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1