【技术实现步骤摘要】
一种在CANN计算构架下自动优化晟腾AI处理器性能及精度的方法
[0001]本专利技术涉及AI处理器领域,具体是一种在CANN计算构架下自动优化晟腾AI处理器性能及精度的方法。
技术介绍
[0002]CANN(Compute Architecture for Neural Networks)异构计算架构,是专门面向AI场景的统一异构计算架构,CANN可以释放昇腾硬件澎湃的算力,通过提供多层次的编程接口,支持用户快速构建基于昇腾平台的AI应用和业务。对上支持主流前端框架(如MindSpore,TensorFlow,PyTorch等),向下对用户屏蔽系列化芯片的硬件差异,可以在昇腾平台的多款AI处理器(NPU)上做计算,以全场景、低门槛、高性能的优势,满足用户全方位的人工智能诉求。昇腾910AI处理器是人工智能(AI)专用的神经网络处理器,其算力高达256T,最新款算力高达310T,是业界主流处理器算力的2倍,可配套MindSpore训练框架。当前业界大多数深度神经网络训练脚本基于TensorFlow的Python API开发, ...
【技术保护点】
【技术特征摘要】
1.一种在CANN计算构架下自动优化晟腾AI处理器性能及精度的方法,其特征在于,包括如下步骤:步骤一,获取神经网络中所有的算子,根据算子的数据类型进行二进制编码;步骤二,初始化候选解种群,生成预设数量的候选解;步骤三,适应度评估,以生成的候选解设置进行神经网络的训练,得到性能数据,若候选解个体的性能数据以及溢出数据都满足预设的阈值,则将其性能数据的倒数作为其适应度;步骤四,选择候选解进行交叉、变异以生成下一代种群;步骤五,判断是否满足预设的中止条件,若满足,输出最佳方案,根据最佳方案对昇腾AI处理器性能及精度进行优化;若不满足,返回步骤三。2.根据权利要求1所述的一种在CANN计算构架下自动优化晟腾AI处理器性能及精度的方法,其特征在于,所述的初始化候选解种群,生成预设数量的候选解,包括如下过程:S1,开启CANN的自动混合精度并使能损失缩放功能,对神经网络中所有算子的算子数据类型设置进行二进制编码,生成一个初始个体;S2,在该初始候选解的每个位置上以预设的概率进行变换以生成新的候选解;S3,重复S2直到生成的候选解数量达到预设要求。3.根据权利要求2所述的一种在CANN计算构架下自动优化晟腾AI处理器性能及精度的方法,其特征在于,所述的适应度评估,以生成的候选解设置进行神经网络的训练,得到性能数据,若候选解个体的性能数据以及溢出数据都满足预设的阈值,则将其性能数据的倒数作为其适应度,包括如下过程:S1、首先以该候选解设置进行神经网络的训练,得到性能数据;S2、若性能不达标则直接将该候选解个体的适应度设置为负,适应度为负的候选解会在选择过程中被筛除;若性能达标则检测其溢出数据,若出现连续的溢出数据则说...
【专利技术属性】
技术研发人员:孙亚楠,梁子轩,宋孝天,欧玉威,冯雨麒,
申请(专利权)人:四川大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。