【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种算子的自动生成方法、装置、设备及介质。
技术介绍
1、ai(artificial intelligence,人工智能)编译器作为深度学习与人工智能芯片的沟通桥梁,需要将深度学习算法模型逐步转变为可供特定机器执行的可执行文件。ai编译器一般由前端和后端两部分组成,其中,前端用于将深度学习模型与深度学习框架连接,将框架层转化为高级中间表达,以及将高级中间表达转换为算子的具体实现。
2、生成算子的具体实现是ai编译器中较为重要的一环,算子实现的优劣将直接影响深度学习网络在硬件上执行的性能,但在现有常见的深度学习框架下,算子种类数量较为庞大。
3、传统的深度学习算子通常是由技术人员在ai编译器的前端手工编写完成,编写工程量大、实现周期长,并且手工编写出来的算子质量和程序员个人的经验、技术呈正相关,不同的技术人员编写的算子质量参差不齐,并且,若手工编写的算子对特定的芯片架构进行了优化,则会降低代码的可移植性,而随着不同芯片架构的推出,还需要进行额外的工作来适配和优化算子,从而加大技术人员
<本文档来自技高网...【技术保护点】
1.一种算子自动生成方法,其特征在于,由在人工智能AI编译器中预先加载的算子自动生成工具执行,包括:
2.根据权利要求1所述的方法,其特征在于,根据预先获取的选项集以及AI编译器所适配硬件的硬件信息,对所述初始函数进行优化处理,包括:
3.根据权利要求1所述的方法,其特征在于,根据所述选项集,对优化处理后的初始函数进行多次代码插入以及优化处理,生成与所述目标算子相对应的算子实现,包括:
4.根据权利要求3所述的方法,其特征在于,对所述第一算子实现进行数据搬运优化,包括下述至少一项:
5.根据权利要求3所述的方法,其特征在
...【技术特征摘要】
1.一种算子自动生成方法,其特征在于,由在人工智能ai编译器中预先加载的算子自动生成工具执行,包括:
2.根据权利要求1所述的方法,其特征在于,根据预先获取的选项集以及ai编译器所适配硬件的硬件信息,对所述初始函数进行优化处理,包括:
3.根据权利要求1所述的方法,其特征在于,根据所述选项集,对优化处理后的初始函数进行多次代码插入以及优化处理,生成与所述目标算子相对应的算子实现,包括:
4.根据权利要求3所述的方法,其特征在于,对所述第一算子实现进行数据搬运优化,包括下述至少一项...
【专利技术属性】
技术研发人员:吴健,贾明桥,柴亮,赵黎明,闫燕莺,翟志宏,卫创,景鹏飞,
申请(专利权)人:上海燧原智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。