【技术实现步骤摘要】
算子的生成方法、装置、设备以及存储介质
[0001]本公开涉及数据处理
,尤其涉及人工智能、深度学习
技术介绍
[0002]深度学习框架是人工智能领域的基础设施,算子是深度学习框架中最基础的组件。通过对深度学习框架中的算子进行调整,可以改善深度学习框架的性能以及其数据处理能力。
技术实现思路
[0003]本公开提供了一种算子的生成方法、装置、设备以及存储介质。
[0004]根据本公开的一方面,提供了一种算子的生成方法,包括:
[0005]根据深度学习框架所需处理的目标数据,确定深度学习框架的目标算子的配置文件,配置文件包括描述算子信息的第一配置项和描述算子逻辑运算的第二配置项;以及
[0006]根据配置文件,生成目标算子的计算图的源代码,以使目标算子的核函数与深度学习框架的调用接口关联,完成在深度学习框架中生成目标算子。
[0007]根据本公开的另一方面,提供了一种算子的生成装置,包括:
[0008]第一确定模块,用于根据深度学习框架所需处理的目标数据, ...
【技术保护点】
【技术特征摘要】
1.一种算子的生成方法,包括:根据深度学习框架所需处理的目标数据,确定所述深度学习框架的目标算子的配置文件,所述配置文件包括描述算子信息的第一配置项和描述算子逻辑运算的第二配置项;以及根据所述配置文件,生成所述目标算子的计算图的源代码,以使所述目标算子的核函数与所述深度学习框架的调用接口关联,完成在所述深度学习框架中生成所述目标算子。2.根据权利要求1所述的方法,其中,所述目标数据包括图像数据、语音数据、文本数据中的任一种。3.根据权利要求1或2所述的方法,其中,所述第一配置项包括确定的所述目标算子的输入张量、输出张量的维度、输出张量的数据类型、非张量参数、数据布局和计算设备中的一个或多个;所述第二配置项包括确定的所述目标算子的核函数、反向算子、调用算子中的一个或多个;和/或所述配置文件为Yaml格式的文件。4.根据权利要求1或2所述的方法,还包括:根据所述目标数据、所述目标算子的输入张量、输出张量的维度、输出张量的数据类型中的一个或多个,确定所述核函数。5.根据权利要求1或2所述的方法,其中,所述根据所述配置文件,生成所述目标算子的计算图的源代码,以使所述目标算子的核函数与所述深度学习框架的调用接口关联,完成在所述深度学习框架中生成所述目标算子,包括;根据所述配置文件,利用代码生成器生成所述目标算子的计算图的源代码,以使所述目标算子的核函数与所述深度学习框架的调用接口关联,完成在所述深度学习框架中生成所述目标算子。6.根据权利要求1或2所述的方法,其中,所述根据所述配置文件,生成所述目标算子的计算图的源代码,以使所述目标算子的核函数与所述深度学习框架的调用接口关联,完成在所述深度学习框架中生成所述目标算子,包括;根据所述配置文件,生成所述目标算子的动态计算图的源代码,以使所述目标算子的核函数与所述深度学习框架的调用接口关联,完成在所述深度学习框架中生成所述目标算子。7.根据权利要求6所述的方法,其中,所述根据所述配置文件,生成所述目标算子的动态计算图的源代码,以使所述目标算子的核函数与所述深度学习框架的调用接口关联,完成在所述深度学习框架中生成所述目标算子,包括:根据所述配置文件,生成所述目标算子的动态计算图中的第一接口的源代码,所述第一接口能够选择和调用所述目标算子的核函数;根据所述配置文件,生成所述目标算子的动态计算图中的第二接口的源代码,所述第二接口能够调用所述第一接口并进行自动微分;根据所述配置文件,生成所述目标算子的动态计算图中的第三接口的源代码,所述第三接口能够将所述第二接口供深度学习框架的调用接口调用,以使所述目标算子的核函数与所述深度学习框架的调用接口关联,完成在所述深度学习框架中生成所述目标算子。8.根据权利要求1或2所述的方法,其中,所述根据所述配置文件,生成所述目标算子的
计算图的源代码,以使所述目标算子的核函数与所述深度学习框架的调用接口关联,完成在所述深度学习框架中生成所述目标算子,包括;根据所述配置文件,生成所述目标算子的静态计算图的源代码,以使所述目标算子的核函数与所述深度学习框架的调用接口关联,完成在所述深度学习框架中生成所述目标算子。9.根据权利要求8所述的方法,其中,所述根据所述配置文件,生成所述目标算子的静态计算图的源代码,以使所述目标算子的核函数与所述深度学习框架的调用接口关联,完成在所述深度学习框架中生成所述目标算子,包括:根据所述配置文件,生成所述目标算子的静态计算图中的注册器的源代码,所述注册器能够基于所述配置文件对所述目标算子进行信息注册;根据所述配置文件,生成所述目标算子的静态计算图中的信息存储模块的源代码,所述信息存储模块能够基于所述配置文件存储所述目标算子的关键信息,所述算子的关键信息能够被静态图执行器基于所述注册器注册的信息进行调用,以使所述目标算子的核函数基于所述静态图执行器与所述深度学习框架的调用接口关联,...
【专利技术属性】
技术研发人员:张云飞,陈威行,陈飞宇,陈天宇,元日升,于佃海,刘红雨,胡晓光,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。