【技术实现步骤摘要】
一种数据处理方法、装置、设备及计算机存储介质
[0001]本专利技术涉及计算机软件
,尤其涉及一种数据处理方法、装置、设备及计算机存储介质。
技术介绍
[0002]以机器学习、深度学习为代表的新一波人工智能热潮已经持续升温数年,深度学习是近年来人工智能领域的研究热点,在诸多领域获得了突破性的进展,现今有很多种深度学习框架以及支持多种深度学习框架的多种硬件平台。深度学习框架和硬件多样性给用户带来很大的好处,对于维持人工智能生态系统的健康发展至关重要,但支持多个框架和硬件需要巨大的工作量,这也给人工智能开发者带来了不小的挑战。
[0003]随着深度学习的应用越来越广,大家越来越关心深度学习算法在不同硬件架构上训练和推理的实现效率,由于深度学习有众多不同的前端和后端,因此需要一个桥梁来有效实现它们之间的优化和映射。IR(Intermediate Representation,中间表示)是程序编译过程中,源代码与目标代码之间翻译的中介,IR的设计对编译器来说非常关键,IR要考虑从源代码到目标代码编译的完备性、编译优化的 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取深度学习模型的第一动态中间表示;其中,所述第一动态中间表示中包括至少一个计算子图,所述计算子图包括N个节点和连接不同节点的有向边,所述有向边上承载有动态张量数据,N>1;根据所述至少一个计算子图各自对应的运行时长对所述至少一个计算子图进行筛选,获得至少一个待优化计算子图;对所述至少一个待优化计算子图进行优化,得到第二动态中间表示;其中,所述第二动态中间表示至少包括优化后的计算子图;对所述第二中间表示进行编译,得到后端硬件设备可执行的目标代码,以使所述后端硬件设备执行所述目标代码,实现所述目标代码的功能。2.如权利要求1所述的数据处理方法,其特征在于,所述根据所述至少一个计算子图各自对应的运行时长对所述至少一个计算子图进行筛选,获得至少一个待优化计算子图,包括:针对发生变化的计算子图,获取变化后的计算子图在所述后端硬件设备上执行的运行时长;在所述运行时长大于第一阈值的情况下,将所述运行时长对应的计算子图作为所述待优化计算子图。3.如权利要求1所述的数据处理方法,其特征在于,所述根据所述至少一个计算子图各自对应的运行时长对所述至少一个计算子图进行筛选,获得至少一个待优化计算子图,包括:针对发生变化的计算子图,获取变化后的计算子图在所述后端硬件设备上执行的运行时长,得到排序结果;其中,在所述排序结果中,运行时长越长,排名越靠前;将所述排序结果中排名前L位的运行时长对应的计算子图作为所述待优化计算子图,L>0。4.如权利要求1所述的数据处理方法,其特征在于,所述根据所述至少一个计算子图各自对应的运行时长对所述至少一个计算子图进行筛选,获得至少一个待优化计算子图,包括:针对发生变化的同一个计算子图,获取变化后的计算子图在所述后端硬件设备上执行的第一运行时长,以及变化前的计算子图在所述后端硬件设备上执行的第二运行时长;在所述第一运行时长与所述第二运行时长之间的差值大于第二阈值的情况下,将所述第一运行时长对应的计算子图作为所述待优化计算子图。5.一种数据处理方法,其特征在于,包括:获取目标代码和待处理图像;根据所述目标代码对所述待处理图像进行处理,得到图像处理结果;其中,所述目标代码为通过如权利要求1
‑
4中任一项所述的数据处理方法得到的。6.一种数据处理装置,其特征在于,包括接收单元和处理单元:所述接收单元,用于获取深度学习模型的第一动态中间表示;其中,所述第一动态中间表示中包括至少一个计算子图,所述计算子图包括N个节点和连接不同节点的有向边,所述有向边上承载有动态张量数据,N>1;
所述处理单元,用于根据所述至少一个计算子图各自对应的运行时长对所述至少一个计算子图进...
【专利技术属性】
技术研发人员:阳柳,杨强,邬轩,顾剑,李文成,刘勇鹏,
申请(专利权)人:飞腾信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。