【技术实现步骤摘要】
用于处理数据的方法、装置、设备以及存储介质
[0001]本公开涉及计算机
,具体涉及深度学习
,尤其涉及用于处理数据的方法、装置、设备以及存储介质。
技术介绍
[0002]张量是面向高维时空数据和信号的存储和表达形式,例如图像数据可以表达为形状为NCHW形的4D张量,N、C、H、W分别代表帧、颜色通道、行和列。深度学习、计算机视觉、自然语言处理等信息处理应用中经常对多个张量进行处理,用于提取特征、对数据进行分类等,这些张量处理常伴随大量维度扩充、对齐和置换等预处理和后处理操作,导致代码臃肿,既容易出现编写错误,也可能损害性能。
[0003]Einsum是基于爱因斯坦求和约定的描述性张量操作编程接口(API),其覆盖丰富的张量操作语义。Einsum功能强大是指其支持大量常见的张量计算,以及这些计算的复合形式,例如迹(trace)、对角元(diagonal)、转置(transpose)、维度缩减(squeeze)、维度扩充(unsqueeze)、按维度求和(sum)、内积(dot)、外积(outer)、广播乘 ...
【技术保护点】
【技术特征摘要】
1.一种用于处理数据的方法,包括:获取输入目标函数的目标参数;确定预先缓存的静态图集合中是否存在与所述目标参数对应的静态图;响应于确定不存在与所述目标参数对应的静态图,根据所述目标参数,生成代码信息;根据所述代码信息,生成目标静态图;根据所述目标静态图,确定利用所述目标函数处理所述目标参数的处理结果。2.根据权利要求1所述的方法,其中,所述根据所述代码信息,生成目标静态图,包括:对所述代码信息规划代码执行逻辑,形成动态图;将动态图转化为所述目标静态图。3.根据权利要求2所述的方法,其中,所述目标参数包括标记字符串和多个操作数;以及所述对所述代码信息规划代码执行逻辑,形成动态图,包括:根据所述标记字符串和多个操作数,生成全局视图;根据所述全局视图,确定出进行归约计算的操作数;根据归约计算后得到的更新操作数以及所述标记字符串,确定动态图。4.根据权利要求3所述的方法,其中,所述根据所述标记字符串和多个操作数,生成全局视图,包括:对所述标记字符串进行解析,确定输入标记和输出标记;根据所述输入标记、所述输出标记以及多个操作数,创建全局标记视图和全局形状视图。5.根据权利要求4所述的方法,其中,所述根据所述全局视图,确定出进行归约计算的操作数,包括:对于所述全局形状视图中的每个输出列,如果该列中存在一个大于预设值的行,则在所述全局标记视图中查找非零值的行对应的操作数,将查找到的操作数作为进行归约计算的操作数。6.根据权利要求4所述的方法,其中,所述根据归约计算后得到的更新操作数以及所述标记字符串,确定动态图,包括:根据归约计算后得到的更新操作数,更新所述全局形状视图;根据更新的全局形状视图,对更新操作数进行乘加计算,得到乘加计算结果;对所述乘加计算结果进行调整,得到动态图。7.根据权利要求6所述的方法,其中,所述根据归约计算后得到的更新操作数,更新所述全局形状视图,包括:将计算后得到的更新操作数的维度形状置为预设值,得到更新的全局形状视图。8.根据权利要求6所述的方法,其中,所述根据更新的全局形状视图,对更新操作数进行乘加计算,包括:根据所述更新操作数的维度进行排序,得到排序后操作数;根据所述全局标记视图和所述全局形状视图,将所述输入标记和所述输出标记分为预设数量个组;将所述排序后操作数中的两个操作数按照分组顺序进行转置后合并,得到两个张量;
对所述两个张量进行乘积。9.根据权利要求1所述的方法,其中,所述根据所述目标参数,生成代码信息,包括:根据所述目标函数以及所述目标参数,确定等价于所述目标函数的至少一个处理函数;确定各处理函数的计算复杂度;根据最小计算复杂度对应的处理函数,生成代码信息。10.根据权利要求1
‑
9任一项所述的方法,其中,所述方法还包括:将所述目标静态图存储到所述静态图集合。11.一种用于处理数据的装置,包括:参数获取单元,被配置成获取输入目标函数的目标参数;缓存查询单元,被配置成确定预先缓存的静态图集合中是否存在与所述目标参数对应的静态图;代码生成单元,被配置成响应于确定不存在与所述目标参数对应的静态图,根据所述目标参数,生成代码信息;静态图生成单元,被...
【专利技术属性】
技术研发人员:白童心,张留杰,胡晓光,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。