当前位置: 首页 > 专利查询>北京大学专利>正文

一种基于昇腾AI处理器的跨步切片算子处理方法及装置制造方法及图纸

技术编号:31086117 阅读:31 留言:0更新日期:2021-12-01 12:39
本申请公开了一种基于昇腾AI处理器的跨步切片算子处理方法及装置。其中,该方法包括:获取跨步切片算子的输入张量和待提取切片的下标;基于所述待提取切片的下标确定所述待提取切片在所述输入张量中的起始下标和长度;利用所述起始下标和所述长度从所述输入张量中确定待搬运的数据;通过昇腾AI处理器的输出缓冲区将所述待搬运的数据搬运至输出张量。本申请解决了跨步切片算子处理速度低的技术问题。请解决了跨步切片算子处理速度低的技术问题。请解决了跨步切片算子处理速度低的技术问题。

【技术实现步骤摘要】
一种基于昇腾AI处理器的跨步切片算子处理方法及装置


[0001]本申请涉及人工智能领域,具体而言,涉及一种基于昇腾AI处理器的跨步切片算子处理方法及装置。

技术介绍

[0002]跨步切片(StridedSlice)算子是人工智能(Artificial Intelligence,AI)计算中用于提取张量中切片的计算单元,可以基于张量虚拟机(Tensor Virtual Machine,TVM)和张量迭代器内核(Tensor Iterator Kernel,TIK)这两种算子开发方式实现。
[0003]现有方案中,基于TVM开发方式实现的StridedSlice算子在获得张量中特定维度下特定索引对应的切片时,无法充分发挥AI处理器的性能优势,处理耗时较长,存在跨步切片算子处理速度低的技术问题。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本申请实施例提供了一种基于昇腾AI处理器的跨步切片算子处理方法及装置,以至少解决跨步切片算子处理速度低的技术问题。
>[0006]根据本本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于昇腾AI处理器的跨步切片算子处理方法,其特征在于,包括:获取跨步切片算子的输入张量和待提取切片的下标;基于所述待提取切片的下标确定所述待提取切片在所述输入张量中的起始下标和长度;利用所述起始下标和所述长度从所述输入张量中确定待搬运的数据;通过昇腾AI处理器的输出缓冲区将所述待搬运的数据搬运至输出张量。2.根据权利要求1所述的方法,其特征在于,基于所述待提取切片的下标确定所述待提取切片的长度包括:确定所述输入张量的形状;基于所述输入张量的形状和所述待提取切片的下标获取所述输入张量中未被所述待提取切片的下标覆盖的维度的权重;将获取到的权重确定为所述待提取切片的长度。3.根据权利要求1所述的方法,其特征在于,基于所述待提取切片的下标确定所述待提取切片在所述输入张量中的起始下标包括:对所述起始下标进行初始化处理,得到所述起始下标的初始值;确定所述输入张量的形状;基于所述输入张量的形状和所述待提取切片的下标获取所述输入张量中已被所述待提取切片的下标覆盖的每个维度对应的坐标值和权重;利用所述初始值以及所述输入张量中已被所述待提取切片的下标覆盖的每个维度对应的坐标值和权重,计算得到所述起始下标。4.根据权利要求1所述的方法,其特征在于,通过所述昇腾AI处理器的所述输出缓冲区将所述待搬运的数据搬运至所述输出张量包括:调用张量加速引擎平台中的预设应用程序接口,获取所述昇腾AI处理器的计算核心数量;基于所述长度和所述计算核心数量,通过所述输出缓冲区将所述待搬运的数据搬运至所述输出张量。5.根据权利要求4所述的方法,其特征在于,基于所述长度和所述计算核心数量,通过所述输出缓冲区将所述待搬运的数据搬运至所述输出张量包括:基于所述长度和所述昇腾AI处理器中数据搬运最小单位,将所述长度转换为所述数据搬运最小单位对应的数据块的初始数量;对所述初始数量进行向下取整,得到所述数据块的目标数量;按照所述目标数量,通过所述输出缓冲区将所述待搬运的数据搬运至所述输出张量。6.根据权利要求5所述的方法,其特征在于,按照所述目标数量,通过所述输出缓冲区将所述待搬运的数据搬运至所述输出张量包括:当所述目标数量为0时,使用所述昇腾AI处理器中单个计算核心对所...

【专利技术属性】
技术研发人员:龙汀汀樊春董昊森马银萍
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1