一种旋转算子的执行方法、设备、存储介质及程序产品技术

技术编号:42471578 阅读:21 留言:0更新日期:2024-08-21 12:56
本申请实施例提供了一种旋转算子的执行方法、设备、存储介质及程序产品,涉及人工智能技术领域,该方法包括:将显存中的待处理图像划分为多个原始像素块,每个原始像素块包括多个像素点,然后将整个原始像素块加载到片上高速缓存中,增大了片上片外之间数据传输的粒度,降低了访问显存的频率,从而降低访存压力。从片上高速缓存中读取原始像素块中的像素点执行旋转运算,并按照旋转后的目标坐标将像素点写出到片上高速缓存。当整个原始像素块执行完旋转运算时,将旋转得到的目标像素块从片上高速缓存写出到显存。也就是说,本申请利用片上高速缓存对数据进行缓冲,并利用片上高带宽执行图像旋转操作,从而提高了图像旋转算子的性能。

【技术实现步骤摘要】

本申请实施例涉及人工智能,尤其涉及一种旋转算子的执行方法、设备、存储介质及程序产品


技术介绍

1、人工智能模型通常指被训练用来进行推理预测的神经网络模型,例如图像推理模型、语音推理模型等。在实际应用中,采用人工智能芯片实现人工智能模型的运算。

2、在机器视觉、图像处理等
,人工智能芯片常常需要对整张输入图像执行旋转操作后,再对输入图像进行处理。为了实现上述旋转操作,相关旋转算子以像素点为粒度将输入图像加载到片上,按照像素点粒度进行旋转运算,并将运算结果写出到显存。

3、然而,在上述旋转算子的执行过程中,需要频繁访问显存,从而导致访存压力较大,进而导致旋转算子的性能较差。


技术实现思路

1、本申请实施例提供了一种旋转算子的执行方法、设备、存储介质及程序产品,用于降低旋转算子执行过程中的访存压力,提高旋转算子的性能。

2、一方面,本申请实施例提供了一种旋转算子的执行方法,包括:

3、将显存中的待处理图像划分为多个原始像素块,并针对所述多个原始像素块,分别执行本文档来自技高网...

【技术保护点】

1.一种旋转算子的执行方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述一个原始像素块包含的多个像素点中,存在至少两个像素点在所述显存中的位置是连续的;

3.如权利要求1所述的方法,其特征在于,所述目标像素块包含的多个像素点中,存在至少两个像素点写出到所述显存的位置是连续的;

4.如权利要求1所述的方法,其特征在于,所述从所述片上高速缓存中读取所述一个原始像素块包含的多个像素点,并对所述多个像素点的原始坐标分别执行旋转运算,获得所述多个像素点的目标坐标,包括:

5.如权利要求1所述的方法,其特征在于,所述从所述片上高速缓...

【技术特征摘要】

1.一种旋转算子的执行方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述一个原始像素块包含的多个像素点中,存在至少两个像素点在所述显存中的位置是连续的;

3.如权利要求1所述的方法,其特征在于,所述目标像素块包含的多个像素点中,存在至少两个像素点写出到所述显存的位置是连续的;

4.如权利要求1所述的方法,其特征在于,所述从所述片上高速缓存中读取所述一个原始像素块包含的多个像素点,并对所述多个像素点的原始坐标分别执行旋转运算,获得所述多个像素点的目标坐标,包括:

5.如权利要求1所述的方法,其特征在于,所述从所述片上高速缓存中读取所述一个原始像素块包含的多个像素点,并对所述多个像素点的原始坐标分别执行旋转运算,获得所述多个像素点的目标坐标,包括:

6.如权利要求4或5所述的方法,其特征在于,所述按照所述多个像素点的目标坐标,分别将所述...

【专利技术属性】
技术研发人员:请求不公布姓名请求不公布姓名请求不公布姓名请求不公布姓名请求不公布姓名请求不公布姓名请求不公布姓名
申请(专利权)人:上海壁仞科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1