【技术实现步骤摘要】
本申请实施例涉及人工智能,尤其涉及一种旋转算子的执行方法、设备、存储介质及程序产品。
技术介绍
1、人工智能模型通常指被训练用来进行推理预测的神经网络模型,例如图像推理模型、语音推理模型等。在实际应用中,采用人工智能芯片实现人工智能模型的运算。
2、在机器视觉、图像处理等
,人工智能芯片常常需要对整张输入图像执行旋转操作后,再对输入图像进行处理。为了实现上述旋转操作,相关旋转算子以像素点为粒度将输入图像加载到片上,按照像素点粒度进行旋转运算,并将运算结果写出到显存。
3、然而,在上述旋转算子的执行过程中,需要频繁访问显存,从而导致访存压力较大,进而导致旋转算子的性能较差。
技术实现思路
1、本申请实施例提供了一种旋转算子的执行方法、设备、存储介质及程序产品,用于降低旋转算子执行过程中的访存压力,提高旋转算子的性能。
2、一方面,本申请实施例提供了一种旋转算子的执行方法,包括:
3、将显存中的待处理图像划分为多个原始像素块,并针对所述多个
...【技术保护点】
1.一种旋转算子的执行方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述一个原始像素块包含的多个像素点中,存在至少两个像素点在所述显存中的位置是连续的;
3.如权利要求1所述的方法,其特征在于,所述目标像素块包含的多个像素点中,存在至少两个像素点写出到所述显存的位置是连续的;
4.如权利要求1所述的方法,其特征在于,所述从所述片上高速缓存中读取所述一个原始像素块包含的多个像素点,并对所述多个像素点的原始坐标分别执行旋转运算,获得所述多个像素点的目标坐标,包括:
5.如权利要求1所述的方法,其特征在于,
...【技术特征摘要】
1.一种旋转算子的执行方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述一个原始像素块包含的多个像素点中,存在至少两个像素点在所述显存中的位置是连续的;
3.如权利要求1所述的方法,其特征在于,所述目标像素块包含的多个像素点中,存在至少两个像素点写出到所述显存的位置是连续的;
4.如权利要求1所述的方法,其特征在于,所述从所述片上高速缓存中读取所述一个原始像素块包含的多个像素点,并对所述多个像素点的原始坐标分别执行旋转运算,获得所述多个像素点的目标坐标,包括:
5.如权利要求1所述的方法,其特征在于,所述从所述片上高速缓存中读取所述一个原始像素块包含的多个像素点,并对所述多个像素点的原始坐标分别执行旋转运算,获得所述多个像素点的目标坐标,包括:
6.如权利要求4或5所述的方法,其特征在于,所述按照所述多个像素点的目标坐标,分别将所述...
【专利技术属性】
技术研发人员:请求不公布姓名,请求不公布姓名,请求不公布姓名,请求不公布姓名,请求不公布姓名,请求不公布姓名,请求不公布姓名,
申请(专利权)人:上海壁仞科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。