用于在GPU上执行标准卷积的方法和系统技术方案

技术编号:42629519 阅读:32 留言:0更新日期:2024-09-06 01:30
用于在GPU上执行标准卷积的方法和系统。在图形处理单元上实施标准卷积的方法包括:在图形处理单元接收密集格式的输入张量;在图形处理单元标识输入张量的活动位置;基于输入张量的已标识的活动位置,在图形处理单元对输入张量执行索引展开运算,以在输入张量的每个非零窗口生成由输入张量元素组成的输入矩阵;及在图形处理单元执行权重矩阵与输入矩阵之间的矩阵乘法,以生成输出矩阵,该输出矩阵由基于输入张量的非零窗口的标准卷积的输出张量元素组成。

【技术实现步骤摘要】

本申请涉及用于在图形处理单元(gpu)上执行标准卷积的方法和系统。


技术介绍

1、如本领域技术人员所已知,点云是在二维(2d)或三维(3d)空间中绘制的一组单独的数据点。例如,3d点云中的每个点可以表示在特定x、y和z位置处的测量值。点云可用于表示空间中的对象。点云可以通过传感器生成,例如但不限于lidar扫描仪或深度相机。如本领域技术人员所已知,lidar扫描仪使用脉冲激光器形式的光来测量距离。由于点云通常不具有每个可能坐标的点,因此点云被认为是稀疏数据集。

2、存在可运用点云的各种现实世界人工智能应用,例如增强╱虚拟现实(例如,内部场景的布局检测)和自主驾驶(例如,提取可驾驶区域)。因此,在点云上执行深度学习任务已经受到学术界和工业的极大关注,且人工神经网络(在本文中简称为神经网络)已被开发来处理点云,该网络在本文中可被称为点云神经网络。如本领域技术人员所已知,神经网络包括可用于机器学习应用的一个或多个互连层。具体地,神经网络可用于信号处理应用程序中,该信号处理应用程序包括但不限于图像处理应用程序和计算机视觉应用程序。</p>

3、图1本文档来自技高网...

【技术保护点】

1.一种在图形处理单元上实施标准卷积的方法(2100),该方法(2100)包括:

2.根据权利要求1所述的方法(2100),其中输入张量具有至少高度维度、宽度维度和通道维度,且输入张量的活动位置是其中输入张量的至少一个通道具有非零元素的高度和宽度位置。

3.根据权利要求2所述的方法(2100),其中标识输入张量的活动位置包括:

4.根据权利要求2所述的方法(2100),还包括生成活动位置列表,该活动位置列表包括输入张量每个活动位置的高度和宽度坐标。

5.根据权利要求1所述的方法(2100),其中输入张量的非零窗口是用于计算标准卷积的至少一个...

【技术特征摘要】

1.一种在图形处理单元上实施标准卷积的方法(2100),该方法(2100)包括:

2.根据权利要求1所述的方法(2100),其中输入张量具有至少高度维度、宽度维度和通道维度,且输入张量的活动位置是其中输入张量的至少一个通道具有非零元素的高度和宽度位置。

3.根据权利要求2所述的方法(2100),其中标识输入张量的活动位置包括:

4.根据权利要求2所述的方法(2100),还包括生成活动位置列表,该活动位置列表包括输入张量每个活动位置的高度和宽度坐标。

5.根据权利要求1所述的方法(2100),其中输入张量的非零窗口是用于计算标准卷积的至少一个输出张量元素的输入张量窗口,且包括至少一个非零元素。

6.根据权利要求1至5中任一项所述的方法(2100),其中对输入张量执行索引展开运算包括从输入张量的已标识活动位置和标准卷积的一个或多个参数中标识输入张量的非零窗口。

7.根据权利要求6所述的方法(2100),其中标识输入张量的非零窗口包括:

8.根据权利要求6所述的方法(2100),其中对输入张量执行索引展开运算还包括从标准卷积的一个或多个参数中标识各已标识非零窗口的元素。

9.根据权利要求8所述的方法(2100),其中标识所识别的非零窗口的元素包括识别非零窗口内的预定元素的输入张量中的位置,以及实施一系列嵌套循环以在非零窗口中从所识别的位置移动元素,所述一系列嵌套循环包括非零窗口的每个维度的循环。

10.根据权利要求1至5中任一项所述的方法(2100),其中执行索引展开运算包括将输入张量的非零窗口的元素存储在输入矩阵中。

11.根据权利要求10所述的方法(2100),还包括接收零输入矩阵,且输入张量的非零窗口的元素存储在已接收的输入矩阵中...

【专利技术属性】
技术研发人员:G·V·德米尔吉C·迪基奇G·M·史蒂文斯杨乐
申请(专利权)人:想象技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1