用于在GPU上执行稀疏子流形解卷积的方法和系统技术方案

技术编号:42629515 阅读:30 留言:0更新日期:2024-09-06 01:30
用于在GPU上执行稀疏子流形解卷积的方法和系统。稀疏子流形解卷积可表示为稀疏子流形解卷积的输入张量与多个子滤波器中的每一个之间的直接卷积,其中多个子滤波器中的每个子滤波器包括稀疏子流形解卷积的滤波器的权重子集。该方法包括:在图形处理单元接收密集格式的输入张量;在图形处理单元接收可标识稀疏子流形解卷积的输出张量的目标位置的信息;基于所标识的输出张量目标位置,在图形处理单元对输入张量执行索引展开运算,以在输入张量的每个子窗口生成与输出张量的至少一个已标识目标位置有关的包括输入张量元素的输入矩阵;及在图形处理单元执行权重矩阵与输入矩阵之间的矩阵乘法,以在已标识的目标位置生成包括输出张量元素的输出矩阵。

【技术实现步骤摘要】

本申请涉及用于在图形处理单元(gpu)上执行稀疏子流形解卷积的方法和系统。


技术介绍

1、如本领域技术人员所已知,点云是在二维(2d)或三维(3d)空间中绘制的一组单独的数据点。例如,3d点云中的每个点可以表示在特定x、y和z位置处的测量值。点云可用于表示空间中的对象。点云可以通过传感器生成,例如但不限于lidar扫描仪或深度相机。如本领域技术人员所已知,lidar扫描仪使用脉冲激光器形式的光来测量距离。由于点云通常不具有每个可能坐标的点,因此点云被认为是稀疏数据集。

2、存在可运用点云的各种现实世界人工智能应用,例如增强╱虚拟现实(例如,内部场景的布局检测)和自主驾驶(例如,提取可驾驶区域)。因此,在点云上执行深度学习任务已经受到学术界和工业的极大关注,且人工神经网络(在本文中简称为神经网络)已被开发来处理点云,该网络在本文中可被称为点云神经网络。如本领域技术人员所已知,神经网络包括可用于机器学习应用的一个或多个互连层。具体地,神经网络可用于信号处理应用程序中,该信号处理应用程序包括但不限于图像处理应用程序和计算机视觉应用程序。

本文档来自技高网...

【技术保护点】

1.一种对图形处理单元执行稀疏子流形解卷积的方法(4000),该稀疏子流形解卷积可表示为稀疏子流形解卷积的输入张量与多个子滤波器中的每一个之间的直接卷积,其中多个子滤波器中的每个子滤波器包括稀疏子流形解卷积的滤波器的权重子集,该方法(4000)包括:

2.根据权利要求1所述的方法(4000),其中输出张量具有至少高度维度、宽度维度和通道维度,且输出张量的目标位置是输出张量的高度和宽度位置。

3.根据权利要求2所述的方法(4000),其中标识输出张量的目标位置的信息包括目标位置列表,该目标位置列表包括输出张量的每个目标位置的高度和宽度坐标。>

4.根据权利...

【技术特征摘要】

1.一种对图形处理单元执行稀疏子流形解卷积的方法(4000),该稀疏子流形解卷积可表示为稀疏子流形解卷积的输入张量与多个子滤波器中的每一个之间的直接卷积,其中多个子滤波器中的每个子滤波器包括稀疏子流形解卷积的滤波器的权重子集,该方法(4000)包括:

2.根据权利要求1所述的方法(4000),其中输出张量具有至少高度维度、宽度维度和通道维度,且输出张量的目标位置是输出张量的高度和宽度位置。

3.根据权利要求2所述的方法(4000),其中标识输出张量的目标位置的信息包括目标位置列表,该目标位置列表包括输出张量的每个目标位置的高度和宽度坐标。

4.根据权利要求1所述的方法(4000),其中输入张量的子窗口是用于计算其中一个直接卷积的至少一个输出张量元素的输入张量的窗口。

5.根据权利要求1至4中任一项所述的方法(4000),其中对输入张量执行索引展开运算包括从输出张量的所识别目标位置和稀疏子流形解卷积的一个或多个参数中识别与输出张量的至少一个已标识目标位置有关的输入张量的每个子窗口。

6.根据权利要求5所述的方法(4000),其中如果输入张量的子窗口用于生成在该目标位置处的稀疏子流形解卷积的输出张量的元素,则该子窗口与目标位置相关。

7.根据权利要求5所述的方法(4000),其中稀疏子流形解卷积的输出张量的通道的元素分成多个块,其中块中的每个元素由输入张量的相同子窗口和滤波器的不同子滤波器生成,以及识别与所识别的目标位置相关的输入张量的子窗口包括识别所识别的目标位置形成其一部分的输出张量的块,以及将所述输出张量的所识别块映射到用于生成所述块的输入张量的子窗口。

8.根据权利要求7所述的方法(4000),其中使用块的预定元素的输出张量中的位置和稀疏子流形解卷积的一个或多个参数将输出张量的所标识块映射到输入张量的子窗口。

9.根据权利要求1至4中任一项所述的方法(4000),其中对输入张量执行索引展开运算包括从稀疏子流形解卷积的一个或多个参数中标识每个相关子窗口的元素。

10.根据权利要求9所述的方法(4000),其中标识相关子窗口的元素包括标识子窗口内的预定元素的输入张量中的位置,以及实施一系列嵌套循环以在子窗口中从所识别的位置移动元素,所...

【专利技术属性】
技术研发人员:G·V·德米尔吉C·迪基奇G·M·史蒂文斯杨乐
申请(专利权)人:想象技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1