当前位置: 首页 > 专利查询>复旦大学专利>正文

一种适用于SLAM非线性并行化芯片计算架构及工作方法技术

技术编号:33990573 阅读:19 留言:0更新日期:2022-07-02 09:35
本发明专利技术公开了一种适用于SLAM非线性并行化芯片计算架构,包括至少一个基于脉动阵列的块结构并行化矩阵乘加单元,用于将大规模矩阵分解成最大为6

【技术实现步骤摘要】
一种适用于SLAM非线性并行化芯片计算架构及工作方法


[0001]本专利技术属于计算加速芯片
,尤其涉及一种适用于SLAM非线性并行化芯片计算架构及工作方法。

技术介绍

[0002]现有技术通常使用通用处理器实现SLAM算法,无法满足常用的实时SLAM运算的需求,该方法通常降低后端优化的频率满足实时性的要求,这就使得后端优化性能大打折扣。实现SLAM算法的另一种方式是再图形处理器(GPU)中运算,该方法由于SLAM运算复杂性不能完全支持后续运算,进而无法达到全局有效加速的效果。
[0003]针对运算能力瓶颈问题,厂商与研究机构在寻求通过硬件设计来加速针对机器人的算法。eSLAM提出了一种在FPGA平台上加速特征提取和匹配阶段的实时ORBSLAM的节能架构,从而实现了在低功耗平台上实现实时SLAM算法。ESLAM仅仅对前端进行减速,而更运算需求更大的后端运算没有考虑在内。
[0004]Intel公司提出了一种通用多机器人系统,包含了SLAM、路径规划等多种功能,可以完成搜索和救援,精确农业和工业自动化等功能。该系统采用通用功能的处理器处理机器人系统的运算,集成了用于传感器数据获取和预处理的主机处理器;用于定位/映射,避免碰撞和协作智能决策的TensilicaDSP处理器;专用路径规划和运动控制硬件加速器;用于人类语音检测带有音频加速器;用于对象检测和识别的CNN加速器。没有针对SLAM专门设计的专用加速器。密歇根大学提出一个加速半全局匹配过程的并行处理器。能够实现密集的实时3

D深度和3

D运动感知的摆姿势设计可在全高清(1920
×
1080,FHD)分辨率下实现邻居引导的半全局匹配,从而实现全高清分辨率下实时无人机自主飞行。但问题加速处理器只加速姿态估计部分,而位姿估计是SLAM系统的一个很小的模块。
[0005]此外,现有技术中关于SLAM相关的专利,如SLAM运算装置和方法,实现了一种SLAM硬件加速器的装置,包括存储、运算、控制三大部分,公开了向量运算单元和矩阵运算单元的加速装置,能够有效根据不同的需求对SLAM算法进行加速,能够适用于各种SLAM算法和多种不同的输入数据类型,满足不同需求的运算,具有灵活性强、可配置程度高、运算速度快、功耗低等优点。但是其矩阵运算是针对16维方阵设计的,且没有对后端优化做特殊设计,是对SLAM通用运算的加速。
[0006]专利名称为一种用于SLAM的已知自身位姿的光束平差法FPGA加速器公开了一种用于已知位姿更新的光束平差法的FPGA加速器,实现了旋转矩阵处理器和重投影处理器两个硬件模块,两个模块通过划分计算阶段实现了计算时间的平衡以及中间变量的再利用,从而提高了运算速度、节约了硬件资源。
[0007]但是该专利技术建立在位姿已知的场景下,且其加速方法只是光束平差法中的一个步骤,其运算量更大的关键步骤未能包括在内,因此适用性较为局限。

技术实现思路

[0008]本专利技术的目的是为用于后端优化流程的专用SLAM硬件加速结构解决现有单独加速前端的适应性差问题,而提出的一种适用于SLAM非线性并行化芯片计算架构及工作方法。
[0009]为了实现上述目的,本专利技术采用了如下技术方案:
[0010]本专利技术提供了一种适用于SLAM非线性并行化芯片计算架构,包括至少一个基于脉动阵列的块结构并行化矩阵乘加单元,用于将大规模矩阵分解成最大为6
×
6规模的块结构矩阵并行化的乘加操作;
[0011]至少一个求解大规模对称正定矩阵方程的预处理共轭梯度方法的迭代求解器;
[0012]以及硬件映射模块用于SLAM后端优化中复杂数据流的处理分析。
[0013]优选地,所述迭代求解器将块结构的舒尔构造的矩阵方程,按照块结构并行运算的方式进行正定矩阵的基于预处理共轭梯度方法的求解,从而获得相机位姿参数的优化改变量,进而获得优化的图点的改变量。
[0014]优选地,所述迭代求解器以舒尔补矩阵并行化构造加速单元将三维地图点m个以及六维相机位姿n个,对观测投影坐标误差的海森矩阵快速进行舒尔消解,使得大规模矩阵方程降为到6n
×
6n的规模。
[0015]优选地,地图点数量m大于相机位姿数目n,所述舒尔补矩阵并行化构造加速单元降低运算矩阵的规模,矩阵运算操作将由并行化矩阵运算单元进行运算和加速,且数量由加速器资源决定。
[0016]本专利技术提供了一种适用于SLAM非线性并行化芯片计算架构的工作方法,具体包括如下步骤
[0017]步骤一:预计算相关矩阵,此步骤将由矩阵运算单元实际计算和加速;
[0018]步骤二:迭代求解器通过舒尔补构造加速单元进行并行的舒尔补矩阵的构造;
[0019]步骤三:利用预处理共轭梯度方法的专用矩阵迭代计算加速单元迭代求解矩阵方程,获得相机位姿参数的改变量;
[0020]步骤四:矩阵运算单元参与加速计算地图点空间改变量。
[0021]本专利技术还提供一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述方法的步骤。
[0022]与现有技术相比,本专利技术的有益效果为:
[0023]1.针对SLAM后端优化的一种加速架构,实现了基于光束平差法的后端优化硬件运算加速器,能够灵活适用于各种SLAM算法的后端优化组件的运算,具有配置灵活、运算速度快、功耗低等特点。
[0024]2.硬件加速器可以减少SLAM算法的计算代价,进而提升SLAM算法的性能。同时,结合软硬件层面设计的专用计算架构将提高计算能力,降低硬件成本,从而降低机器人设计和应用的门槛,提升SLAM系统性能以及可拓展空间。
[0025]3.更新了相机位姿参数以及地图点信息,通过硬件并行加速的计算框架实现了对SLAM后端优化算法的光束平差法的计算加速,以此提升SLAM系统硬件的计算算力,提高计算速度,节省计算时间,进而为SLAM算法扩展到更加复杂的算法奠定基础,实现SLAM系统的高性能,拓展SLAM系统的应用场景。
附图说明
[0026]图1为本专利技术提出的一种适用于SLAM非线性并行化芯片计算架构的整体结构示意图;
[0027]图2为本专利技术提出的一种以6维方阵矩阵乘加的流程图;
[0028]图3为本专利技术提出的一种舒尔补构造单元的结构示意图。
[0029]图4为本专利技术提出的预处理梯度下降矩阵求解器单元的结构示意图。
[0030]图5为本专利技术提出的SLAM后端优化硬件加速结构示意图。
具体实施方式
[0031]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。
[0032]求解SLAM后端非线性优化问题的一个有效且常用的经典方法是光束平差法,在光束平差法中,相比于相机位姿参数的个数,地图点的数量能够达到成千上万,即使使用关键帧以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种适用于SLAM非线性并行化芯片计算架构,其特征在于:包括至少一个基于脉动阵列的块结构并行化矩阵乘加单元,用于将大规模矩阵分解成最大为6
×
6规模的块结构矩阵并行化的乘加操作;至少一个求解大规模对称正定矩阵方程的预处理共轭梯度方法的迭代求解器;以及硬件映射模块用于SLAM后端优化中复杂数据流的处理分析。2.根据权利要求1所述的一种适用于SLAM非线性并行化芯片计算架构,其特征在于,所述迭代求解器将块结构的舒尔构造的矩阵方程,按照块结构并行运算的方式进行正定矩阵的基于预处理共轭梯度方法的求解,从而获得相机位姿参数的优化改变量,进而获得优化的图点的改变量。3.根据权利要求1所述的一种适用于SLAM非线性并行化芯片计算架构,其特征在于,所述迭代求解器以舒尔补矩阵并行化构造加速单元将三维地图点m个以及六维相机位姿n个,对观测投影坐标误差的海森矩阵快速进行舒尔消解,使得大...

【专利技术属性】
技术研发人员:董志岩张立华成祥陈迟晓
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1