基于FPGA加速的低比特光场图像深度估计网络及方法技术

技术编号:41138335 阅读:21 留言:0更新日期:2024-04-30 18:09
本发明专利技术涉及轻量化光场深度估计与FPGA实现计算领域,现有的方法引入3D卷积,网络结构复杂且涉及大量网络参数,增加了硬件的不可行性,现有的先进算法都需要大量的功耗来维持快速浮点数计算。本发明专利技术提供一种基于FPGA加速的低比特光场图像深度估计网络及方法,通过结合前置视差信息提取操作、通道和视差维度融合以及分组卷积等关键改进,构建一个只使用2D卷积的轻量化的硬件友好的深度估计网络,与硬件结合作为低比特低功耗光场图像深度估计加速引擎,用于实现光场图像的深度估计,本发明专利技术的网络结构简单且精度损失小,计算量明显减少,采用流式硬件架构以及软硬件协同的方法,资源利用合理且功耗低。

【技术实现步骤摘要】

本专利技术涉及轻量化光场深度估计网络设计与fpga实现,更具体的说,涉及一种基于fpga加速的低比特光场图像深度估计网络及方法。


技术介绍

1、高精度、快速计算的光学影像深度信息获取一直是计算机视觉的主要挑战之一。为处理该类问题,现有工作在cpu和gpu上探索快速高精度网络设计,以从复杂的光场影像中计算准确的深度信息。然而,随着无人自主系统的发展,系统续航能力受到研究者的关注。为了更好服务于无人自主系统在深空、深海、深地等领域的进一步应用,研究者们基于fpgas、asics等设备开始探索低功耗高精度快速视觉计算技术。这些方法在理论和关键技术上都取得了不错成果,但它们基于传统小孔成像进行反演计算,难以突破传统成像模型的局限。

2、相较于上述传统成像模型的方法,光场图像在空间域、视角、光谱以及时间域等多维度上具备耦合特性,为单一视角下高精度深度信息获取提供了先天优势。由于光场图像的单镜头多图片的丰富信息优势,倍受深度估计、三维重建等工作者青睐。甚至一些先进工作在gpu上已经取得了出色的效果。然而,在资源受限设备部署中,光场图像三维计算仍然面临严峻挑本文档来自技高网...

【技术保护点】

1.一种基于FPGA加速的低比特光场图像深度估计网络,其特征在于:包括图像预处理、特征提取、代价构建、代价聚合和视差回归,其中:

2.根据权利要求1所述的低比特光场图像深度估计网络,其特征在于:使用2D卷积进行光场图像的深度估计。

3.根据权利要求1所述的低比特光场图像深度估计网络,其特征在于:所述图像预处理中,采用滑动窗口的方法提取每个视差下的像素,为不同视差值在MacPI上应用具有不同扩张率和填充值的窗口,以实现从每个SAI中提取与中心SAI的每个像素点对应的相同真实位置的像素点。

4.根据权利要求1所述的低比特光场图像深度估计网络,其特征在于:所...

【技术特征摘要】

1.一种基于fpga加速的低比特光场图像深度估计网络,其特征在于:包括图像预处理、特征提取、代价构建、代价聚合和视差回归,其中:

2.根据权利要求1所述的低比特光场图像深度估计网络,其特征在于:使用2d卷积进行光场图像的深度估计。

3.根据权利要求1所述的低比特光场图像深度估计网络,其特征在于:所述图像预处理中,采用滑动窗口的方法提取每个视差下的像素,为不同视差值在macpi上应用具有不同扩张率和填充值的窗口,以实现从每个sai中提取与中心sai的每个像素点对应的相同真实位置的像素点。

4.根据权利要求1所述的低比特光场图像深度估计网络,其特征在于:所述特征提取、代价构建和代价聚合的激活与权重采用不同比特的量化,特征提取的第一层选择8bit权重量化网络,特征提取的其他层选择4bit权重和激活去量化网络,代价构建和代价聚合中将最后一个深度可分离单元设置为8bit权重量化网络,其他层的权重使用4bit权重量化网络,代价构建和代价聚合的激活使用4bit权重量化。

5.一种低比特低功耗光场图像深度估计加速引擎,基于权利要求1~4任一权利要求所述的低比特光场图像深度估计网络,其特征在于:包括位于fpga芯片上的可编程逻辑的pl端和位于a...

【专利技术属性】
技术研发人员:李杰张传轮李鑫佳杨文瑄李衡王晓燕赵传君都双丽刘怡光
申请(专利权)人:山西财经大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1