【技术实现步骤摘要】
本专利技术属于图像处理、自然交互和集成电路
,具体涉及一种激光散斑图像深度感知方法及装置。
技术介绍
自然和谐的人机交互方式是人类对操控机器的理想目标,使机器能读懂人在自然状态所传递的命令。利用图像处理技术获取深度信息进行三维图像的实时识别及动作捕捉,使人能以表情、手势、体感动作等自然方式与终端进行交互成为可能。深度感知技术是人机自然交互的核心技术,在机器视觉、智能监控、三维重建、体感交互、3D打印等领域有着广泛的应用前景,已逐步从游戏机外设拓展到其它智能终端,包括智能电视、智能手机、PC/平板电脑、智能家电等,为用户带来“科幻”般的操控方式和全新的人机交互体验。基于结构光的主动视觉模式可以较为准确地获取图像的深度信息,比如通过红外激光投射固定模式的图像到物体表面,经物体表面的漫反射形成散斑点,由图像传感器采集获得散斑图像,再通过图像深度感知芯片计算获得物体的深度信息。该结构光模式相比双目立体摄像头,具有获取的深度图信息更稳定可靠、不受环境光影响、立体匹配过程简单、算法计算量小等优势。如微软的体感交互设备Kinect就是采用红外结构光的主动视觉模式。
技术实现思路
鉴于此,本专利技术提供了一种激光散斑图像深度感知方法及装置,旨在通过多窗口自适应匹配,降低大范围搜索匹配块的误匹配噪声,同时保持深度图的细节、提高X-Y方向识别小物体深度的能力,并使输出的深度图最优化。为实现以 ...
【技术保护点】
一种激光散斑图像深度感知方法,包括以下步骤:步骤1、将输入散斑图和参考散斑图根据场同步、行同步信号同时读入各自的N条行存中,形成N行大小的输入散斑窗、参考散斑窗;步骤2、在输入散斑窗中提取中心点相同、大小不同的复数个输入图像块,在参考散斑窗中提取与输入图像块中心点位置对应、一定范围的匹配搜索窗;步骤3、采用并行SAD计算模块并行计算复数个输入图像块与匹配搜索窗中相同大小的匹配块之间SAD(即图像块与匹配块对应像素之间差的绝对值之和);步骤4、并行计算复数个输入图像块和不同匹配块之间所有SAD的最小值,最小值对应的匹配块即为该输入图像块的最佳匹配块,对应的最佳偏移量(Δx,Δy)即该输入图像块的运动向量,其中所述最佳偏移量为参考散斑窗中心点坐标值(x,y)分别按X、Y轴减去最佳匹配块中心点(x1,y1)坐标值计算得到;步骤5、根据偏移量大小和设定的阈值,从由复数个输入图像块分别计算得到的复数个最佳偏移量中选择输出最优偏移量,作为当前输入散斑图像块中心点的运动向量;步骤6、利用X或Y方向的最优偏移量,根据深度计算公式计算输入散斑图像块中心点对应的深度信息;步骤7、将输入散斑图像块中心点移到 ...
【技术特征摘要】
1.一种激光散斑图像深度感知方法,包括以下步骤:
步骤1、将输入散斑图和参考散斑图根据场同步、行同步信号同时读入
各自的N条行存中,形成N行大小的输入散斑窗、参考散斑窗;
步骤2、在输入散斑窗中提取中心点相同、大小不同的复数个输入图像
块,在参考散斑窗中提取与输入图像块中心点位置对应、一定范围的匹配搜
索窗;
步骤3、采用并行SAD计算模块并行计算复数个输入图像块与匹配搜索
窗中相同大小的匹配块之间SAD(即图像块与匹配块对应像素之间差的绝对
值之和);
步骤4、并行计算复数个输入图像块和不同匹配块之间所有SAD的最小
值,最小值对应的匹配块即为该输入图像块的最佳匹配块,对应的最佳偏移
量(Δx,Δy)即该输入图像块的运动向量,其中所述最佳偏移量为参考散
斑窗中心点坐标值(x,y)分别按X、Y轴减去最佳匹配块中心点(x1,y1)坐标值
计算得到;
步骤5、根据偏移量大小和设定的阈值,从由复数个输入图像块分别计
算得到的复数个最佳偏移量中选择输出最优偏移量,作为当前输入散斑图像
块中心点的运动向量;
步骤6、利用X或Y方向的最优偏移量,根据深度计算公式计算输入散
斑图像块中心点对应的深度信息;
步骤7、将输入散斑图像块中心点移到同一行的下一个像素点上,重复
步骤2~6,得到下一个像素点对应的深度值;一行所有像素点的深度值计
算完成后再重复步骤1~6,读入以下一行为中心行、N行大小的输入散斑
\t窗和参考散斑窗,计算下一行像素点对应的深度值,如此逐点、逐行计算得
到输入散斑图像对应的深度图。
2.根据权利要求1所述的方法,步骤1中,输入散斑图和参考散斑图
在读入前均经过图像自适应预处理,所述预处理包括Bayer视频格式转换或
ITU601、ITU656、MIPI接口格式转换、色度空间转换、灰度图像自适应去
噪和增强。
3.根据权利要求1所述的方法,步骤3中,计算每个输入图像块与匹
配搜索窗中相同大小的匹配块之间的SAD包括:
对于m×n的输入图像块,从k=1开始,计算该图像块与匹配块第k列对
应像素的m个差绝对值,将该m个差绝对值同时送入第一列加法器中相加,
得到第k列对应的差绝对值和,每得到一个差绝对值和,将其送入一个由多
个延时单元串接的时延寄存器中,以流水线方式进行延时,直至第一列加法
器得到第k=n列对应的差绝对值和,再将全部n列对应的差绝对值和同时送
入第二列加法器中相加,输出该输入图像块与匹配块之间的SAD值。
4.根据权利要求1所述的方法,步骤5中,在所述复数个输入图像块
对应的最佳偏移量中,将最大图像块对应的最佳偏移量与参考阈值进行比
较,若该偏移量大于参考阈值,则选择大图像块对应的最佳偏移量作为最优
偏移量输出;若该偏移量小于参考阈值,则选择较小图像块计算得到的最佳
偏移量作为最优偏移量输出。
5.根据权利要求4所述的方法,若所述复数个输入图像块的个...
【专利技术属性】
技术研发人员:葛晨阳,郑南宁,赵季中,姚慧敏,杨意,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。