一种基于自监督学习的双目立体视觉视差滤波方法和装置制造方法及图纸

技术编号:29955233 阅读:34 留言:0更新日期:2021-09-08 08:53
本申请涉及一种基于自监督学习的双目立体视觉视差滤波方法和装置,包括:步骤1:在待处理图像上取一个像素点P,以所述像素点P为中心取一块矩形区域,将所述像素点P的坐标加上偏移量d,得到像素点M,以所述像素点M为中心在同一幅图像上取同样大小的一块矩形区域;步骤2:重复步骤1,得到两个矩形区域作为一对训练样本,取d1作为该样本对的标签;步骤3:重复步骤1和步骤2,得到一定数量的训练样本对和对应标签;步骤4:将步骤3所述训练样本对和对应标签输入卷积神经网络模型,计算损失函数,得到所述卷积神经网络模型;步骤5:判断两个样本对是否为匹配,如果不匹配,将所述像素认定为噪点进行滤除。点进行滤除。点进行滤除。

【技术实现步骤摘要】
一种基于自监督学习的双目立体视觉视差滤波方法和装置


[0001]本申请涉及计算机视觉领域,特别是涉及一种基于自监督学习的双目立体视觉视差滤波方法和装置。

技术介绍

[0002]计算机视觉是一项关于如何运用照相机和计算机来获取生产经营所需的数据与信息的技术。随着计算机视觉技术的发展,计算机视觉在各种场景中都得到了广泛应用。双目立体视觉模拟人类的视觉系统,是计算机视觉领域重要分支。双目立体视觉技术是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息。目前双目立体视觉中的匹配过程容易产生误匹配,造成三维点云中出现噪点,这对三维几何信息的获取十分不利。其中有两种典型的情况容易发生误匹配:(1)当相机拍摄到近处的区域时,正确匹配点超过设定的最大视差,产生难以消除的误匹配。(2)极线校正不准,使得对应点不在一条水平线上,也极易造成误匹配。对于这种情况,现有技术通过设定更大的最大视差等方法进行解决,但是会对计算效率产生影响,使计算速度变慢,并且对计算机的内存需求较大。同时,一般传统的视差滤波方本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于自监督学习的双目立体视觉视差滤波方法,其特征在于,包括:步骤1:在待处理图像上取一个像素点P,以所述像素点P为中心取一块矩形区域,将所述像素点P的坐标加上偏移量d,得到像素点M,以所述像素点M为中心在同一幅图像上取同样大小的一块矩形区域,其中,所述待处理图像为通过双目相机采集到的左图和右图,所述坐标偏移差值d为二维向量,包含水平偏移量d1和垂直偏移量d2;步骤2:重复步骤1,得到两个矩形区域作为训练样本对,取步骤1所述的水平偏移量d1作为该样本对的标签;步骤3:将步骤1和步骤2重复多次,得到一定数量的训练样本对和对应的标签;步骤4:利用步骤3所述训练样本对和对应的标签训练卷积神经网络模型,计算损失函数,得到所述卷积神经网络模型,所述损失函数为其中,d0为水平偏移量阈值,λ为权重,L
match
为交叉熵损失函数,L
d
为欧几里得损失函数;步骤5:通过立体匹配算法得到所述待处理图像左图每个像素点在右图中的匹配点,以两个所述匹配点为中心,分别在左图和右图各取一矩形区域形成样本对,将所述样本对输入卷积神经网络模型,得到该样本对是否匹配,如果不匹配,将所述像素认定为噪点进行滤除。2.根据权利要求1所述的一种基于自监督学习的双目立体视觉视差滤波方法,其特征在于,所述交叉熵损失函数的计算方法为:L
matc=

(y
d
log(p)+(1

y
d
)(1

log(p))),其中,p为所述卷积神经网络模型计算...

【专利技术属性】
技术研发人员:杨力张月斓罗哉
申请(专利权)人:中国计量大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1