一种基于模板匹配的单目相机物体位姿估计方法及系统技术方案

技术编号:25917582 阅读:37 留言:0更新日期:2020-10-13 10:37
本发明专利技术提供一种基于模板匹配的单目相机物体位姿估计方法,包括以下步骤:根据物体3D模型的投影,以物体3D模型的质心或重心为基准坐标系原点,原点记作P,对基准坐标进行空间坐标转化,将基准坐标系转化为以观察点P’为原点的目标坐标系,记录此时物体的三维位置以及P’点到物体3D模型之间的距离,即生成二维模板数据集,形成目标模板图像;图像预处理,得到目标二维图像;物体位姿识别。本发明专利技术以模板匹配算法为基础,可根据需求调节观测距离和基准坐标原点。对于新的待识别目标物体,只需要其3D模型即可快速生成大量模板数据集,算法的可移植性较强。本发明专利技术在硬件传感器上只需使用单目2D摄像机,能够降低硬件成本。

【技术实现步骤摘要】
一种基于模板匹配的单目相机物体位姿估计方法及系统
本专利技术涉及物体位姿评估
,具体来说是一种基于模板匹配的单目相机物体位姿估计方法及系统。
技术介绍
近年来,计算机视觉相关的技术迅速发展,物体位姿检测是计算机视觉领域最热门的研究领域之一。而使用位姿估计算法估算物体3D模型相对于摄像机的位置姿态,在物体位姿识别实际应用中尤为重要。位姿估计的信息获取必须使用硬件传感器,根据原理不同,完成位姿估计使用到的传感器分为激光雷达和摄像机。在视觉领域可分为单目视觉位姿估计、多目视觉位姿估计和3D视觉位姿估计。在目前的生产技术水平下,现有多目和3D相机价格都比较贵,后者价格普遍在数十万元以上。在实际工业应用中,既要保证算法的处理速度、稳定性以及鲁棒性,也要把产品成本控制在较低范围,此时价格较低的单目相机受到消费者们的重视。根据算法使用的先验条件不同,位姿估计算法可以分为基于特征点的位姿估计方法、基于神经网络的位姿估计算法和基于模型的位姿估计算法。基于特征点的位姿估计方法从图像中提取出有效特征点与标准图像进行匹配。这种方法不仅耗时,而且只使用到图像中特征点信息,信息利用率不高。而且如果遇到图像含有特征点较少的情形,对位置和角度的估计出现严重偏差的几率较大。基于神经网络的位姿估计算法虽然具有极强的泛化能力,但对硬件算力要求较高,无形中提升了硬件成本。基于模型的位姿估计算法需要提前构建物体的模型,能较强适用于具有形状较规则的物体,且对硬件算力要求低。
技术实现思路
本专利技术要解决的是现有技术对于物体位姿评估结果误差大、对硬件要求高的技术问题。本专利技术通过以下技术方案来解决上述技术问题:一种基于模板匹配的单目相机物体位姿估计方法,包括以下步骤:S100、建立目标模板图像库根据物体3D模型以球形相机的视野进行多角度、不同距离的投影,光照模式选择为模拟平行光投影;以物体3D模型的质心或重心为基准坐标系原点,原点记作P,对基准坐标进行空间坐标转化,将基准坐标系转化为以观察点P’为原点的目标坐标系,其中PP’为目标坐标系的z轴;随后在P’点将物体3D模型投影到xoy平面上获得二维模板图像,记录此时物体的三维位置以及P’点到物体3D模型之间的距离,即生成在不同位姿和观测距离下的物体3D模型二维模板数据集,形成目标模板图像;S200、图像预处理对目标物体进行拍照,然后对获取到的二维图像采用直方图均衡法处理,得到目标二维图像;S300、物体位姿识别采用目标模板图像对目标二维图像进行检测与识别;S400、配准对目标模板图像进行平移和旋转,找到目标模板图像上的每个特征点对应在目标图像上的对应点坐标,通过特征点坐标和对应点切线进行最小平方差运算,使特征点尽量靠近对应点。优选的,所述步骤S100具体包括:1)投影距离渐进设计对投影观察原点到物体3D模型之间的距离进行多层次步进式设计,选择3至5个不同观测距离和角度进行投影;2)基准坐标系的转换及投影通过空间坐标变换,将基准坐标系转换为以观察点P’为原点、PP’为z轴的目标坐标系。目标坐标系的y轴和z轴旋转公式为:其中θy是pitch角,θz是yaw角。[y',x',z']T=Ry(-θy)Rz(-θz)[x,y,z]T(3)z'=-z'+R(4)其中,[x,y,z]是基准坐标系的原点坐标,[x',y',z']是目标坐标系的原点坐标,R代表偏移量。随后在P’点按照透视原理以及视场“近大远小”规则,将物体3D模型投影到xoy平面上获得二维模板图像,记录此时物体的三维位置以及P’点到物体3D模型之间的距离,即生成在不同位姿和观测距离下的物体3D模型二维模板数据集。优选的,所述步骤S200具体包括:首先统计二维图像中灰度级范围rk,rk值域为[0,L-1],在八位像素值表示中L等于256;然后统计每一个灰度级在二维图像中出现的频次nk,nk表示在二维图像中第k个灰度级的像素总数;当图像总像素点个数为N时,计算各级的概率公式为:p(rk)=nk/N(5)由于rk步进为1,可以将式(5)改写为:p(k)=nk/N(6)上式中将直方图分布归一化,将函数值p(k)值域归一化为[0,1],然后对灰度级概率进行直方图变换:sk=T(rk)(7)sk代表将原始灰度值rk通过函数映射得到的新灰度值。优选的,所述步骤S300具体包括:预先加载目标模板图像到内存中,对预处理后的目标二维图像进行物体检测与识别;模板与源图像进行比较时,采用相似度测量的方法进行检测识别:其中ori(O,r)为目标模板图像上位置r上的梯度,ori(I,c+r)为目标二维图像上在c+r上的梯度,其中c为目标二维图像上对应于目标模板图像的中心点,目标二维图像上和目标模板图像像素对应的像素的梯度;当多个同样目标二维图像堆叠摆放时,根据最终计算结果值,取最高得分值对应的位置。优选的,所述步骤S400具体包括:先对目标模板图像进行平移和旋转,通过最小二乘法来求出平移量和旋转量;然后对目标模板图像上的特征点,寻找特征点在目标二维图像上某邻域内的最近点作为其在目标二维图像上的对应点,对物体模板上每个特征点都找到对应点坐标,计算对应点的切线,同时计算特征点到对应点切线的距离,对所有特征点进行相同操作,通过特征点坐标和对应点切线进行最小平方差运算,使特征点尽量靠近对应点,分别求出最小平方差和对(x,y;ω)的一阶偏导,并令其为0,求出(x,y;ω)值,其中(x,y)为目标物体在二维目标图像中的位置坐标,ω目标模板图像的旋转角度,将ω与当前匹配的目标模板图像的三维位姿信息进行合并叠加,即可得到目标物体最终三维位姿识别结果。本专利技术还提供一种基于模板匹配的单目相机物体位姿估计系统,包括建立目标模板图像库模块,根据物体3D模型以球形相机的视野进行多角度、不同距离的投影,光照模式选择为模拟平行光投影;以物体3D模型的质心或重心为基准坐标系原点,原点记作P,对基准坐标进行空间坐标转化,将基准坐标系转化为以观察点P’为原点的目标坐标系,其中PP’为目标坐标系的z轴;随后在P’点将物体3D模型投影到xoy平面上获得二维模板图像,记录此时物体的三维位置以及P’点到物体3D模型之间的距离,即生成在不同位姿和观测距离下的物体3D模型二维模板数据集,形成目标模板图像;图像预处理模块,对目标物体进行拍照,然后对获取到的二维图像采用直方图均衡法处理,得到目标二维图像;物体位姿识别模块,采用目标模板图像对目标二维图像进行检测与识别;配准模块,对目标模板图像进行平移和旋转,找到目标模板图像上的每个特征点对应在目标图像上的对应点坐标,通过特征点坐标和对应点切线进行最小平方差运算,使特征点尽量靠近对应点。优选的,所述建立目标模板图像库模块具体建立过程为:1)投影距离渐进设计<本文档来自技高网...

【技术保护点】
1.一种基于模板匹配的单目相机物体位姿估计方法,其特征在于:包括以下步骤:/nS100、建立目标模板图像库/n根据物体3D模型以球形相机的视野进行多角度、不同距离的投影,光照模式选择为模拟平行光投影;以物体3D模型的质心或重心为基准坐标系原点,原点记作P,对基准坐标进行空间坐标转化,将基准坐标系转化为以观察点P’为原点的目标坐标系,其中PP’为目标坐标系的z轴;随后在P’点将物体3D模型投影到xoy平面上获得二维模板图像,记录此时物体的三维位置以及P’点到物体3D模型之间的距离,即生成在不同位姿和观测距离下的物体3D模型二维模板数据集,形成目标模板图像;/nS200、图像预处理/n对目标物体进行拍照,然后对获取到的二维图像采用直方图均衡法处理,得到目标二维图像;/nS300、物体位姿识别/n采用目标模板图像对目标二维图像进行检测与识别;/nS400、配准/n对目标模板图像进行平移和旋转,找到目标模板图像上的每个特征点对应在目标图像上的对应点坐标,通过特征点坐标和对应点切线进行最小平方差运算,使特征点尽量靠近对应点。/n

【技术特征摘要】
1.一种基于模板匹配的单目相机物体位姿估计方法,其特征在于:包括以下步骤:
S100、建立目标模板图像库
根据物体3D模型以球形相机的视野进行多角度、不同距离的投影,光照模式选择为模拟平行光投影;以物体3D模型的质心或重心为基准坐标系原点,原点记作P,对基准坐标进行空间坐标转化,将基准坐标系转化为以观察点P’为原点的目标坐标系,其中PP’为目标坐标系的z轴;随后在P’点将物体3D模型投影到xoy平面上获得二维模板图像,记录此时物体的三维位置以及P’点到物体3D模型之间的距离,即生成在不同位姿和观测距离下的物体3D模型二维模板数据集,形成目标模板图像;
S200、图像预处理
对目标物体进行拍照,然后对获取到的二维图像采用直方图均衡法处理,得到目标二维图像;
S300、物体位姿识别
采用目标模板图像对目标二维图像进行检测与识别;
S400、配准
对目标模板图像进行平移和旋转,找到目标模板图像上的每个特征点对应在目标图像上的对应点坐标,通过特征点坐标和对应点切线进行最小平方差运算,使特征点尽量靠近对应点。


2.根据权利要求1所述的一种基于模板匹配的单目相机物体位姿估计方法,其特征在于:所述步骤S100具体包括:
1)投影距离渐进设计
对投影观察原点到物体3D模型之间的距离进行多层次步进式设计,选择3至5个不同观测距离和角度进行投影;
2)基准坐标系的转换及投影
通过空间坐标变换,将基准坐标系转换为以观察点P’为原点、PP’为z轴的目标坐标系。目标坐标系的y轴和z轴旋转公式为:






其中θy是pitch角,θz是yaw角。
[y',x',z']T=Ry(-θy)Rz(-θz)[x,y,z]T(3)
z'=-z'+R(4)
其中,[x,y,z]是基准坐标系的原点坐标,[x',y',z']是目标坐标系的原点坐标,R代表偏移量。随后在P’点按照透视原理以及视场“近大远小”规则,将物体3D模型投影到xoy平面上获得二维模板图像,记录此时物体的三维位置以及P’点到物体3D模型之间的距离,即生成在不同位姿和观测距离下的物体3D模型二维模板数据集。


3.根据权利要求1所述的一种基于模板匹配的单目相机物体位姿估计方法,其特征在于:所述步骤S200具体包括:
首先统计二维图像中灰度级范围rk,rk值域为[0,L-1],在八位像素值表示中L等于256;然后统计每一个灰度级在二维图像中出现的频次nk,nk表示在二维图像中第k个灰度级的像素总数;当图像总像素点个数为N时,计算各级的概率公式为:
p(rk)=nk/N(5)
由于rk步进为1,可以将式(5)改写为:
p(k)=nk/N(6)
上式中将直方图分布归一化,将函数值p(k)值域归一化为[0,1],然后对灰度级概率进行直方图变换:
sk=T(rk)(7)
sk代表将原始灰度值rk通过函数映射得到的新灰度值。


4.根据权利要求1所述的一种基于模板匹配的单目相机物体位姿估计方法,其特征在于:所述步骤S300具体包括:
预先加载目标模板图像到内存中,对预处理后的目标二维图像进行物体检测与识别;模板与源图像进行比较时,采用相似度测量的方法进行检测识别:



其中ori(O,r)为目标模板图像上位置r上的梯度,ori(I,c+r)为目标二维图像上在c+r上的梯度,其中c为目标二维图像上对应于目标模板图像的中心点,目标二维图像上和目标模板图像像素对应的像素的梯度;当多个同样目标二维图像堆叠摆放时,根据最终计算结果值,取最高得分值对应的位置。


5.根据权利要求1所述的一种基于模板匹配的单目相机物体位姿估计方法,其特征在于:所述步骤S400具体包括:
先对目标模板图像进行平移和旋转,通过最小二乘法来求出平移量和旋转量;然后对目标模板图像上的特征点,寻找特征点在目标二维图像上某邻域内的最近点作为其在目标二维图像上的对应点,对物体模板上每个特征点都找到对应点坐标,计算对应点的切线,同时计算特征点到对应点切线的距离,对所有特征点进行相同操作,通过特征点坐标和对应点切线进行最小平方差运算,使特征点尽量靠近对应点,分别求出最小平方差和对(x,y;ω)的一阶偏导,并令其为0,求出(x,y;ω)值,其中(x,y)为目标物体在二维目标图像中的位置坐标,ω目标模板图像的旋转角度,将ω与当前匹配的目标模板图像的三维位姿信息进行合并叠加,即可得到目标物体最终三维位姿识别结果。<...

【专利技术属性】
技术研发人员:刘振范晓东武帅宋思远丁亮洪伟
申请(专利权)人:哈工大机器人合肥国际创新研究院
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1