一种基于多视角分类的三维物体检索方法技术

技术编号:21737031 阅读:41 留言:0更新日期:2019-07-31 19:35
本发明专利技术公开了一种基于多视角分类的三维物体检索方法,包括:获取原始图像;对所述原始图像进行处理得到多视角图像;对所述多视角图像进行处理得到特征描述子;对所述特征描述子进行处理得到词汇树;将待检索图像在所述词汇树中检索得到所述原始图像的序列号。本发明专利技术采用多视角分类算法,得到全方位的三维物体在二维平面的多视角特征图像,并可以直接对三维物体进行检索,简单方便,易于实现,解决了三维图像检索中由于用户拍摄物体视角变化引起的检索性能下降的问题。

A 3D Object Retrieval Method Based on Multi-view Classification

【技术实现步骤摘要】
一种基于多视角分类的三维物体检索方法
本专利技术属于计算机视觉
,具体涉及一种基于多视角分类的三维物体检索方法。
技术介绍
计算机视觉技术作为人类认知世界的重要手段,一直受到研究者们的广泛关注。由于摄像技术的迅速发展与普及,人们通过手机等多媒体设备接触各种爆炸式增长的图像信息。现今二维图像被广泛应用在交通、医疗、军事等领域,图像检索作为对图像信息处理的一门信息处理技术,研究者们已做了相当多的工作,取得了丰富的成果。现实生活中,人们面对的是一个三维立体物体,真实三维场景才是人们每天接触到的,随着三维扫描技术和计算机图形学的发展以及计算机性能的提高,三维物体模型已成为继声音、图像和视频之后的第四种多媒体数据类型。由于在一幅二维图像中,三维物体的外观取决于其形状、反射特性、姿态和环境亮度等,即使是最简单的物体,其不同视点的二维视图差异也会很大,所以用户拍摄物体时产生的视角变化会引起三维图像检索性能下降。目前,三维物体检索技术主要有以下几种:一是基于外观或视图的方法,二是基于模型或几何的方法,三是光学三维物体检索方法。然而,第一种方法得到的三维物体图像视角特征不全面;第二种方法三维模型的建立和描述比较困难;第三种方法不能直接对三维物体进行检索,必须进行三维信息的转换,将其变成二维信息用于描述、分类和识别。综上所述,现有技术在三维物体检索时,无法实现对三维物体全方位多视角的图像描述,无法直接对三维物体进行检索,且需要进行复杂的三维建模。
技术实现思路
为了解决现有技术中存在的上述问题,本专利技术提供了一种基于多视角分类的三维物体检索方法。本专利技术要解决的技术问题通过以下技术方案实现:一种基于多视角分类的三维物体检索方法,包括:S1:获取原始图像;S2:对所述原始图像进行处理得到多视角图像;S3:对所述多视角图像进行处理得到特征描述子;S4:对所述特征描述子进行处理得到词汇树;S5:将待检索图像在所述词汇树中检索得到所述原始图像的序列号。在本专利技术的一个实施例中,所述对所述原始图像进行处理得到多视角图像包括:对所述原始图像做旋转得到第一图像;对所述第一图像进行垂直方向上的高斯滤波得到第二图像;对所述第二图像进行倾斜变换得到多视角图像。在本专利技术的一个实施例中,所述对所述原始图像做旋转得到第一图像包括:根据旋转变换矩阵公式对所述原始图像做旋转得到第一图像;其中,所述旋转变换矩阵公式为:其中,I'(x,y)为旋转后图像的像素点坐标,θ为旋转的角度,x、y为旋转之前图像对应的像素点坐标。在本专利技术的一个实施例中,所述高斯滤波的高斯标准偏差因子参数为:其中,c=0.8,1≤t≤7。在本专利技术的一个实施例中,所述对所述第二图像进行倾斜变换得到多视角图像包括:对所述第二图像的高进行1/t的因子乘积得到第三图像;对所述第三图像采用至少三次样条插值法进行仿射变换得到多视角图像。在本专利技术的一个实施例中,所述对所述多视角图像进行处理得到特征描述子,包括:对所述多视角图像进行训练得到第一特征点;对所述第一特征点进行描述得到特征描述子。在本专利技术的一个实施例中,对所述多视角图像进行训练得到第一特征点包括:对所述多视角图像进行高斯滤波得到第四图像;对所述第四图像进行DOG算法得到第五图像;在所述第五图像中寻找极值点、极值点定位、极值点方向赋值得到第一特征点。在本专利技术的一个实施例中,所述对所述特征描述子进行处理得到词汇树包括:构建一棵K层L个分支的树型数据结构;对所述特征描述子进行K-means聚类得到聚类中心;将所述聚类中心作为视觉词汇放入所述树型数据结构的节点中得到词汇树。在本专利技术的一个实施例中,所述将待检索图像在所述词汇树中检索得到所述原始图像的序列号包括:对所述词汇树的每个节点加入词频向量权值;对所述待检索图像进行特征提取得到第二特征点;将第二特征点与词汇树进行对比计算得到相似图像的序列号;对所述相似图像的序列号进行序列号变换得到所述原始图像的序列号。本专利技术的有益效果:1、本专利技术采用多视角分类算法解决了由用户拍摄物体时视角变化引起三维图像检索性能下降的问题。2、本专利技术采用多视角概念,对三维物体进行全方位的描述,能够得到全方位的三维物体在二维平面的多视角特征图像;3、本专利技术采用的多视角分类算法无需对三维物体精准的建立模型,简便易实现。4、本专利技术采用多视角图像可直接对三维物体进行检索,得到原图像的序列号。以下将结合附图及实施例对本专利技术做进一步详细说明。附图说明图1是本专利技术实施例提供的一种基于多视角分类的三维物体检索方法流程图;图2a~2b是本专利技术实施例提供的不同视角下的样本图像;图3a~3b是本专利技术实施例提供的不同视角下的样本图像生成的多视角图像。具体实施方式下面结合具体实施例对本专利技术做进一步详细的描述,但本专利技术的实施方式不限于此。实施例一三维物体由于立体模型的特殊性,在真实场景中受环境因素较大,比如光照、阴影、遮挡等,同时一体多面,特征多样性较多,不如二维平面的相对单一性,故本专利技术将二维平面与三维物体联系在一起,将三维物体用二维平面表示出来。本专利技术通过对三维物体进行二维平面多视角采样来构造图像数据库,并对数据库内的图像提取适当特征,并将其送入BOW(bagofword)词袋模型进行训练,构建词汇树,以提高对三维物体的检索精度。请参见图1,图1是本专利技术实施例提供的一种基于多视角分类的三维物体检索方法流程图。本专利技术提出的一种基于多视角分类的三维物体检索方法包括:S1:获取原始图像;在本实施例中,先对三维物体进行二维图像的采集,得到三维物体的原始图像。S2:对所述原始图像进行处理得到多视角图像;三维物体采集多视角的二维图像的过程,由于采集时拍摄的俯仰角、倾斜角的不同,拍摄到的图像会产生一定的形变,类似于仿射变换。本专利技术采用旋转加倾斜变换来进行这类仿射变换的模拟。在本实施例中,多视角图像生成包括以下步骤:首先,采用双线性插值法对图像做旋转,模拟水平方向摄像机的偏移。图像的旋转指图像绕一定点旋转一定角度,将图像上的所有像素都旋转一个相同的角度。旋转后图像的的大小一般会改变,即可以把转出显示区域的图像截去,或者扩大图像范围来显示所有的图像。对将要进行视角变换的图像乘以一个旋转变换的矩阵,公式如下:其中,I'(x,y)为旋转后图像的像素点坐标,θ为旋转的角度,x、y为旋转之前图像对应的像素点坐标。接着,对旋转后的图像进行垂直方向上的高斯滤波,减少图像失真。对旋转后的图像采用高斯标准偏差因子进行卷积,其中,c的值为0.8,以保证无错误滤波,t表示倾斜的程度值,取值为1≤t≤7。高斯模板矩阵中间值最大,相邻模板的值随着距离中心越来越远,其值也越来越小。用一个卷积模块扫描图像中的每一个像素,再用模块确定的邻域内像素的加权平均灰度值去替代模板中心像素点的值。这种方法比其他的均衡模糊滤波器更好地保留了边缘效果,减少了图像的失真。最后,对滤波后的图像进行倾斜变换,模拟垂直方向上摄像机的移动。先对图像的高进行1/t(t的倒数)的因子乘积,t因子受垂直方向上角度变化的影响,再采用三次样条插值的方法实现仿射变,完成图像的倾斜变换。将上述两类变换复合就完成了多视角图像变换,得到了多视角图像。S3:对所述多视角图像进行处理得到特征描述子。特征是图像表示的关键,是对图像特性的本文档来自技高网...

【技术保护点】
1.一种基于多视角分类的三维物体检索方法,其特征在于,包括:获取原始图像;对所述原始图像进行处理得到多视角图像;对所述多视角图像进行处理得到特征描述子;对所述特征描述子进行处理得到词汇树;将待检索图像在所述词汇树中检索得到所述原始图像的序列号。

【技术特征摘要】
1.一种基于多视角分类的三维物体检索方法,其特征在于,包括:获取原始图像;对所述原始图像进行处理得到多视角图像;对所述多视角图像进行处理得到特征描述子;对所述特征描述子进行处理得到词汇树;将待检索图像在所述词汇树中检索得到所述原始图像的序列号。2.根据权利要求1所述的一种基于多视角分类的三维物体检索方法,其特征在于,所述对所述原始图像进行处理得到多视角图像包括:对所述原始图像做旋转得到第一图像;对所述第一图像进行垂直方向上的高斯滤波得到第二图像;对所述第二图像进行倾斜变换得到多视角图像。3.根据权利要求2所述的一种基于多视角分类的三维物体检索方法,其特征在于,所述对所述原始图像做旋转得到第一图像包括:根据旋转变换矩阵公式对所述原始图像做旋转得到第一图像;其中,所述旋转变换矩阵公式为:其中,I'(x,y)为旋转后图像的像素点坐标,θ为旋转的角度,x、y为旋转之前图像对应的像素点坐标。4.根据权利要求2所述的一种基于多视角分类的三维物体检索方法,其特征在于,所述高斯滤波的高斯标准偏差因子参数为:其中,c=0.8,1≤t≤7。5.根据权利要求2所述的一种基于多视角分类的三维物体检索方法,其特征在于,所述对所述第二图像进行倾斜变换得到多视角图像包括:对所述第二图像的高进行1/t的因子乘积得到第三图像;对所述第三图像采用至...

【专利技术属性】
技术研发人员:李静张念曾李尔康
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1