基于多种二进制HoG描述符的草图检索方法技术

技术编号:16662900 阅读:74 留言:0更新日期:2017-11-30 11:58
本发明专利技术提供了一种基于多种二进制HoG描述符的草图检索方法,包括:对数据库中的图像提取边缘图像;基于PBHoG特征描述符对边缘图像及输入草图进行特征提取并存储;基于DBHoG的描述符对边缘图像及输入草图进行特征提取并存储;设置一种草图的图像掩码mask作为查询的约束条件,并基于汉明距离对输入草图和边缘图像的两种特征进行距离计算;将两种特征求得的距离进行归一化并相加,得到最终的MBHoG特征描述符结果,选择MBHoG中最小的前N个值对应的图像作为查询结果;将单一的RGB值作为输入,通过一种设置权值的方法,得到多种RGB值,并形成一个4096维的颜色直方图;根据颜色直方图,对步骤5中得到的前N张图像重新排序,并显示结果。

【技术实现步骤摘要】
基于多种二进制HoG描述符的草图检索方法
本专利技术涉及一种特征提取和图像检索技术,特别是一种一种基于多种二进制HoG描述符的草图检索方法。
技术介绍
图像检索是计算机视觉领域一项非常重要的课题。在信息时代高度发展的今天,网络上的图像数量越来越多,内容也越来越丰富,如何找到一个有效的图像检索方法是个重要的问题。基于文本的检索方法对图像内容的描述不够清晰,对数据库中的图像进行文本标注也是一项费时费力的工作,所以基于内容的检索方法开始渐渐出现。传统的以图搜索的方法以自然图像作为查询输入,但很多时候我们并没有可以作为输入的图像。随着可触摸智能设备的普及,使用手绘草图作为输入进行图像检索是一个不错的选择。大量的对图像特征的表示方法及有效的检索方法支撑着草图检索的发展,但为了更好的检索效果和检索效率,我们必须对现有方法进行改进或提出新的方法。我们提出了一种基于多种二进制HoG描述符的检索方法,以此解决草图检索中的内存占用、时效性和准确率的问题。
技术实现思路
本专利技术的目的在于提供一种基于多种二进制HoG描述符的草图检索方法,包括以下步骤:步骤1,对数据库中的图像提取边缘图像;步骤2,基于BHoG特征描述符得到一种PBHoG特征描述符对边缘图像及输入草图进行特征提取并存储;步骤3,基于传统的HoG特征描述符得到一种DBHoG的描述符对边缘图像及输入草图进行特征提取并存储;步骤4,设置一种草图的图像掩码mask作为查询的约束条件,并基于汉明距离对步骤2、步骤3输入草图和边缘图像的两种特征进行距离计算;步骤5,将两种特征求得的距离进行归一化并相加,得到最终的MBHoG特征描述符结果,选择MBHoG中最小的前N个值对应的图像作为查询结果;步骤6,将单一的RGB值作为输入,通过一种设置权值的方法,得到多种RGB值,并形成一个4096维的颜色直方图;步骤7,根据颜色直方图,对步骤5中得到的前N张图像重新排序,并显示结果。本专利技术在存储特征时,采用二进制编码进行存储,占用内存空间少,并为之后的检索方法提供便利;本专利技术在图像检索时采用二进制的mask做为输入草图的约束,保证了结果的有效性和广泛的适应性,并结合特征存储的方法,采用汉明距离作为距离准则;本方法将颜色特征作为查询的参数,采用将RGB值变换为渐变图的方法,保证查询结果的鲁棒性。下面结合说明书附图对本专利技术做进一步描述。附图说明图1是本专利技术基于多种二进制HoG描述符的草图检索方法流程图。图2是基于多种二进制HoG描述符的草图检索系统演示的效果图,其中(a)为一般查询结果,(b)为以黄色作为参数的结果。具体实施方式结合图1,一种基于多种二进制HoG描述符的草图检索方法,包括以下步骤:步骤1,对数据库中的图像提取边缘图像;步骤2,基于BHoG特征描述符得到一种PBHoG特征描述符对边缘图像及输入草图进行特征提取并存储;步骤3,基于传统的HoG特征描述符得到一种DBHoG的描述符对边缘图像及输入草图进行特征提取并存储;步骤4,设置一种草图的图像掩码mask作为查询的约束条件,并基于汉明距离对步骤2、步骤3输入草图和边缘图像的两种特征进行距离计算;步骤5,将两种特征求得的距离进行归一化并相加,得到最终的MBHoG特征描述符结果,选择MBHoG中最小的前N个值对应的图像作为查询结果;步骤6,将单一的RGB值作为输入,通过一种设置权值的方法,得到多种RGB值,并形成一个4096维的颜色直方图;步骤7,根据颜色直方图,对步骤5中得到的前N张图像重新排序,并显示结果。步骤1中采用StructuredForestsalgorithm进行边缘提取。步骤2的具体过程为:步骤2.1,对图像划分cell时采用6×6的划分方法,并将2×2的cell联合起来形成一个block;步骤2.2,PBHoG在提取特征时,对每个cell中边缘像素的梯度方向划分为8个范围,并形成梯度方向直方图,在每个cell中提取幅值最大的两个方向的编码值作为特征;步骤2.3,使用8位的循环二进制编码进行方向信息的存储。所述步骤3的具体过程在于:对于每个cell的梯度方向划分为8个范围,cell的梯度方向直方图先归一化到[0,0.8]的范围,再对每个范围用一个8位的二进制编码表示,编码方式为:范围编码范围编码[0,0.05)00000000[0.45,0.55)00011111[0.05,0.15)00000001[0.55,0.65)00111111[0.15,0.25)00000011[0.65,0.75)01111111[0.25,0.35)00000111[0.75,0.8]11111111[0.35,0.45)00001111每个cell用8个8位的二进制编码表示,每个编码表示一个方向的梯度值作为特征。所述步骤4中草图的图像掩码mask作为查询的约束条件的具体设置方法为:若查询草图的某个cell中有边缘图像,则mask中相应位置的cell值设置为1;若查询草图某个cell为空,则mask中相应位置的cell值设置为0。步骤4中基于汉明距离对步骤2、步骤3输入草图和边缘图像的两种特征进行距离计算的具体过程如下:(1)PBHoG距离计算公式如下:其中,i和j分别为参与计算的cell的位置,d1是两个cell中具有最大梯度值的方向之间的距离,d2是两个cell中具有次大梯度值的方向之间的距离,AP为两个由2×2的cell组成的block之间的距离,D1是两张图像之间的PBHoG距离;(2)DBHoG的计算公式如下:其中,i和j分别为参与计算的cell的位置,d是在不使用mask的情况下两个cell之间的距离,AD是以mask为约束时两个cell之间的距离,D2是两张图像之间的DBHoG距离。步骤6的具体过程在于:步骤6.1,将输入的单一RGB值的三个通道分别平均划分为16段,找到R、G和B值所在的分段,标记此段和输入的RGB距离为0;步骤6.2,对于R、G和B通道分别进行如下处理:寻找距离R、G或B所在分段最近的分段,根据距离由小到大分别标记为1、1、2、2、3、3;步骤6.3,设置一个4096维的全0矩阵,对RGB三个通道中设置了距离标记的分段进行赋予权值的处理,形成颜色直方图;处理方法为:用一个三重循环扫描三个通道,取R、G和B中各一个有距离标记的分段,计算距离值的和,其结果的范围为0至9,分别对应数组[64,64,64,64,32,16,8,4,2,1]其中一个值,9对应最小值1;此RGB分段映射到4096维的全0矩阵相应的位置,并以对应的数组中的值作为权值,形成一个4096维的颜色直方图。步骤7采用巴氏距离对步骤5中得到的前N张图像重新排序,具体过程为:数据库中根据步骤1至步骤5的方法得到的前N张图像和输入的查询颜色值形成的渐变图,对这些图像进行颜色直方图的提取;计算草图的颜色直方图和这N张图像的颜色直方图之间的巴氏距离,距离值越大,该图像在查询结果中的排序越靠前。步骤7得到的结果如图2的形式呈现于用户前。用于输入一幅草图,返回相应的查询结果,并可根据颜色值对查询结果进行优化。本文档来自技高网...
基于多种二进制HoG描述符的草图检索方法

【技术保护点】
一种基于多种二进制HoG描述符的草图检索方法,其特征在于,包括以下步骤:步骤1,对数据库中的图像提取边缘图像;步骤2,基于BHoG特征描述符得到一种PBHoG特征描述符对边缘图像及输入草图进行特征提取并存储;步骤3,基于传统的HoG特征描述符得到一种DBHoG的描述符对边缘图像及输入草图进行特征提取并存储;步骤4,设置一种草图的图像掩码mask作为查询的约束条件,并基于汉明距离对步骤2、步骤3输入草图和边缘图像的两种特征进行距离计算;步骤5,将两种特征求得的距离进行归一化并相加,得到最终的MBHoG特征描述符结果,选择MBHoG中最小的前N个值对应的图像作为查询结果;步骤6,将单一的RGB值作为输入,通过一种设置权值的方法,得到多种RGB值,并形成一个4096维的颜色直方图;步骤7,根据颜色直方图,对步骤5中得到的前N张图像重新排序,并显示结果。

【技术特征摘要】
1.一种基于多种二进制HoG描述符的草图检索方法,其特征在于,包括以下步骤:步骤1,对数据库中的图像提取边缘图像;步骤2,基于BHoG特征描述符得到一种PBHoG特征描述符对边缘图像及输入草图进行特征提取并存储;步骤3,基于传统的HoG特征描述符得到一种DBHoG的描述符对边缘图像及输入草图进行特征提取并存储;步骤4,设置一种草图的图像掩码mask作为查询的约束条件,并基于汉明距离对步骤2、步骤3输入草图和边缘图像的两种特征进行距离计算;步骤5,将两种特征求得的距离进行归一化并相加,得到最终的MBHoG特征描述符结果,选择MBHoG中最小的前N个值对应的图像作为查询结果;步骤6,将单一的RGB值作为输入,通过一种设置权值的方法,得到多种RGB值,并形成一个4096维的颜色直方图;步骤7,根据颜色直方图,对步骤5中得到的前N张图像重新排序,并显示结果。2.根据权利要求1所述的方法,其特征在于,步骤1中采用StructuredForestsalgorithm进行边缘提取。3.根据权利要求1所述的方法,其特征在于,步骤2的具体过程为:步骤2.1,对图像划分cell时采用6×6的划分方法,并将2×2的cell联合起来形成一个block;步骤2.2,PBHoG在提取特征时,对每个cell中边缘像素的梯度方向划分为8个范围,并形成梯度方向直方图,在每个cell中提取幅值最大的两个方向的编码值作为特征;步骤2.3,使用8位的循环二进制编码进行方向信息的存储。4.根据权利要求1所述的方法,其特征在于,所述步骤3的具体过程在于:对于每个cell的梯度方向划分为8个范围,cell的梯度方向直方图先归一化到[0,0.8]的范围,再对每个范围用一个8位的二进制编码表示,编码方式为:每个cell用8个8位的二进制编码表示,每个编码表示一个方向的梯度值作为特征。5.根据权利要求1所述的方法,其特征在于,所述步骤4中草图的图像掩码mask作为查询的约束条件的具体设置方法为:若查询草图的某个cell中有边缘图像,则mask中相应位置的cell值设置为1;若查询草图某个cell为空,则mask中相应位置的cell值设置为0。6.根据权利要求5所述的方法,其特征在于,步骤4中基于汉明距离对步骤2、步骤3输入草图和边缘图像的两种特征进行距离计算的具体过程如下:(1)PBHoG距离计算公式如下:

【专利技术属性】
技术研发人员:唐金辉王天齐
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1