A sketch based interactive image search and fusion method includes the following steps: (1) image library building index file process; (2) getting image retrieval results based on sketch; (3) image fusion process. The method of the invention is greatly shortened compared with Sketch2Photo in the overall processing time, but also provides more free user interaction, and compared to the Photosketcher, the method of the invention can provide higher retrieval precision, and greatly reduce the number of users, to provide more reasonable and rich material for the user.
【技术实现步骤摘要】
一种基于草图的交互式图像搜索与融合方法
本专利技术涉及一种基于草图的交互式图像搜索与融合方法,属于信息
,特别是属于计算机视觉
技术介绍
随着社交网络的普及,人们对图像进行处理的需求越来越旺盛。一些简单易用的图像处理软件变得十分火热。分析其成功背后的原因,无非是为非专业用户提供了简单方便的图像编辑的平台。但目前为止还没有一款软件为用户提供简易的自由图像合成的功能。早在2010年左右,已经有研究人员针对于方便、快捷的合成一幅图像进行了研究。核心问题是如何方便快捷的获取目标物体以及背景图像?目前可用的检索手段只有两种:基于文本的图像检索以及基于草图的图像检索。单一的依靠文本检索,往往难以获得满足特定形状特征的物体;而仅仅依靠目前的草图检索技术,在检索精度上又会大打折扣。Sketch2Photo(参见Chen,T.,Cheng,M.,Tan,P.,Shamir,A.,Hu,S.2009.Sketch2Photo:InternetImageMontage.ACMTrans.Graph.28,5,Article124(December2009),10pages.DOI=10.1145/1618452.1618470)将两种方式相结合,实现了自动由草图合成真实图片。但直接在线处理互联网上的图片,经过层层过滤来找到满足合成需要的图片往往需要很长时间,难以满足用户需求。为了满足时间的需求,就需要对图片提前进行离线的预处理,这就需要自建图像库。Photosketcher(参见EitzM,RichterR,HildebrandK,BoubekeurT,Alex ...
【技术保护点】
一种基于草图的交互式图像搜索与融合方法,其特征在于:所述方法包括下列操作步骤:(1)图像库建立索引文件过程,具体内容是:将图像库中源图像分割为只包含单一物体的子图像,记录其映射关系;获取子图像中物体轮廓,并且利用GF‑HOG算法计算其对应的特征向量;根据BoVW视觉词袋模型,对所得特征向量进行聚类,获得视觉词典;然后对每一子图计算其视觉单词词频的统计直方图;按照倒排索引的方式,建立所述图像库的索引文件;(2)基于草图获得图像检索结果过程,具体内容是:根据用户输入的草图,计算该草图的特征向量;根据步骤(1)中所得到的视觉词典,获取草图的统计直方图;根据该直方图,利用步骤(1)所得的索引文件,计算草图与各子图像的相似度,对子图像按照相似度进行排序;结合子图像的标签信息,对排序结果进行反馈;根据步骤(1)中所述的映射关系,将子图像所对应的源图像返回给用户;(3)图像融合过程,具体内容是:从所述步骤(2)获得的检索图像,使用Grabcut算法抠出所需要的物体;使用Possion融合方法把抠出的物体放进背景图像,实现图像融合。
【技术特征摘要】
1.一种基于草图的交互式图像搜索与融合方法,其特征在于:所述方法包括下列操作步骤:(1)图像库建立索引文件过程,具体内容是:将图像库中源图像分割为只包含单一物体的子图像,记录其映射关系;获取子图像中物体轮廓,并且利用GF-HOG算法计算其对应的特征向量;根据BoVW视觉词袋模型,对所得特征向量进行聚类,获得视觉词典;然后对每一子图计算其视觉单词词频的统计直方图;按照倒排索引的方式,建立所述图像库的索引文件;(2)基于草图获得图像检索结果过程,具体内容是:根据用户输入的草图,计算该草图的特征向量;根据步骤(1)中所得到的视觉词典,获取草图的统计直方图;根据该直方图,利用步骤(1)所得的索引文件,计算草图与各子图像的相似度,对子图像按照相似度进行排序;结合子图像的标签信息,对排序结果进行反馈;根据步骤(1)中所述的映射关系,将子图像所对应的源图像返回给用户;(3)图像融合过程,具体内容是:从所述步骤(2)获得的检索图像,使用Grabcut算法抠出所需要的物体;使用Possion融合方法把抠出的物体放进背景图像,实现图像融合。2.根据权利要求1所述的一种基于草图的交互式图像搜索与融合方法,其特征在于:所述步骤(1)中获取子图像中物体轮廓的具体内容是包括如下操作步骤:(1101)使用物体检测算法YOLO,对图像库中每一幅图像中的物体进行检测,获得只包含单个物体的子图像、其对应的标签信息以及标签准确度;(1102)对上述的每个子图像,使用显著性区域检测算法SaliencyCut进行显著性区域检测,将子图像中前景即物体与背景分割开,形成二值化图像;(1103)对上述的二值化图像,使用Canny算法计算得到物体的轮廓。3.根据权利要求1所述的一种基于草图的交互式图像搜索与融合方法,其特征在于:所述步骤(1)中根据所得到的子图像中物体轮廓,计算其对应的特征向量的具体内容是包括如下操作步骤:(1201)首先,以二值化轮廓图M作为输入,其中M(x,y)=1表示轮廓像素点,M(x,y)=0表示非轮廓像素点,x,y分别表示像素点的行和列坐标,运用以下公式求得轮廓像素点的梯度方向θ(x,y),从而获得轮廓图M的稀疏梯度方向场Ψ:(1202)在保持轮廓像素点梯度方向不变的情况下,对非轮廓像素点的梯度方向进行插值处理,从而获得稠密梯度方向场ΘΩ;同时为使所述的稠密梯度方向场ΘΩ在整个图像坐标Ω∈R2满足平滑性,需要对稠密梯度方向场ΘΩ进行拉普拉斯平滑约束,具体如下式:该式中,Θ表示待求的像素点的梯度方向,Ω表示整个图像坐标,∫∫Ω是在整个图像坐标系中对运算符内数值求积分操作,表示求梯度操作,v是对所述的稀疏梯度方向场Ψ计算其梯度后得到的引导场,即||||2表示对运算符内数值求模的平方,表示轮廓像素点,θ是轮廓像素点的梯度方向;(1203)在满足狄利克雷边界条件的基础上,上式用如下泊松方程来进行求解:该式中,表示拉普拉斯算子,div是求散度操作,上述方程在离散状态下可表示为如下方程:
【专利技术属性】
技术研发人员:王敬宇,戚琦,赵宇,王晶,廖建新,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。