一种基于焦点对象识别和主题语义的图像搜索方法及系统技术方案

技术编号：10072755 阅读：253 留言：0更新日期：2014-05-23 19:14

一种基于焦点对象识别和主题语义的图像搜索方法及系统。所述方法包括以下步骤。S1、对待搜索图像进行底层特征语义提取，并形成高维特征向量空间后，进行图像分割，获得待搜索图像的元素。S2、将待搜索图像的元素进行元素识别后抽象至语义概念层，并根据不同元素的相对距离及共现概率，判断待搜索图像中的不同元素是否相关，若是，将相关元素组合成对象。S3、计算对象的相对空间位置及占比面积，并计算各对象的兴趣指数及重要指数，根据计算结果，从不同对象中识别出焦点对象。S4、根据焦点对象，构建待搜索图像的主题语义模型，并获取具有焦点对象的现有图像，通过KL距离度量待搜索图像与现有图像之间的相似度，并输出相似度较高的现有图像。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术本属于图像处理
，具体涉及一种基于焦点对象识别和主题语义的图像搜索方法及系统。
技术介绍
随着移动互联网的兴起与蓬勃发展，各类智能终端设备迅速普及。移动开发者推出大量移动场景下的应用程序（app），如微信、来往、SnapChat、Instagram等客户端社交应用软件，以及淘宝、天猫和京东等客户端电子商务软件。这类软件不但会产生大量内容丰富的图像数据，而且会产生各种图像搜索需求。尤其是随着电子商务的发展，O2O(Online To Offline)模式的快速布局，“手机拍照+以图搜图+比价购物”的新兴移动搜索形式对传统图像检索提出了巨大的挑战。当前，互联网图像数据规模已呈现指数级增长，面对海量的图像数据，如何有效管理庞大的图像资源库，利用相似图像检索技术，快速准确的检索出满足用户查询意图的图像信息，仍然是当前学术界、工业界亟需解决的难题。纵观图像检索技术的发展历程，可分为两个阶段：基于文本的图像检索技术和基于内容的图像检索技术。换一个角度，也就是关键词搜图和以图搜图。其中，基于文本的图像检索（Text-based Image Retrieval,TBIR）技术是通过人工对图像添加标注，或通过网络挖掘图片的环绕文本，构成图片的描述性信息。然后对这些文本信息构建索引，建立图像与文本之间的映射关系，便于搜索引擎或系统采用关键词匹配的方式进行图像检索。这种图像检索方法简单、易于理解...
一种基于焦点对象识别和主题语义的图像搜索方法及系统

【技术保护点】
一种基于焦点对象识别和主题语义的图像搜索方法，其特征在于，包括以下步骤：S1、对待搜索图像进行底层特征语义提取，并形成高维特征向量空间后，进行图像分割，获得所述待搜索图像的元素；S2、将所述待搜索图像的元素进行元素识别后抽象至语义概念层，并根据不同元素的相对距离及共现概率，判断所述待搜索图像中的不同元素是否相关，若是，则将相关元素组合成对象；S3、计算所述对象的相对空间位置及占比面积，并计算各对象的兴趣指数及重要指数，根据计算结果，从不同对象中识别出焦点对象；S4、根据所述焦点对象，构建待搜索图像的主题语义模型，并获取具有所述焦点对象的现有图像，通过KL距离度量待搜索图像与现有图像之间的相似度，并输出相似度较高的现有图像。

【技术特征摘要】
1.一种基于焦点对象识别和主题语义的图像搜索方法，其特征在于，包
括以下步骤：
S1、对待搜索图像进行底层特征语义提取，并形成高维特征向量空间后，
进行图像分割，获得所述待搜索图像的元素；
S2、将所述待搜索图像的元素进行元素识别后抽象至语义概念层，并根
据不同元素的相对距离及共现概率，判断所述待搜索图像中的不同元素是否
相关，若是，则将相关元素组合成对象；
S3、计算所述对象的相对空间位置及占比面积，并计算各对象的兴趣指
数及重要指数，根据计算结果，从不同对象中识别出焦点对象；
S4、根据所述焦点对象，构建待搜索图像的主题语义模型，并获取具有
所述焦点对象的现有图像，通过KL距离度量待搜索图像与现有图像之间的相
似度，并输出相似度较高的现有图像。
2.根据权利要求1所述的方法，其特征在于，在步骤S2中，若待搜索
图像的元素的空间位置为坐标(xi,yi)，则元素e和元素g的相对距离表示为
，其中Pwidth表示图像P的宽度，Plength表示图像
P的长度。
3.根据权利要求1所述的方法，其特征在于，在步骤S2中，元素e和
元素g的共现概率表示为，其中：，且P(e,g)
表示元素e和元素g在图像库中共同出现的概率，c(e,g)表示元素e和元素g
在图像库中共同出现的次数；，且P(e)表示元素e在图像库中出
现的概率，c(e)表示元素e在图像库中出现的次数。
4.根据权利要求1至3任一项所述的方法，其特征在于，在步骤S2中，
判断所述待搜索图像中的不同元素是否相关的依据为：
f(e,g)=1,if[αlow≤MI(e,g)≤αhighandβlow≤p(e,g)≤βhigh]0,else]]>；其中，α和β的边界通过在

\t图像库中训练得到。
5.根据权利要求1所述的方法，其特征在于，在步骤S2中，若待搜索
图像中的不同元素不相关，则将所述不同元素分别划分为独立的对象。
6.根据权利要求1所述...

【专利技术属性】
技术研发人员：朱巧明，康杨杨，洪宇，
申请(专利权)人：苏州大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人