【技术实现步骤摘要】
基于视觉词袋模型的人脸图像检索方法
本专利技术属于人脸图像检索
,特别是涉及一种基于视觉词袋模型的人脸图像检索方法。
技术介绍
近年来随着网络带宽技术和物联网行业的进步,智能手机等智能终端设备和应用迅速普及,围绕图像检索技术的相关研究越来越深入。传统的BoVW(BagofVisualWords)视觉词袋检索模型在目标检索方面获得了广泛应用,其技术要点在于,借鉴了文本检索技术中的词袋模型,通过提取图像中的视觉特征描述符(descriptor,也称特征点)并加以聚类形成视觉词汇表,对于一个待检索的图像,通过检测出的一组视觉单词来表示,从视觉词汇表中找到相关的单词,计算拥有这些视觉单词的图像跟检索图像的相似度并以此排序,从而得到检索结果。这种方法已经被广泛应用于基于目标的图像检索中,但是对于基于人脸的检索,这种方法有诸多局限性,主要包括以下几点:第一,传统的视觉词袋模型在建立索引阶段进行特征点检测的时候,是对整幅图片进行检测,而对于人脸图像检索场景来说,只关注图像中的人脸部分,检测图像其余部分会导致大量的视觉单词噪点。第二,传统方法在生成视觉词汇表时是对所有视觉特征描述符进行k-means(k均值)聚类,在海量图像的场景下会导致非常低的运行效率。第三,传统方法在计算检索图像和候选图像的相似度时,采用的是TF-IDF(TermFrequency-InverseDocumentFrequency,词项频率-文档频率)相似度权重计算方式,仅仅考虑到视觉特征点的信息,而没有考虑人脸的五官特征信息,会导致检索结果准确率低等问题。鉴于此,有必要提供一种新的基于视觉词袋 ...
【技术保护点】
一种基于视觉词袋模型的人脸图像检索方法,其特征在于,所述检索方法包括:索引阶段和检索阶段;其中,所述索引阶段包括:1.1)通过特征分类器对训练图像中的任一张图像提取出人脸部位,并从人脸部位中提取出局部区域图像;1.2)根据划分的局部区域,分别计算每个局部区域内的任一张局部区域图像,得到对应的视觉特征描述符向量;1.3)采用聚类算法对每个局部区域内的视觉特征描述符向量进行聚类,得到视觉单词词汇表,然后再根据所述视觉单词词汇表中的视觉单词对视觉特征描述符向量进行归类统计,生成倒排索引表,其中,所述倒排索引表以key‑value键值对的形式表示;所述检索阶段包括:2.1)通过特征分类器提取出待检索图像,并从待检索图像中提取出局部区域图像,然后分别计算每个局部区域图像,得到对应的视觉特征描述符向量;2.2)利用索引阶段生成的视觉单词词汇表对2.1)中所述的视觉特征描述符向量进行归类统计,得到相应的key‑value键值对;2.3)采用分布式并行计算方式将2.2)中得到的key‑value键值对与倒排索引表进行匹配,得到相似图像列表;2.4)通过对相似图像进行相似度分数计算,得到相似图像的相似度 ...
【技术特征摘要】
1.一种基于视觉词袋模型的人脸图像检索方法,其特征在于,所述检索方法包括:索引阶段和检索阶段;其中,所述索引阶段包括:1.1)通过特征分类器对训练图像中的任一张图像提取出人脸部位,并从人脸部位中提取出局部区域图像;1.2)根据划分的局部区域,分别计算每个局部区域内的任一张局部区域图像,得到对应的视觉特征描述符向量;1.3)采用聚类算法对每个局部区域内的视觉特征描述符向量进行聚类,得到视觉单词词汇表,然后再根据所述视觉单词词汇表中的视觉单词对视觉特征描述符向量进行归类统计,生成倒排索引表,其中,所述倒排索引表以key-value键值对的形式表示;所述检索阶段包括:2.1)通过特征分类器提取出待检索图像,并从待检索图像中提取出局部区域图像,然后分别计算每个局部区域图像,得到对应的视觉特征描述符向量;2.2)利用索引阶段生成的视觉单词词汇表对2.1)中所述的视觉特征描述符向量进行归类统计,得到相应的key-value键值对;2.3)采用分布式并行计算方式将2.2)中得到的key-value键值对与倒排索引表进行匹配,得到相似图像列表;2.4)通过对相似图像进行相似度分数计算,得到相似图像的相似度排序。2.根据权利要求1所述的基于视觉词袋模型的人脸图像检索方法,其特征在于,所述局部区域图像包括额头、左部眼睛区域、右部眼睛区域、鼻子、左嘴角及右嘴角。3.根据权利要求2所述的基于视觉词袋模型的人脸图像检索方法,其特征在于,所述局部区域图像还包括左眉毛、右眉毛、左耳朵、右耳朵、下颌、左脸颊、或右脸颊中的一种或多种。4.根据权利要求1所述的基于视觉词袋模型的人脸图像检索方法,其特征在于,1.2)中还包括采用主成分分析法对所述视觉特征描述符向量进行降维处理,使所述视觉特征描述符向量从128维降到64维。5.根据权利要求1所述的基于视觉词袋模型的人脸图像检索方法,其特征在于,1.3)中key-value键值对包括key和value两部分,其中,所述key包括<局部区域ID_视觉单词ID>;所述value包括视觉单词t的idf值,其中,N为训练图像中所有人脸部位的总数,dft为出现视觉单词t的人脸部位个数;所述va...
【专利技术属性】
技术研发人员:陈晓东,陈新荃,
申请(专利权)人:中国科学院上海高等研究院,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。