一种融合文本语义和视觉内容的Web人像检索方法技术

技术编号:2917350 阅读:298 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种融合文本语义和视觉内容的Web人像检索方法,该方法如下:向商业搜索引擎服务器提交“查询串”实现基于HTTP协议的连接和下载功能,下载商业图片搜索引擎的图片结果及相关网页作为本地图像库,同时抽取原始网页的关键标签形成后期文本处理使用的XML文件;采用AdaBoost人脸检测技术,并对包含图片的网页脚本进行向量模型的高层语义挖掘,并使用经验权值和基于PLSA的动态加权方法进行对比;通过一个调节因子,将对图像进行的视觉上和文本上的特征分析结果动态结合,得到图像与查询的相关度排序值,重新排序搜索引擎图像结果列表,并反馈给用户。本方法有更高的查准率,特别是特征融合之后有了大幅度的提高。

【技术实现步骤摘要】

本专利技术涉及一种人像检索方法,特别是指一种融合文本语义和视觉内容的Web检索方法。本专利技术以Internet环境中的Web人像图片检索为对象,对Web文本语义挖掘与图像视觉内容判别的融合技术进行了较为深入的研究,实现了一个Internet环境下Web人像图片检索的原型系统。
技术介绍
随着计算机技术、网络技术和大容量存储技术等的不断发展,以及个人电脑和数字摄像设备的普及,互联网上可获取的多媒体信息的数量也以惊人的速度增长,特别是图像以其直观性和包含信息的丰富性,被广泛地使用并上传至互联网。互联网上信息激增给用户提供丰富资源的同时也带来了挑战:浩如烟海的各类信息无序地分布于各处,往往因为缺乏应有的组织和管理而难以得到有效的利用,这在一定程度上造成了资源的浪费。因此,人们面临的一种迫切需求是,如何从信息的汪洋中,快速有效地定位并获得感兴趣的资源。这种需求也促使了信息检索技术的产生与发展。随着相关学科的发展,信息检索这个方向的研究热点已经经历了很大的发展与变化,从基于文本的信息检索,到基于内容的图像/视频、音频检索和多媒体检索,以及面向WWW的多媒体检索。检索技术是一项实用性极强的应本文档来自技高网...

【技术保护点】
一种融合文本语义和视觉内容的Web人像检索方法,其特征在于:将文本和视觉特征结合运用,该方法其具体步骤如下: 步骤一 网络爬行形成本地原始图片库 向商业搜索引擎服务器提交“查询串”实现基于HTTP协议的连接和下载功能,下载商业图片搜索引擎的图片结果及相关网页作为本地图像库,同时抽取原始网页的关键标签形成后期文本处理使用的XML文件; 步骤二 进行图像内容和文本语义挖掘 采用了当前检测性能好、速度快的AdaBoost人脸检测技术,另一方面,我们对包含图片的网页脚本进行向量模型的高层语义挖掘,并使用经验权值和基于PLSA的动态加权方法进行对比; 步骤三 视觉和文本特征的动态融合 通过一个调节因子,...

【技术特征摘要】
1、一种融合文本语义和视觉内容的Web人像检索方法,其特征在于:将文本和视觉特征结合运用,该方法其具体步骤如下:步骤一 网络爬行形成本地原始图片库向商业搜索引擎服务器提交“查询串”实现基于HTTP协议的连接和下载功能,下载商业图片搜索引擎的图片结果及相关网页作为本地图像库,同时抽取原始网页的关键标签形成后期文本处理使用的XML文件;步骤二 进行图像内容和文本...

【专利技术属性】
技术研发人员:赵耀谢琳朱振峰
申请(专利权)人:北京交通大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1