一种基于眼动的提取图像兴趣区域的交互式图像检索方法技术

技术编号：13039344 阅读：75 留言：0更新日期：2016-03-23 10:52

本发明专利技术公开了一种基于眼球追踪的交互式图像检索方法。本发明专利技术旨在克服现有的基于内容的图像检索方法的不足，主要是对传统的基于内容的图像检索方法的低召回率、低准确率以及不具有更好的人机交互性能的缺点进行改进。基于眼球追踪的图像内容检索方法能够很好的结合用户的注视兴趣区域来进行最大程度上的抓取用户的检索兴趣，从而最大程度上预测用户的检索意图，根据用户在浏览图片过程中对不同图片不同区域的注视时长、次数等眼球运动特征进行对用户搜索意图建模，根据该模型来解决传统的基于内容的图像检索的方法的不足，尤其是解决检索过程中更好的人机交互性能，从而促进召回率和准确率的提高。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于信息检索领域（基于内容的图像检索），涉及眼动数据的获取及应用到基于内容的图像检索内容，尤其是基于眼动数据在基于内容图像检索如何提高检索效果和改善用户体验的方法。
技术介绍
图像，作为一种内容丰富，表现直观的多媒体信息，一直以来受到人们的青睐。随着多媒体技术、计算机技术、通信技术以及互联网的迅速发展，各种各样的图像信息不断的涌进人们的生活和工作。各种应用不断地产生，使得图像信息的检索成为迫切需要解决的问题。对于图像的管理，在早期都是采用档案文件管理的方式。到上世纪70、80年代，对图像数据赋予属性信息，并且在图像信息中把这些信息格式化，再利用这些格式化的信息管理和查询图像。但是这些方法存在着一些无法克服的缺点：（1)图像的内容广泛，涉及到的各个领域，对于图像属性信息的自动生成对于目前的技术来说是不可行的。（2)人工生成的图像属性信息由于不同的人对图像信息的含义解释不同就会造成主观误差。即使相同的人在不同的环境下也会有不同的理解。（3)图像承载的信息量比语言文字要大得多，寥寥数语是不能完全表达图像的含义的。大型数据库的出现，上述问题变得更加严重了。于是人们提出了基于内容的图像检索技术（Content-BasedImageRetrieve,CBIR)，认为表示可视化的信息最直观最有效的方法是用图像中隐藏的特征来表示，并且把计算机视觉、数据库管理、人机交互和信息查找的综合研究引入了该领域。简单的说基于内容图像检索技术就是对图像的内容进行语义分析，从中抽取其颜色、纹理、形状、对象空间关系以及对象语义等特征，...

【技术保护点】
一种基于眼动的提取图像兴趣区域的交互式图像检索方法，其特征在于，包括以下步骤：步骤一、让用户坐于眼动仪前，并使用户的眼睛到眼动仪屏幕之间的距离在60‑75cm之间，将图片库加载到与眼动仪连接的计算机中，保证图片随机在眼动仪屏幕上显示，同时，眼动仪屏幕上有一个跳动的小圆点来辅助用户矫正，所述眼动仪的采样率为300HZ；步骤二、用户在浏览图片的过程中，利用眼动仪收集用户的眼动数据，将用户的离散的注视点聚集为注视点簇，将注视点簇中时长少于150ms的点去掉，对收集到的眼动数据进行降噪,得到了每幅图像的所有有效注视点；步骤三、将注视点的屏幕坐标转换为注视点的图像坐标；步骤四、利用JSEG图像分割算法将图像分割成若干区域，然后根据注视点的图像坐标，判断哪些区域有注视点的分布，将有注视点的区域标记为兴趣区域，并且兴趣区域的兴趣值与该兴趣区域的注视点数目成正比；步骤五、提取兴趣区域的底层图像特征，至少包括HSV颜色直方图和sift特征；步骤六、用户通过人机交互方式从图片库中选取查询图像，利用迭代匹配的方法计算查询图像的兴趣区域与图片库中待匹配图像的兴趣区域之间的相似度，根据注视时间长度计算区域相似度...

【技术特征摘要】

【专利技术属性】
技术研发人员：任清涛，陈永强，张鹏，宋大为，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人