大规模图像注释的统计方法技术

技术编号：7143139 阅读：185 留言：0更新日期：2012-04-11 18:40

描述了大规模图像注释的统计方法。一般而言，注释技术包括编译来自多个图像的视觉特征和文本信息、散列图像视觉特征、并基于其散列值对图像聚类。一个示例系统从所聚类的图像中构建统计语言模型，并且通过应用统计语言模型中的一个来注释图像。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】背景随着廉价的数码相机、照相机电话和其他成像设备的出现，拍摄并张贴到因特网上的数字图像的数量显著地增长。然而，为了使用这些图像，必须标识和组织它们从而使得可以浏览、搜索或检索这些图像。一个解决方案是手动图像注释，其中人在拍摄、上传或登记图像时手动地输入描述性文本或关键词。虽然手动图像注释一般非常准确(例如，人们一般选择准确描述)，但手动图像注释是耗时的且因此许多数字图像未被注释。另外，手动图像注释可能是主观的，因为注释图像的人可能不考虑图像的关键特征(例如，人们通常基于图像中的人、图像被拍摄的时间、或图像的位置来注释图像)。另一个解决方案是用关键词自动地注释图像的自动图像注释。一般而言，自动图像注释是基于分类的或基于概率模型的。基于分类的方法试图通过学习分类器(例如，贝叶斯点机、支持矢量机等等)来将词或概念进行关联。而概率模型方法试图推断图像和注释之间的相关或联合概率(例如，翻译模型、跨媒体相关性模型、连续相关性模型等等)。虽然基于分类的和基于概率的图像注释算法能够注释小规模的图像数据库，但它们一般不能注释具有真实图像(例如，数字图片)的大规模数...

【技术保护点】
１．一种注释图像的方法，包括：编译来自多个图像的视觉特征和文本信息（１０４，５０４）；散列所述多个视觉特征，并且基于所述散列值对所述多个图像聚类（１０８，３０６，３０８）；基于所聚类的图像构建一个或多个统计语言模型（１１０，１１２）；以及使用所述统计语言模型中的一个或多个来注释所述图像（１２２）。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：M·李，
申请(专利权)人：微软公司，
类型：发明
国别省市：US

全部详细技术资料下载我是这个专利的主人