检索/存储与事件相关联的图像制造技术

技术编号:14943284 阅读:86 留言:0更新日期:2017-04-01 09:36
描述了检索和/或存储与事件相关联的图像。例如,包括文本的事件数据的流被分析以检测事件并且语言组件构建包括多个词语的、针对该事件的事件语言模型。在各种示例中,从web或其他源提取的图像具有相关联的文本。在示例中,具有与事件语言模型相似的相关联的文本的图像被标识为该事件的图像。在各种示例中,图像与事件之间的关联被用于更新图像检索系统和/或图像存储系统。在各种示例中,在图像检索系统处接收与事件有关的查询项,图像检索系统基于图像文本与事件语言模型之间的关联来返回与该事件相关的图像。

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
图像检索通常通过利用文本来标记图像并且然后使用基于文本的文档检索方法来找到与由用户输入的查询词语相关的图像来实现。基于自动分析图像的内容的其他方法是更复杂的。随着互联网上和来自其他源的图像文件的可用性持续增加,存在对高效且有效的图像检索系统的不断发展的需求。下面描述的实施例不限于解决已知图像检索系统的缺点中的任何或全部缺点的实现方式。
技术实现思路
下面呈现了本公开内容的简化概要以便向读者提供基本理解。本概要不是本公开内容的广泛概述并且其不标识关键/重要元件或勾勒本说明书的范围。其唯一目的是以简化的形式呈现本文公开的概念的选集作为对稍后呈现的更详细的描述的前序。描述了检索和/或存储与事件相关联的图像。例如,利用机器学习分析包括文本的事件数据的流以检测事件并且针对该事件构建包括多个词语的事件语言模型。在各种示例中,从web或其他源提取的图像具有相关联的文本。在示例中,具有与事件语言模型相似的相关联的文本的图像被标识为该事件的图像。在各种示例中,图像与事件之间的关联被用于更新图像检索系统和/或图像存储系统。在各种示例中,在图像检索系统处接收与事件有关的查询项,该图像检索系统基于图像文本与事件语言模型之间的关联来返回与事件相关的图像。将容易认识到伴随的特征中的许多特征,因为其通过参考结合附图来考虑的下面的详细描述而变得更好理解。附图说明本说明书将从鉴于附图来理解的下面的详细描述被更好地理解,在附图中:图1是用于检索与事件有关的图像的图像检索系统以及还有图像存储系统的示意图;图2是更详细的图1的事件图像定位器的示意图;图3是在图2的事件检测器处的方法的流程图;图4是在图2的关键短语提取组件处的方法的流程图;图5是在图2的语言组件处的方法的流程图;图6是在图2的图像访问和过滤器组件处的方法的流程图;图7是在图2的事件图像标识器处的过程的流程图;图8图示了图像存储系统和/或图像检索系统的实施例可以被实现在其中的示例性基于计算的设备。类似的参考标号被用于在附图中标示类似的部件。具体实施方式以下结合附图提供的详细描述旨在作为当前示例的描述并且不旨在表示当前示例可以在其中被构建或被利用的唯一形式。该描述阐述示例的功能和用于构建并操作示例的步骤的序列。然而,相同的或等效的功能和序列可以由不同的示例实现。图1是用于检索与事件有关的图像128、130、132的图像检索系统102以及还有图像存储系统112的示意图。诸如个人计算机116、平板计算机118、移动电话120、膝上型电脑122或其他终端用户设备的终端用户设备114能够与图像检索系统102和/或图像存储系统112进行通信以使得终端用户能够检索和/或存储与事件有关的图像。在图1的示例中,示出了在终端用户设备处的图形用户界面显示器124。终端用户已经将查询项“西雅图事件”输入到搜索框中并且三行结果被示出,每行示出了个体事件的图像并且具有被显示为标题的、与事件有关的关键短语。在该示例中,示出了具有关键短语“西雅图运动比赛1”的、与事件相关的五幅图像的行128;具有关键短语“西雅图运动事件2”的、与事件相关的五幅图像的第二行130以及具有关键短语“这周末的西雅图舞会”的、与事件相关的五幅图像的第三行132。用于图像检索的先前方法尚未能够以这种方式找到与特定事件相关的图像。图像检索系统102和/或图像存储系统112被定位在通信网络100处,通信网络100诸如互联网、内联网或对于终端用户设备104可访问的任何其他通信网络。也在通信网络100处可用的是事件图像定位器104、一个或多个图像源110以及一个或多个事件流106。图像源110是数据库或图像的其他存储库,图像诸如照片、视频、医学图像、深度图像、或其他类型的图像。图像源中的一个或多个图像源可以为图像社区网站。事件流106是计算机实现的并且输出诸如文本项的事件数据的流,例如其中文本项是具有140个字符或更少字符的消息。事件流106可以为社交媒体文本消息的流。在一些示例中,事件流中的文本项具有相关联的统一资源定位符(URL)。事件图像定位器104是计算机实现的并且能够使用通信网络100通过接收事件流106、图像源110、图像检索系统102和图像存储系统112的输入和/或向事件流106、图像源110、图像检索系统102和图像存储系统112发送输出来与那些实体进行通信。事件图像定位器104用于可选地实时地检测事件流106中的事件。事件图像定位器被布置为从图像源110中找到与检测到的事件的事件模型相似的图像并且被布置为使用找到的图像来改进图像检索系统102和/或改进图像存储系统112。事件模型是在事件数据中观察到的或与事件数据相关的多个词语。在示例中,事件模型是在事件数据中观察到的或与事件数据相关的词语的频率的直方图。在一些示例中,事件模型是一元语言模型。在一些示例中,事件模型是在词语的词汇表上的多项式概率分布。以下参考图2更详细的描述事件图像定位器104。图像检索系统102是计算机实现的并且包括图像的索引。在一些示例中,图像已经使用web爬虫或其他手段定位。图像检索系统102包括排名算法,其被布置为将查询项应用到索引从而输出图像的经排名的列表。图像存储系统112是数据库或其他存储库,其保持图像以及相关联的事件数据。相关联的事件数据可以包括事件模型、时间间隔或其他时间数据、位置数据。本文中描述的事件图像定位器的功能能够至少部分地由一个或多个硬件逻辑组件执行。例如但不限于,能够被使用的硬件逻辑组件的说明性类型包括现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统的系统(SOC)、复杂可编程逻辑器件(CPLD)。图2是更详细的图1的事件图像定位器的示意图。事件图像定位器104接收来自事件流106和来自一个或多个图像源110的输入。事件图像定位器104包括事件检测器200、可选关键短语提取器202、语言组件204、图像访问和过滤器组件206以及事件图像标识器208。在一些示例中,文本数据项的流是社交媒体流,并且图像是根据文本数据项的流的速率被实时标识的。事件图像定位器针对在事件流106中标识的个体事件输出事件语言模型、可选事件标题以及事件图像210。来自事件图像定位器104的信息被使得对图像检索系统212和/或图像存储系统可用。事件检测器200被布置为可选地实时地检测事件流106中的事件。如以上所提到的,事件流包括事件数据项,诸如140个字符的、可选地还具有URL的文本消息。事件数据项可以来源于来自许多不同的源,诸如在不同位置中操作终端用户设备的个体。这些个体已经给予他们针对事件数据项要被使用的同意。可以在通信网络100中的一个或多个实体处接收事件数据项,并且使得事件数据项可用作事件流106。事件数据项可以具有时间戳。事件数据项可以具有位置,诸如事件数据项的发送者的位置。事件数据项中的任何私有数据(诸如发送者信息)从事件流106被省略或者被聚合。发送者位置信息被缩放以便不显现能够标识发送者的发送者的位置。事件检测器200使用事件数据项的特征将事件数据的流聚类300。这些特征可以是以下的任一项:文本特征、时间特征、位置特征。聚类可以使用任何在线增量聚类技术来实现。作为结果本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201580040406.html" title="检索/存储与事件相关联的图像原文来自X技术">检索/存储与事件相关联的图像</a>

【技术保护点】
一种对描绘事件的图像进行定位的方法,包括:在处理器处检测来自文本数据项的流的事件;使用检测到的所述事件来触发语言组件以构建事件语言模型,所述事件语言模型包括从所述文本数据项形成的多个词语;以及使用所述事件语言模型标识来自一个或多个源的图像。

【技术特征摘要】
【国外来华专利技术】2014.07.22 US 14/337,5741.一种对描绘事件的图像进行定位的方法,包括:在处理器处检测来自文本数据项的流的事件;使用检测到的所述事件来触发语言组件以构建事件语言模型,所述事件语言模型包括从所述文本数据项形成的多个词语;以及使用所述事件语言模型标识来自一个或多个源的图像。2.根据权利要求1所述的方法,其中检测所述事件包括计算来自与所述事件相关联的所述流的多个文本数据项,并且其中所述事件语言模型是所述多个文本数据项中的词语的出现的频率的直方图。3.根据权利要求1所述的方法,其中所述事件语言模型是一元语言模型。4.根据权利要求1所述的方法,其中检测所述事件包括计算来自与所述事件相关联的所述流的多个文本数据项,并且其中所述事件语言模型是按所述多个文本数据项中的出现的频率排名前n位的词语。5.根据权利要求1所述的方法,其中标识来自所述一个或多个源的图像包括获得经标识的所述图像的文本标注。6.根据权利要求5所述的方法,其中获得所述文本标注包括访问web页面,经标识的图像源自于所述web页面。7.根据权利要求6所述的方法,其中标识经标识的所述图像中的一幅图像包括计算所述图像的文本标注与所述事件语言模型之间的相似度。8.根据权利要求7所述的方法,其中计算所述相似度包括将所述文本标注与所述事件语言模型中的词语的标识和/或语义含义进行比较。9.根据权利要求1所述的方法,其中所述文本数据项的流是社交媒体流,并且其中所述图像根据所述文本数据项的流的速率来被实时地标识。10.根据权利要求1所述的方法,其中检测来自所述文本数据项的流的事件包括对所述文本数据项进行聚类以产生多个簇并使用分类器来将所述簇分类为事件簇或非事件簇;并且其中所述分类器使用以...

【专利技术属性】
技术研发人员:R·H·AM·曼索尔M·F·阿布德尔哈迪H·S·M·A·埃尔巴兹
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1