结构化数据与图片的关联方法与关联装置制造方法及图纸

技术编号:10369834 阅读:116 留言:0更新日期:2014-08-28 12:28
本发明专利技术提供了结构化数据与图片的关联方法与关联装置,其中关联方法包括:获取图片的文字描述信息,对文字描述信息进行语意扩展,得到扩展后的扩展描述信息;将扩展描述信息与存储有结构化数据的百科数据库进行匹配,确定与扩展描述信息匹配的主题;在匹配的主题包括的多条结构化数据中,选择与扩展描述信息相关度超过指定相关度的至少一条结构化数据;将选择的至少一条结构化数据与图片进行关联。本发明专利技术能够达到结构化数据与图片相关联的目的,基于相关联的结构化数据能够对图片进行准确的识别,从而能够为用户提供更精准的搜索结果,还能为用户提供关于图片内容的扩展信息。

【技术实现步骤摘要】
结构化数据与图片的关联方法与关联装置
本专利技术涉及互联网应用领域,特别是涉及一种结构化数据与图片的关联方法与关联装置,以及一种生成结构化数据搜索结果项的方法、装置与系统。
技术介绍
随着技术的发展,网络已经成为人们目前最大的资料来源。当用户需要了解某些特定信息时,最常用的方式就是到网上获取,网络资源库已以其内容的多、全的特性取代了曾经的纸质资源库。当用户通过网络搜索到想要的图片后,虽然通过现有的图片描述文本能够获取到一定量的关于图片内容的信息,但现有的描述文本往往信息量少、不规范,且文本内容有限,一般的搜索引擎无法对其进行准确分类和识别,从而也无法为用户提供更多更精准的结果,也无法得到关于图片内容的扩展信息。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的结构化数据与图片的关联方法和相应的关联装置。依据本专利技术实施例的一个方面,提供了一种结构化数据与图片的关联方法,包括:获取图片的文字描述信息,对所述文字描述信息进行语意扩展,得到扩展后的扩展描述信息;将所述扩展描述信息与存储有结构化数据的百科数据库进行匹配,确定与所述扩展描述信息匹配的主题;在匹配的主题包括的多条结构化数据中,选择与所述扩展描述信息相关度超过指定相关度的至少一条结构化数据;将选择的所述至少一条结构化数据与所述图片进行关联。可选地,对所述文字描述信息进行语意扩展,包括:分别对所述文字描述信息进行分析,删除其中的停止词,其中,所述停止词是指出现多次但无实质意义的词,或称作停用词;对删除后的部分进行语意扩展。可选地,所述停止词包括下列至少之一:的、得、地。可选地,所述图片的文字描述信息,包括下列至少之一:图片所在页面的标题;图片周围的文本;图片的anchor文本;图片的名称,其中,所述图片的名称由上述文本至少之一获得。依据本专利技术实施例的另一个方面,还提供了一种生成结构化数据搜索结果项的方法,包括:获取搜索查询词对应匹配的图片;根据所述图片被赋予的结构化数据,生成搜索结果项。依据本专利技术实施例的另一个方面,还提供了一种结构化数据与图片的关联装置,包括:扩展模块,配置为获取图片的文字描述信息,对所述文字描述信息进行语意扩展,得到扩展后的扩展描述信息;匹配模块,配置为将所述扩展描述信息与存储有结构化数据的百科数据库进行匹配,确定与所述扩展描述信息匹配的主题;选择模块,配置为在匹配的主题包括的多条结构化数据中,选择与所述扩展描述信息相关度超过指定相关度的至少一条结构化数据;关联模块,配置为将选择的所述至少一条结构化数据与所述图片进行关联。可选地,所述扩展模块还配置为:对所述文字描述信息进行分析,删除其中的停止词,其中,所述停止词是指出现多次但无实质意义的词;对删除后的部分进行语意扩展。可选地,所述停止词包括下列至少之一:的、得、地。可选地,所述图片的文字描述信息,包括下列至少之一:图片所在页面的标题;图片周围的文本;图片的anchor文本;图片的名称,其中,所述图片的名称由上述文本至少之一获得。依据本专利技术实施例的另一个方面,还提供了一种生成结构化数据搜索结果项的装置,包括:获取模块,配置为获取搜索查询词对应的图片;生成模块,配置为根据所述图片以及所述图片关联的结构化数据,生成搜索结果页。依据本专利技术实施例的另一个方面,还提供了一种生成结构化数据搜索结果项的系统,包括:百科数据库,配置为包括多个主题,每个主题包括多条结构化数据;图片数据库,配置为存储有多张图片;对每张图片的文字描述信息进行语意扩展,得到扩展后的扩展描述信息;以及,根据所述扩展后的描述信息与百科数据库匹配,关联该图片与匹配得到的至少一条结构化数据;用户终端,配置为输入图片的搜索查询词;搜索引擎,配置为在所述图片数据库中搜索并获取所述搜索查询词对应的图片,以及,在所述百科数据库中搜索并获取与所述图片关联的结构化数据,结合获取的所述图片以及与所述图片关联的关联信息,生成搜索结果页。本专利技术实施例中,为使图片与结构化数据相关联,首先获取图片的文字描述信息,并对图片的文字描述信息进行语意扩展得到扩展描述信息。扩展描述信息涵盖文字描述信息的内容并能够通过语意扩展将描述范围扩大。在百科数据库中,大量结构化数据按照主题进行分类存储,百科数据库中每个主题下包含多条结构化数据。利用扩展描述信息与百科数据库相匹配,确定与扩展描述信息相匹配的主题,进而在确定的主题下选择与扩展描述信息匹配的若干条结构化数据。由于扩展描述信息是在文字描述信息的基础上得到的,因此通过确定与扩展描述信息相匹配的主题,等同于确定与图片对应的结构化数据所属的主题,这种首先确定主题的匹配方式能够保证最后获得结构化数据的准确性,当不同图片的文字描述信息出现雷同情况时可以通过主题进行区分,避免出现图片与结构化数据的关联错误。通过设定指定相关度,选择相匹配的主题下与扩展描述信息的相关度超过指定相关度的至少一条结构化数据与图片进行关联,能够保证结构化数据与图片的匹配程度,并为图片关联到尽可能多的结构化数据。由此可见,相对于现有技术无法为用户提供更精准的搜索结果,也无法得到关于图片内容的扩展信息的问题,应用本专利技术实施例中的关联方法能够达到结构化数据与图片相关联的目的,基于相关联的结构化数据能够对图片进行准确的识别,从而能够为用户提供更精准的搜索结果,还能为用户提供关于图片内容的扩展信息。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。根据下文结合附图对本专利技术具体实施例的详细描述,本领域技术人员将会更加明了本专利技术的上述以及其他目的、优点和特征。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了根据本专利技术一个实施例的结构化数据与图片的关联方法的处理流程图;图2示出了根据本专利技术一个实施例的生成结构化数据搜索结果项的方法的处理流程图;图3示出了根据本专利技术一个实施例的结构化数据与图片的关联装置的结构示意图;图4示出了根据本专利技术一个实施例的生成结构化数据搜索结果项的装置的结构示意图;以及图5示出了根据本专利技术一个实施例的生成结构化数据搜索结果项的系统的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。为解决上述问题,达到向用户提供更精准的图片搜索结果,还向用户提供关于图片内容的扩展信息的目的,本专利技术实施例提供了一种将图片与结构化数据关联起来的新的专利技术构思。其中结构化数据是经过规定格式的字段所组成的数据,一般可以通过对存储在百科数据库中的词条对应的数据信息提取加工得到,充分利用百科数据库信息量大且信息可靠性较强的特性,将得到的结构化数据存储在百科数据库中。当然个别结构化本文档来自技高网...
结构化数据与图片的关联方法与关联装置

【技术保护点】
一种结构化数据与图片的关联方法,包括:获取图片的文字描述信息,对所述文字描述信息进行语意扩展,得到扩展后的扩展描述信息;将所述扩展描述信息与存储有结构化数据的百科数据库进行匹配,确定与所述扩展描述信息匹配的主题;在匹配的主题包括的多条结构化数据中,选择与所述扩展描述信息相关度超过指定相关度的至少一条结构化数据;将选择的所述至少一条结构化数据与所述图片进行关联。

【技术特征摘要】
1.一种结构化数据与图片的关联方法,包括:获取图片的文字描述信息,对所述文字描述信息进行语意扩展,得到扩展后的扩展描述信息;将所述扩展描述信息与存储有结构化数据的百科数据库进行匹配,确定与所述扩展描述信息匹配的主题;在匹配的主题包括的多条结构化数据中,选择与所述扩展描述信息相关度超过指定相关度的至少一条结构化数据;将选择的所述至少一条结构化数据与所述图片进行关联。2.根据权利要求1所述的方法,其中,对所述文字描述信息进行语意扩展,包括:分别对所述文字描述信息进行分析,删除其中的停止词,其中,所述停止词是指出现多次但无实质意义的词;对删除后的部分进行语意扩展。3.根据权利要求2所述的方法,其中,所述停止词包括下列至少之一:的、得、地。4.根据权利要求1至3任一项所述的方法,其中,所述图片的文字描述信息,包括下列至少之一:图片所在页面的标题;图片周围的文本;图片的anchor文本;图片的名称,其中,所述图片的名称由上述文本至少之一获得。5.一种生成结构化数据搜索结果项的方法,包括:获取搜索查询词对应匹配的图片;根据所述图片被赋予的结构化数据,生成搜索结果项;其中,所述结构化数据按如下方式生成:获取图片的文字描述信息,对文字描述信息进行语意扩展,得到扩展后的扩展描述信息;将扩展描述信息与存储有结构化数据的百科数据库进行匹配,确定与扩展描述信息匹配的主题;在匹配的主题包括的多条结构化数据中,选择与扩展描述信息相关度超过指定相关度的至少一条结构化数据。6.一种结构化数据与图片的关联装置,包括:扩展模块,配置为获取图片的文字描述信息,对所述文字描述信息进行语意扩展,得到扩展后的扩展描述信息;匹配模块,配置为将所述扩展描述信息与存储有结构化数据的百科数据库进行匹配,确定与所述扩展描述信息匹配的主题;选择模块,配置为在匹...

【专利技术属性】
技术研发人员:陶哲
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1