一种图像搜索方法、特征向量的生成方法、装置及电子设备制造方法及图纸

技术编号:19240370 阅读:22 留言:0更新日期:2018-10-24 03:55
本申请公开了一种图像搜索方法及系统。所述方法包括:获得搜索词;分析图像的图像特征,以获取由图像表示的对象的内容;将所述搜索词与所述内容进行比较;和根据比较结果确定图像是搜索词的搜索结果。本方法搜索结果更为准确。

【技术实现步骤摘要】
一种图像搜索方法、特征向量的生成方法、装置及电子设备本申请要求于2017年03月31日提交中国专利局、申请号为201710208412.8、专利技术名称为“一种特征向量的生成、搜索方法、装置及电子设备”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
本申请涉及深度学习
,具体涉及一种图像搜索方法及图像搜索系统。本申请同时涉及一种用于搜索的特征向量生成方法及装置、一种电子设备、存储器以及一种用于图像搜索方法。
技术介绍
互联网、电子商务的发展会产生越来越多的图像数据,而对图像数据进行有效检索也成为日益增长的需求。现有的图像搜索技术主要为以文搜图,例如:通过输入关键词进行的搜索,依赖检索图像的文字说明。目前的以文搜图是对搜索引擎数据库中的所有图像建立相应的自然语言描述(可以通过抽取图像上下文、doc标题等方式获取),当用户输入搜索词进行检索时,计算搜索词和图像对应的自然语言描述之间的相似度,并用此相似度作为搜索词和相关图像之间的相似度,并按照此相关性对图像进行召回、排序。由此可见,通过以文搜图的方式进行搜索时,是以图像的标题、属性等的文字描述匹配从而搜索出相应的图像,所以图像数据必须有相应的文字描述(图像的),否则不能被检索。另外,以文搜图的方式是通过图像对应的文字描述作为中介,而文字描述则只能够反映局部、片面的信息,因此搜索返回的结果很大程度上受图像文字描述的准确性、完整性的影响,搜索出的图像不准确。
技术实现思路
本申请提供一种图像搜索方法及图像搜索系统,以解决现有技术中的上述问题。本申请同时提供一种用于搜索的特征向量生成方法及装置、一种电子设备、存储器以及一种用于图像搜索方法。本申请提供的一种图像搜索方法,其包括:获得搜索词;分析图像的图像特征,以获取由图像表示的对象的内容;将所述搜索词与所述内容进行比较;和根据比较结果确定图像是搜索词的搜索结果。可选的,所述获取搜索词包括将所述搜索词转换为第一特征向量;所述分析图像的图像特征以获取由图像表示的对象的内容包括将图像特征转换为表示内容的第二特征向量;和所述将所述搜索词与所述内容进行比较,包括将所述第一特征向量与所述第二特征向量进行比较。可选的,所述根据比较结果确定图像是搜索词的搜索结果,包括:通过确定所述第一特征向量与所述第二特征向量之间的相似度达到阈值,以确定图像是搜索结果。可选的,所述分析图像的图像特征以获取由图像表示的对象的内容包括:在不依赖与图像相关的文本描述的情况下提取图像的图像特征。可选的,所述分析图像的图像特征以获取由图像表示的对象的内容包括:确定图像的焦点;和根据图像的焦点确定图像的内容。可选的,所述确定图像的焦点包括确定图像的主要部分。可选的,所述分析图像的图像特征以获取由图像表示的对象的内容包括:基于神经网络模型预设层级的特征来分割数据信息;和获取每个分割语义特征信息。可选的,还包括在神经网络模型中利用双曲正切函数和预设特征矩阵。可选的,进一步包括使用L1norm范数将每一段语义特征信息和预设的神经参数的乘积归一化。可选的,进一步包括通过使用normL2范数对神经网络模型的输出归一化。可选的,所述将所述搜索词转换为第一特征向量包括:对搜索词分段;和基于神经网络模型,应用嵌入层获得第一特征向量。此外,本申请还提供一种图像搜索系统,其包括:请求接收模块,用于获得搜索词;图像内容获取模块,用于分析图像的图像特征,以获取由图像表示的对象的内容;比较模块,用于将所述搜索词与所述内容进行比较;和输出模块,用于根据比较结果确定图像是搜索词的搜索结果。此外,本申请还提供一种用于搜索的特征向量生成方法,其包括:获取数据信息;从所述数据信息中提取语义特征,获取语义特征信息;和利用预设函数,并将所述语义特征信息作为参数获取数据信息的特征向量。可选的,所述提取数据信息的语义特征包括:利用预设神经网络模型提取数据信息中的语义特征。可选的,所述预设的神经网络模型包括ResNet-152。可选的,所述将所述语义特征信息作为参数获取数据信息的特征向量,包括:根据所述数据信息的类型设置函数和函数的变量;和利用语义特征信息作为参数,获取数据信息的特征向量。可选的,所述数据信息包括文本信息。可选的,所述数据信息包括图像信息。可选的,所述提取数据信息的语义特征获取语义特征信息,包括:基于神经网络模型预设层级的特征拆分数据信息;和获取每一拆分单元的语义特征信息。可选的,预设函数包括一个具有预设特征矩阵的双曲正切函数和一个求和函数;和利用预设函数,并将所述语义特征信息作为参数,获取数据信息的特征向量包括:根据求和函数获得语义特征信息的和;根据预设特征矩阵训练语义特征信息的和,获得训练结果;和根据双曲正切函数,以所述训练结果作为参数,获取所述数据信息的特征向量。此外,本申请还提供一种用于搜索的特征向量生成装置,其包括:获取模块,用于获取数据信息;语义特征提取模块,用于从所述数据信息中提取语义特征,获取语义特征信息;和特征向量生成模块,用于利用预设函数,并将所述语义特征信息作为参数获取数据信息的特征向量。此外,本申请还提供一种电子设备,其包括:一个或多个处理器;和在其上存储有计算机可读指令的一个或多个存储器,当所述计算机可读指令被一个或多个处理器执行时,导致一个或多个处理器执行包括如下的行为:获取数据信息;从所述数据信息中提取语义特征,获取语义特征信息;和利用预设函数,并将所述语义特征信息作为参数获取数据信息的特征向量。此外,本申请还提供一个或多个存储在其上存储有计算机可读指令的存储器,当所述计算机可读指令被一个或多个处理器执行时,导致一个或多个处理器执行包括如下的行为:获取数据信息;从所述数据信息中提取语义特征,获取语义特征信息;和利用预设函数,并将所述语义特征信息作为参数获取数据信息的特征向量。此外,本申请还提供一种用于图像搜索方法,其包括:向服务器发出查询请求,其中,所述查询请求携带有搜索词;接收服务反馈的查询结果,其中,所述查询结果由服务器通过执行如下步骤而获得:获得搜索词;分析图像的图像特征,以获取由图像表示的对象的内容;将所述搜索词与所述内容进行比较;和根据比较结果确定图像是搜索词的搜索结果。此外,本申请还提供一种图像搜索方法,其包括:获得待搜索图像;分析待搜索图像的图像特征,以获取由图像表示的对象的内容,称为待搜索图像内容;分析目标图像的图像特征,以获取目标图像表示的对象的内容,称为目标图像内容;将所述待搜索图像内容与所述目标图像内容进行比较;和根据比较结果确定图像是搜索词的搜索结果。与现有技术相比,本申请的其中一个方面具有以下优点:通过获得搜索词;分析图像的图像特征,以获取由图像表示的对象的内容;将所述搜索词与所述内容进行比较;和根据比较结果确定图像是搜索词的搜索结果;通过直接将搜索关键词与目标图像内容进行比对,搜索结果更为准确,相对于现有的依赖于图像文字说明表达图像内容的方法,本方法不但准确,而且更为全面,搜索覆盖率更高。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这本文档来自技高网...

【技术保护点】
1.一种图像搜索方法,其特征在于,包括:获得搜索词;分析图像的图像特征,以获取由图像表示的对象的内容;将所述搜索词与所述内容进行比较;和根据比较结果确定图像是搜索词的搜索结果。

【技术特征摘要】
2017.03.31 CN 20171020841281.一种图像搜索方法,其特征在于,包括:获得搜索词;分析图像的图像特征,以获取由图像表示的对象的内容;将所述搜索词与所述内容进行比较;和根据比较结果确定图像是搜索词的搜索结果。2.根据权利要求1所述的方法,其特征在于,所述获取搜索词包括将所述搜索词转换为第一特征向量;所述分析图像的图像特征以获取由图像表示的对象的内容包括将图像特征转换为表示内容的第二特征向量;和所述将所述搜索词与所述内容进行比较,包括将所述第一特征向量与所述第二特征向量进行比较。3.根据权利要求2所述的方法,其特征在于,所述根据比较结果确定图像是搜索词的搜索结果,包括:通过确定所述第一特征向量与所述第二特征向量之间的相似度达到阈值,以确定图像是搜索结果。4.根据权利要求2所述的方法,其特征在于,所述分析图像的图像特征以获取由图像表示的对象的内容包括:在不依赖与图像相关的文本描述的情况下提取图像的图像特征。5.根据权利要求2所述的方法,其特征在于,所述分析图像的图像特征以获取由图像表示的对象的内容包括:确定图像的焦点;和根据图像的焦点确定图像的内容。6.根据权利要求5所述的方法,其特征在于,所述确定图像的焦点包括确定图像的主要部分。7.根据权利要求6所述的方法,其特征在于,所述分析图像的图像特征以获取由图像表示的对象的内容包括:基于神经网络模型预设层级的特征来分割数据信息;和获取每个分割语义特征信息。8.根据权利要求7所述的方法,其特征在于,还包括在神经网络模型中利用双曲正切函数和预设特征矩阵。9.根据权利要求8所述的方法,其特征在于,进一步包括使用L1norm范数将每一段语义特征信息和预设的神经参数的乘积归一化。10.根据权利要求9所述的方法,其特征在于,进一步包括通过使用normL2范数对神经网络模型的输出归一化。11.根据权利要求2所述的方法,其特征在于,所述将所述搜索词转换为第一特征向量包括:对搜索词分段;和基于神经网络模型,应用嵌入层获得第一特征向量。12.一种图像搜索系统,其特征在于,包括:请求接收模块,用于获得搜索词;图像内容获取模块,用于分析图像的图像特征,以获取由图像表示的对象的内容;比较模块,用于将所述搜索词与所述内容进行比较;和输出模块,用于根据比较结果确定图像是搜索词的搜索结果。13.一种用于搜索的特征向量生成方法,其特征在于,包括:获取数据信息;从所述数据信息中提取语义特征,获取语义特征信息;和利用预设函数,并将所述语义特征信息作为参数获取数据信息的特征向量。14.根据权利要求13所述的方法,其特征在于,所述提取数据信息的语义特征包括:利用预设神经网络模型提取数据信息中的语义特征。15.根据权利要求14所述的方法,其特征在于...

【专利技术属性】
技术研发人员:刘宇刘瑞涛
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1