一种图像识别方法和装置制造方法及图纸

技术编号:9765900 阅读:121 留言:0更新日期:2014-03-15 11:33
本发明专利技术公开了一种图像识别的方法,包括:获取待识别图像,根据图像相似度查找与其相似的N张其他图像;获取其他图像对应的主体信息以及根据相似度排序确定每张其他图像的权值,根据各主体信息及对应图像的权值,分别对各主体信息进行权值累加计算,提取最大累加值对应的主体信息,作为待识别图像的主体信息。本发明专利技术的方案可以相对准确的搜索出未知图像的准确描述信息,进而在海量图像数据存在网络环境下,能够为用户提供未知图像搜索的准确结果,有效提高了图像数据处理的效率。

【技术实现步骤摘要】
一种图像识别方法和装置
本专利技术涉及数据处理的
,具体涉及一种图像识别方法和装置。
技术介绍
随着互联网和多媒体技术的飞速发展,互联网上的图像资源日益丰富,从网络上获取的图像资源也往往包含多种多样的信息,如背景、时间、地点、主体等等,而如此多的信息在通常情况下并非是用户真正所要关注的内容;例如,在浏览时事新闻网页时往往会出现多个图像,而用户对于新闻中的图像可能只关注时间和地点;而用户在浏览体育新闻网页时,可能只关注出现的多个图像中的人物和背景等;同时,用户能够从多种渠道获取到多种多样的图像,但不是所有图像都附带明确的说明或注释;例如,对于用户在浏览体育新闻网页时出现的配图,在某些情况下,用户并无法知晓该图像的准确信息;此外,用户也无法根据已知图像获取到其他与该图像相关联的图像。因此,如何在网络环境下实现对于图像的识别,从而准确获取该图像的准确描述或其相关联的其他图像就变得十分必要和迫切。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种图像识别的方法和相应的一种图像识别的装置。依据本专利技术的一个方面,提供了一种图像识别的方法,包括:获取待识别图像,根据图像相似度查找与其相似的N张其他图像;获取其他图像对应的主体信息以及根据相似度排序确定每张其他图像的权值,根据各主体信息及对应图像的权值,分别对各主体信息进行权值累加计算,提取最大累加值对应的主体信息,作为待识别图像的主体信息。可选的,所述获取待识别图像包括:接收图像识别请求;从所述图像识别请求中提取出待识别图像。可选的,所述根据图像相似度查找与其相似的N张其他图像包括:通过图片相似特征建成倒排索引,然后将待识别的图像去进行相似检索,获取与其相似的N张其他图像。可选的,通过以下方式获取其他图像对应的主体信息:获取图像及其标注信息;利用训练数据获取所述图像标注信息的支持信息列表;从所述支持信息列表中提取所述图像的主体信息。可选的,所述利用训练数据获取图像标注信息的支持信息列表包括:获取所述图像标注信息的中间数据;从图像数据库中提取与所述中间数据相关的训练数据;计算所述训练数据与所述中间数据的第一相关性分值;利用所述第一相关性分值生成所述图像标注信息的支持信息列表。可选的,所述计算训练数据与所述中间数据的相关性分值包括:计算训练数据与所述中间数据的相关性权值并求和E1;将所有训练数据与所述中间数据的相关性权值进行累加处理并求和E2;通过计算所述E2与所述E1的比值确定该训练数据与所述中间数据的第一相关性分值。可选的,该方法还包括:在确定训练数据与中间数据的第一相关性分值之后进行所述训练数据的去噪处理。可选的,所述进行训练数据的去噪处理包括:计算与任一训练数据相同步长的其他训练数据与所有训练数据的相关性权值,将该相关性权值进行累加处理并求和后确定该任一训练数据的噪声权值F1;将所有训练数据的噪声进行累加处理并求和后确定所有训练数据的总噪声权值F2;通过获取所述第一相关性分值与所述训练数据的噪声值之差确定所述训练数据与所述中间数据的第二相关性分值;其中,所述F1与所述F2的比值为所述训练数据的噪声值。可选的,所述从支持信息列表中提取所述图像的主体信息包括:获取所述图像标注信息的所有中间数据及其相关训练数据;通过统计相同训练数据在所述支持信息列表中的分值计算每个中间数据的得分;判断所述每个中间数据的得分与预设阈值的大小,当一中间数据的得分不小于所述预设阈值,则确定该中间数据为所述图像的主体信息。根据本专利技术的另一方面,提供了一种图像识别的装置,包括:查找单元,用于获取待识别图像,并根据图像相似度查找与其相似的N张其他图像;排序单元,用于获取所述查找单元查找到的其他图像对应的主体信息以及根据相似度排序确定每张其他图像的权值,计算单元,用于根据各主体信息及对应图像的权值,分别对各主体信息进行权值累加计算,识别单元,用于提取最大累加值对应的主体信息,作为待识别图像的主体信息。可选的,所述查找单元包括:接收图像识别请求的接收模块,及从所述接收模块接收到的图像识别请求中提取出待识别图像的提取模块。可选的,所述查找单元包括:索引模块,用于通过图片相似特征建成倒排索引;比较模块,将待识别的图像去进行相似检索,获取与其相似的N张其他图像。可选的,所述排序单元包括:获取单元,用于获取图像及其标注信息;生成单元,用于利用训练数据获取所述图像标注信息的支持信息列表;提取单元,用于从所述支持信息列表中提取所述图像的主体信息。可选的,所述生成单元包括:第一处理模块,用于获取所述获取单元获取到的图像标注信息的中间数据;第二处理模块,用于从图像数据库中提取与所述中间数据相关的训练数据;第三处理模块,用于计算所述训练数据与所述中间数据的第一相关性分值;第四处理模块,用于利用所述第一相关性分值生成所述图像标注信息的支持信息列表。可选的,所述第三处理模块包括:第一计算器,用于计算训练数据与所述中间数据的相关性权值并求和E1;第二计算器,用于将所有训练数据与所述中间数据的相关性权值进行累加处理并求和E2;第三计算器,用于通过计算所述E2与所述E1的比值确定该训练数据与所述中间数据的第一相关性分值。可选的,该装置还包括:去噪单元,用于所述第三处理模块确定所述第一相关性分值之后进行所述训练数据的去噪处理。可选的,所述去噪单元包括:第四计算器,用于计算与任一训练数据相同步长的其他训练数据与所有训练数据的相关性权值,将该相关性权值进行累加处理并求和后确定该任一训练数据的噪声权值F1;第五计算器,用于将所有训练数据的噪声进行累加处理并求和后确定所有训练数据的总噪声权值F2;第六计算器,用于通过获取所述第一相关性分值与所述训练数据的噪声值之差确定所述训练数据与所述中间数据的第二相关性分值;其中,所述F1与所述F2的比值为所述训练数据的噪声值。可选的,所述提取单元包括:第五处理模块,用于获取所述图像标注信息的所有中间数据及其相关训练数据;第六处理模块,用于通过统计相同训练数据在所述支持信息列表中的分值计算每个中间数据的得分;第七处理模块,用于判断所述每个中间数据的得分与预设阈值的大小,当一中间数据的得分不小于所述预设阈值,则确定该中间数据为所述图像的主体信息。本专利技术实施例通过获取待识别图像并根据图像相似度查找与其相似的N张其他图像,然后再获取其他图像对应的主体信息以及根据相似度排序确定每张其他图像的权值,根据各主体信息及对应图像的权值,分别对各主体信息进行权值累加计算,提取最大累加值对应的主体信息,作为待识别图像的主体信息;从而可以相对准确的搜索出未知图像的准确描述信息,进而在海量图像数据存在网络环境下,能够为用户提供未知图像搜索的准确结果,有效提高了图像数据处理的效率。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相本文档来自技高网...
一种图像识别方法和装置

【技术保护点】
一种图像识别的方法,包括:获取待识别图像,根据图像相似度查找与其相似的N张其他图像;获取其他图像对应的主体信息以及根据相似度排序确定每张其他图像的权值,根据各主体信息及对应图像的权值,分别对各主体信息进行权值累加计算,提取最大累加值对应的主体信息,作为待识别图像的主体信息。

【技术特征摘要】
1.一种图像识别的方法,包括:获取待识别图像,根据图像相似度查找与其相似的N张其他图像;获取其他图像对应的主体信息以及根据相似度排序确定每张其他图像的权值,根据各主体信息及对应图像的权值,分别对各主体信息进行权值累加计算,提取最大累加值对应的主体信息,作为待识别图像的主体信息;其中,通过以下方式获取其他图像对应的主体信息:获取图像及其标注信息;利用训练数据获取所述图像标注信息的支持信息列表;从所述支持信息列表中提取所述图像的主体信息;所述利用训练数据获取图像标注信息的支持信息列表包括:获取所述图像标注信息的中间数据;从图像数据库中提取与所述中间数据相关的训练数据;计算所述训练数据与所述中间数据的第一相关性分值;利用所述第一相关性分值生成所述图像标注信息的支持信息列表。2.如权利要求1所述的方法,其特征在于,所述获取待识别图像包括:接收图像识别请求;从所述图像识别请求中提取出待识别图像。3.如权利要求1或2所述的方法,其特征在于,所述根据图像相似度查找与其相似的N张其他图像包括:通过图片相似特征建成倒排索引,然后将待识别的图像去进行相似检索,获取与其相似的N张其他图像。4.如权利要求1所述的方法,其特征在于,所述计算训练数据与所述中间数据的相关性分值包括:计算训练数据与所述中间数据的相关性权值并求和E1;将所有训练数据与所述中间数据的相关性权值进行累加处理并求和E2;通过计算所述E2与所述E1的比值确定该训练数据与所述中间数据的第一相关性分值。5.如权利要求4所述的方法,还包括:在确定训练数据与中间数据的第一相关性分值之后进行所述训练数据的去噪处理。6.如权利要求5所述的方法,所述进行训练数据的去噪处理包括:计算与任一训练数据相同步长的其他训练数据与所有训练数据的相关性权值,将该相关性权值进行累加处理并求和后确定该任一训练数据的噪声权值F1;将所有训练数据的噪声进行累加处理并求和后确定所有训练数据的总噪声权值F2;通过获取所述第一相关性分值与所述训练数据的噪声值之差确定所述训练数据与所述中间数据的第二相关性分值;其中,所述F1与所述F2的比值为所述训练数据的噪声值。7.如权利要求1所述的方法,其特征在于,所述从支持信息列表中提取所述图像的主体信息包括:获取所述图像标注信息的所有中间数据及其相关训练数据;通过统计相同训练数据在所述支持信息列表中的分值计算每个中间数据的得分;判断所述每个中间数据的得分与预设阈值的大小,当一中间数据的得分不小于所述预设阈值,则确定该中间数据为所述图像的主体信息。8.一种图像识别的装置,包括:查找单元,用于获取待识别图像,并根据图像相似度查找与其相似的N张其他图像;排序单元,用于...

【专利技术属性】
技术研发人员:陶哲薛红霞
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1