一种图像识别方法及装置制造方法及图纸

技术编号:13944991 阅读:40 留言:0更新日期:2016-10-30 02:01
本发明专利技术公开了一种图像识别方法及装置,涉及图像处理技术领域。该方法包括:获取品牌与品牌特征向量的对应关系;获取待识别图像的特征向量;将所述待识别图像的特征向量和所述品牌特征向量进行匹配,将匹配度最高的品牌特征向量对应的品牌作为结果输出。本发明专利技术不需要文本信息,通过图像就可以识别商品的品牌,在文本中不包含品牌的情况下,也可以识别出商品的品牌。

【技术实现步骤摘要】

本专利技术涉及图像处理
,特别涉及一种图像识别方法及装置
技术介绍
品牌识别是购物平台数据挖掘中的基础问题。传统的思路一般专注于商品描述本身,通过文本挖掘算法找到商品描述中的品牌词。然而有一些购物平台,很多卖家并未在商品描述中填写其品牌词,只有图片和很简短的文字介绍。现有技术专注于文本领域,在一些购物平台重视图片的产品形态下,品牌识别覆盖率难以提升。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种图像识别方法及装置。本专利技术提供一种图像识别方法,包括:获取品牌与品牌特征向量的对应关系;获取待识别图像的特征向量;将所述待识别图像的特征向量和所述品牌特征向量进行匹配,将匹配度最高的品牌特征向量对应的品牌作为结果输出。在一个实施例中,所述方法还可包括:利用特征聚类算法确定图像所对应的品牌、所述图像的特征以及所述特征分别对应的权重;根据所述图像的特征和所述特征分别对应的权重组成品牌特征向量。在一个实施例中,所述根据所述图像的特征和所述特征分别对应的权重组 成品牌特征向量,可包括:确定所述品牌中每一个商品的图像的特征向量;将所述品牌中所有商品的图像的特征向量加权相加,作为品牌特征向量。在一个实施例中,将所述品牌中所有商品的图像的特征向量加权相加,作为品牌特征向量,可包括:按照下列公式确定品牌特征的权重:Weight(feature|brand)=TF(feature|brand)*IDF(feature)其中Weight(feature|brand)为品牌特征的权重,feature为特征,brand为品牌,TF(feature|brand)为所述特征的TF值,IDF(feature)为所述特征的IDF值;其中,TF值为:TF(feature|brand)=1+log(frequencyf,b)其中,frequencyf,b表示所述特征在该品牌下出现的次数;IDF值定义为: I D F ( f e a t u r e ) = l o g N n f ]]>其中,N表示商品总数,nf表示该特征在全局出现的总次数;根据品牌特征和品牌特征的权重确定品牌特征向量。本专利技术还提供一种图像识别装置,包括:第一获取模块,用于获取品牌与品牌特征向量的对应关系;第二获取模块,用于获取待识别图像的特征向量;输出模块,用于将所述待识别图像的特征向量和所述品牌特征向量进行匹配,将匹配度最高的品牌特征向量对应的品牌作为结果输出。在一个实施例中,所述装置还可包括:确定模块,用于利用特征聚类算法确定图像所对应的品牌、所述图像的特征以及所述特征分别对应的权重;组成模块,用于根据所述图像的特征和所述特征分别对应的权重组成品牌 特征向量。在一个实施例中,所述组成模块,可包括:确定子模块,用于确定所述品牌中每一个商品的图像的特征向量;组成子模块,用于将所述品牌中所有商品的图像的特征向量加权相加,作为品牌特征向量。在一个实施例中,所述组成子模块,可包括:按照下列公式确定品牌特征的权重:Weight(feature|brand)=TF(feature|brand)*IDF(feature)其中Weight(feature|brand)为品牌特征的权重,feature为特征,brand为品牌,TF(feature|brand)为所述特征的TF值,IDF(feature)为所述特征的IDF值;其中,TF值为:TF(feature|brand)=1+log(frequencyf,b)其中,frequencyf,b表示所述特征在该品牌下出现的次数;IDF值定义为: I D F ( f e a t u r e ) = l o g N n f ]]>其中,N表示商品总数,nf表示该特征在全局出现的总次数;根据品牌特征和品牌特征的权重确定品牌特征向量。本专利技术的实施例提供的技术方案可以包括以下有益效果:本专利技术实施例的上述技术方案,通过获取品牌与品牌特征向量的对应关系;获取待识别图像的特征向量;将所述待识别图像的特征向量和所述品牌特征向量进行匹配,将匹配度最高的品牌特征向量对应的品牌作为结果输出。从而不需要文本信息,通过图像就可以识别商品的品牌,在文本中不包含品牌的情况下,也可以识别出商品的品牌。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可 通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1为本专利技术实施例中一种图像识别方法的流程图;图2A为本专利技术实施例中另一种图像识别方法的流程图;图2B为原始sift特征示意图;图2C为将原始sift特征映射到128w维的示意图;图3为本专利技术实施例中一种图像识别方法中步骤S15的流程图;图4为本专利技术实施例中一种图像识别装置的框图;图5为本专利技术实施例中另一种图像识别装置的框图;图6为本专利技术实施例中一种图像识别装置中组成模块45的框图.具体实施方式以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。图1所示为本专利技术实施例中一种图像识别方法的流程图,如图1所示,包括以下步骤S11-S13:步骤S11,获取品牌与品牌特征向量的对应关系。步骤S12,获取待识别图像的特征向量。步骤S13,将待识别图像的特征向量和品牌特征向量进行匹配,将匹配度最高的品牌特征向量对应的品牌作为结果输出。在步骤S11之前,先获取一定的数据进行训练,这些数据可以从商品的图 像以及商品的描述信息都很完备的购物平台获取。比如某一惠氏品牌的商品,商品属性页中有对应的品牌信息,品牌:Wyeth/惠氏。利用图像特征提取技术,可以将图像的特征与品牌进行对应。利用大量的训练数据,可以知道每一个品牌所对应的图像特征以及其权重,利用这些特征可以组成特征向量,本专利技术利用特征聚类技术,每一个品牌均可以得到一个128w维的特征向量。利用上述步骤提取的品牌和品牌特征向量,可以对商品进行品牌预测:首先提取商品对应的图像的特征并且组成特征向量,再和品牌特征向量进行匹配,匹配度最高的品牌作为预测结果输出。本专利技术利用大量的数据进行训练,然后进行品牌匹配,最后把匹配最大值作为品牌预测值输出。从而不需要文本信息,通过图像就可以识别商品的品牌,在文本中不包含品牌的情况下,也可以识别出商品的品牌。在一个实施例中,如图2A所示,上述方法还本文档来自技高网...

【技术保护点】
一种图像识别方法,其特征在于,包括:获取品牌与品牌特征向量的对应关系;获取待识别图像的特征向量;将所述待识别图像的特征向量和所述品牌特征向量进行匹配,将匹配度最高的品牌特征向量对应的品牌作为结果输出。

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:获取品牌与品牌特征向量的对应关系;获取待识别图像的特征向量;将所述待识别图像的特征向量和所述品牌特征向量进行匹配,将匹配度最高的品牌特征向量对应的品牌作为结果输出。2.如权利要求1所述的方法,其特征在于,所述方法还包括:利用特征聚类算法确定图像所对应的品牌、所述图像的特征以及所述特征分别对应的权重;根据所述图像的特征和所述特征分别对应的权重组成品牌特征向量。3.如权利要求2所述的方法,其特征在于,所述根据所述图像的特征和所述特征分别对应的权重组成品牌特征向量,包括:确定所述品牌中每一个商品的图像的特征向量;将所述品牌中所有商品的图像的特征向量加权相加,作为品牌特征向量。4.如权利要求3所述的方法,其特征在于,所述将所述品牌中所有商品的图像的特征向量加权相加,作为品牌特征向量,包括:按照下列公式确定品牌特征的权重:Weight(feature|brand)=TF(feature|brand)*IDF(feature)其中Weight(feature|brand)为品牌特征的权重,feature为特征,brand为品牌,TF(feature|brand)为所述特征的TF值,IDF(feature)为所述特征的IDF值;其中,TF值为:TF(feature|brand)=1+log(frequencyf,b)其中,frequencyf,b表示所述特征在该品牌下出现的次数;IDF值定义为:其中,N表示商品总数,nf表示该特征在全局出现的总次数;根据品牌特征和品牌特征的权重确定品牌特征向量。5....

【专利技术属性】
技术研发人员:高云翔孟蕊
申请(专利权)人:无线生活杭州信息科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1