一种商品代表图的选取方法和系统技术方案

技术编号:8682741 阅读:161 留言:0更新日期:2013-05-09 02:42
本申请提供了一种商品代表图的选取方法和系统,其中,所述方法包括:提取商品图像集合中各商品图像的局部特征;根据所述各商品图像的局部特征,计算所述商品图像集合中商品图像之间的相似度;按照所述相似度,从所述商品图像集合中选取目标商品图像子类;从所述目标商品图像子类中提取累积相似度最高的商品图像为商品代表图。本申请可以实现海量商品数据中选取商品代表图的自动化,提高商品代表图选取的效率。

【技术实现步骤摘要】

本申请涉及图像识别的
,特别是涉及一种商品代表图的选取方法和系统
技术介绍
电子商务(Electronic Commerce, EC)是指在全球各地广泛的商业贸易活动中,在因特网开放的网络环境下,基于网络通讯技术,买卖双方可不谋面地进行各种商贸活动,实现消费者的网上购物、商户之间的网上交易和在线电子支付,以及各种商务活动、交易活动、金融活动和相关的综合服务活动的一种新型的商业运营模式。电子商务涵盖的范围很广,一般可分为企业对企业(Business-to-Business,B2B)、企业对消费者(Business-to-Customer, B2C)或消费者对消费者(Customer-to-Customer, C2C)等模式。近几年来,国内电子商务迅速发展,各种B2B、C2C、B2C模式的电子商务网站(俗称购物网站),如淘宝网、当当网、卓越亚马逊、拍拍网、京东商城等,已被用户认可和接受。在电子商务网站中,图片是展现商品信息的关键方式。对于同一种商品,可能会有多张商品展示图片。尤其是在C2C模式的购物网站中,往往不同的商家可能会使用内容各异的商品展示图片来表示同一件商品。在这个商品展示图片的集合中,存在一张或多张图片,能较好地表达商品的主要信息,这种图可以称之为商品代表图。在有限的展示位内,选取合适的商品代表图来进行展现,对商家、消费者和购物网站来说都很重要。同时,从技术层面来看,选择合适的商品代表图,能去除冗余信息,是提高系统效率的有效手段。目前商品代表图的挑选主要是依靠人工选择。由于电子商务网站商品数量的高速增长,人工挑选商品代表图的方式在时间和人力成本上越来越高,以至于无法承受。因此,目前需要本领域技术人员迫切解决的一个技术问题就是:提出一种商品代表图的选取机制,用以实现海量商品数据中选取商品代表图的自动化,提高商品代表图选取的效率。
技术实现思路
本申请的目的在于,提供一种商品代表图的选取方法,用以实现海量商品数据中选取商品代表图的自动化,提高商品代表图选取的效率。相应的,本申请还提供了一种商品代表图的选取系统,用以保证上述方法在实际中的实现和应用。为了解决上述问题,本申请公开了一种商品代表图的选取方法,包括:提取商品图像集合中各商品图像的局部特征;根据所述各商品图像的局部特征,计算所述商品图像集合中商品图像之间的相似度;按照所述相似度,从所述商品图像集合中选取目标商品图像子类;从所述目标商品图像子类中提取累积相似度最闻的商品图像为商品代表图。优选的是,所述按照相似度从所述商品图像集合中选取目标商品图像子类的步骤进一步包括:当所述商品图像集合中商品图像的数量大于第一预设阈值时,按照所述相似度,对所述商品图像集合中的商品图像进行聚类,获得商品图像子类;提取商品图像数量大于第二预设阈值的商品图像子类为目标商品图像子类。优选的是,所述按照相似度从所述商品图像集合中选取目标商品图像子类的步骤进一步包括:当所述商品图像集合中商品图像的数量小于第一预设阈值时,则直接将所述商品图像集合作为目标商品图像子类。优选的是,所述经聚类获得的商品图像子类为多个,所提取的目标商品图像子类包括多个,所述的方法还包括:汇总从多个目标商品图像子类中提取的商品代表图,形成商品代表图集合。优选的是,所述的方法还包括:从所述商品代表图集合中进一步提取累积相似度最闻的商品图像作为唯一的商品代表图。优选的是,所述的方法还包括:定期对所述商品代表图进行增量更新。优选的是,所述根据各商品图像的局部特征计算商品图像集合中商品图像之间相似度的步骤包括:当所述商品图像集合中商品图像的数量小于第三预设阈值时,根据所述各商品图像的局部特征两两计算商品图像之间的相似度。优选的是,所述根据各商品图像的局部特征两两计算商品图像之间相似度的步骤进一步包括:若第一商品图像的局部特征有a个,第二商品图像的局部特征有b个,并且a < b ;则分别针对第一商品图像的某个局部特征,计算第二商品图像中与其向量距离最近的局部特征;若所述向量距离小于第四预设阈值,则判定所述第一商品图像的当前局部特征与第二商品图像中的当前局部特征为匹配的局部特征对;按预置规则滤除所述匹配的局部特征对中的错误局部特征对,获得最终匹配的局部特征对;依据所述最终匹配的局部特征对的数量计算所述第一商品图像和第二商品图像的相似度。优选的是,所述按预置规则滤除匹配的局部特征对中的错误局部特征,获得最终匹配的局部特征对的步骤进一步包括:对于第一商品图像中匹配上的局部特征,按所在的行坐标进行排序;对于第二商品图像中匹配上的局部特征,按照所述第一商品图像中对应匹配的局部特征的顺序,判断是否存在逆序的局部特征;若是,则判定所述逆序的局部特征所对应的匹配局部特征对为错误局部特征对;从所有匹配的局部特征对中滤除所述错误局部特征对,获得最终匹配的局部特征对。优选的是,所述依据最终匹配的局部特征对的数量计算所述第一商品图像和第二商品图像的相似度的步骤进一步包括:通过以下公式计算所述第一商品图像和第二商品图像的相似度:m/max (a, b);其中,m为最终匹配的局部特征对的数量,a为第一商品图像中局部特征的数量,b为第二商品图像中局部特征的数量。优选的是,所述的方法还包括:若所有商品图像子类中的商品图像数量均小于第二预设阈值,则选择商品图像数量最多的商品图像子类,作为唯一的目标商品图像子类。优选的是,所述第一预设阈值为5 10中任一值;所述第二预设阈值为5 ;所述第三预设阈值为1000 ;所述第四预设阈值为150 250中任一值。本申请实施例还公开了一种商品代表图的选取系统,包括:局部特征提取模块,用于提取商品图像集合中各商品图像的局部特征;相似度计算模块,用于根据所述各商品图像的局部特征,计算所述商品图像集合中商品图像之间的相似度;目标子类确定模块,用于按照所述相似度,从所述商品图像集合中选取目标商品图像子类;商品代表图选取模块,用于从所述目标商品图像子类中提取累积相似度最高的商品图像为商品代表图。与现有技术相比,本申请包括以下优点:本申请实施例通过在对商品代表图特性的合理假设下,基于商品图像的内容匹配,基于局部特征的图像相似度计算,自动挑选出商品代表图,从而实现了海量商品数据中选取商品代表图的自动化,提高商品代表图选取的效率。附图说明图1是本申请一种商品代表图的选取方法实施例的步骤流程图;图2是本申请一种商品代表图的选取系统实施例的结构框图。具体实施例方式为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。本申请的核心构思在于,通过在对商品代表图特性的合理假设下,基于局部特征的图像相似度计算,自动挑选出商品代表图。参照图1,其示出了本申请一种商品代表图的选取方法实施例的步骤流程图,具体可以包括如下步骤:步骤101、提取商品图像集合中各商品图像的局部特征;本申请实施例所提出的商品代表图的自动挑选方案,是基于以下两个假设:1.最典型的商品图像被使用的频率最闻;2.商品或代表商品属性的主要视觉特征,会在内容各异的商品图像中重复出现,即,关于同一商品的不同图像具有相似性。因而,在本申请实施例中,所述商品图像集合是从不同的商家使用的,表示同一件商品的,本文档来自技高网
...

【技术保护点】
一种商品代表图的选取方法,其特征在于,包括:提取商品图像集合中各商品图像的局部特征;根据所述各商品图像的局部特征,计算所述商品图像集合中商品图像之间的相似度;按照所述相似度,从所述商品图像集合中选取目标商品图像子类;从所述目标商品图像子类中提取累积相似度最高的商品图像为商品代表图。

【技术特征摘要】
1.一种商品代表图的选取方法,其特征在于,包括: 提取商品图像集合中各商品图像的局部特征; 根据所述各商品图像的局部特征,计算所述商品图像集合中商品图像之间的相似度; 按照所述相似度,从所述商品图像集合中选取目标商品图像子类; 从所述目标商品图像子类中提取累积相似度最高的商品图像为商品代表图。2.根据权利要求1所述的方法,其特征在于,所述按照相似度从所述商品图像集合中选取目标商品图像子类的步骤进一步包括: 当所述商品图像集合中商品图像的数量大于第一预设阈值时,按照所述相似度,对所述商品图像集合中的商品图像进行聚类,获得商品图像子类; 提取商品图像数量大于第二预设阈值的商品图像子类为目标商品图像子类。3.根据权利要求1所述的方法,其特征在于,所述按照相似度从所述商品图像集合中选取目标商品图像子类的步骤进一步包括: 当所述商品图像集合中商品图像的数量小于第一预设阈值时,则直接将所述商品图像集合作为目标商品图像子类。4.根据权利要求2所述的方法,其特征在于,所述经聚类获得的商品图像子类为多个,所提取的目标商品图像子类包括多个,所述的方法还包括: 汇总从多个目标商品图像子类中提取的商品代表图,形成商品代表图集合。5.根据权利要求4所述的方法,其特征在于,还包括: 从所述商品代表图集合中进一步提取累积相似度最高的商品图像作为唯一的商品代表图。6.根据权利要求1或2或3或4或5所述的方法,其特征在于,还包括: 定期对所述商品代表图进行增量更新。7.根据权利要求1或2或3或4或5或6所述的方法,其特征在于,所述根据各商品图像的局部特征计算商品图像集合中商品图像之间相似度的步骤包括: 当所述商品图像集合中商品图像的数量小于第三预设阈值时,根据所述各商品图像的局部特征两两计算商品图像之间的相似度。8.根据权利要求7所述的方法,其特征在于,所述根据各商品图像的局部特征两两计算商品图像之间相似度的步骤进一步包括: 若第一商品图像的局部特征有a个,第二商品图像的局部特征有b个,并且a < b ;则分别针对第一商品图像的某个局部特征,计算第二商品图像中与其向量距离最近的局部特征; 若所述向量距离小于第...

【专利技术属性】
技术研发人员:王从德孔祥衡
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1