对象匹配方法、装置和服务平台制造方法及图纸

技术编号:26689835 阅读:18 留言:0更新日期:2020-12-12 02:39
本公开提出一种对象匹配方法、装置和服务平台,涉及数据处理技术领域。本公开的一种对象匹配方法,包括:获取第一对象的图片和预定维度的特征信息;根据第一对象的图片和待选对象的图片,获取候选对象集合,并获取候选对象集合中的对象与第一对象的图片相似度信息;根据第一对象的预定维度的特征信息和候选对象集合中对象的预定维度的特征信息,获取候选对象集合中的对象与第一对象的预定维度的相似度信息;根据图片相似度信息和预定维度的相似度信息,基于机器学习模型在候选对象集合中确定一个或多个第二对象。通过这样的方法,能够使对象的匹配不受编码的限制,提高了对象匹配的全面性。

【技术实现步骤摘要】
对象匹配方法、装置和服务平台
本公开涉及数据处理
,特别是一种对象匹配方法、装置和服务平台。
技术介绍
随着线上购物平台的丰富化、渠道的多样化发展,不同的商家可能会在同一平台上线同一物品。同一物品的产品本身参数可以相同或相似,同时也会存在某些不同之处,如价格、服务等。相关技术中往往需要利用物品独一无二的物品编码,通过编码匹配的方式实现相同物品的识别。
技术实现思路
本公开的一个目的在于提高对象匹配的全面性。根据本公开的一些实施例的一个方面,提出一种对象匹配方法,包括:获取第一对象的图片和预定维度的特征信息;根据的图片和待选对象的图片,获取候选对象集合,并获取候选对象集合中的对象与第一对象的图片相似度信息;根据第一对象的预定维度的特征信息和候选对象集合中对象的预定维度的特征信息,获取候选对象集合中的对象与第一对象的预定维度的相似度信息;根据图片相似度信息和预定维度的相似度信息,基于机器学习模型在候选对象集合中确定一个或多个第二对象。在一些实施例中,预定维度包括对象的标题、对象的价格、对象归属的类目、或对象属性中的一项或多项,其中,对象属性包括对象产地、编码、尺寸、重量、保质期或颜色中的一项或多项。在一些实施例中,根据第一对象的图片和待选对象的图片,获取候选对象集合,并获取候选对象集合中的对象与第一对象的图片相似度信息包括:从第一对象的图片中获取非混乱背景的第一对象图片;确定待选对象的图片与非混乱背景的第一对象图片的相似度;获取待选对象中,对象的图片与非混乱背景的第一对象图片的相似度超过预定相似度阈值的对象,形成候选对象集合;将候选对象集合中的对象的图片与非混乱背景的第一对象图片的相似度,作为对应对象与第一对象的图片相似度信息。在一些实施例中,从第一对象的图片中获取非混乱背景的第一对象图片包括:在第一对象的图片中识别并丢弃纯色图片;在剩余的图片中识别白色背景色的图片;在剩余的图片中识别单张图片内不同位置的背景色的灰度值差值在预定灰度差阈值范围内的图片;将背景色的灰度值的差值在预定灰度差阈值范围内的图片和白色背景色的图片,作为非混乱背景的第一对象图片。在一些实施例中,预定维度的相似度信息中包括预定维度中每个维度的相似度信息,根据第一对象的预定维度的特征信息和候选对象集合中对象的预定维度的特征信息,获取候选对象集合中对象与第一对象的预定维度的相似度信息包括:针对预定维度中的每个维度,获取第一对象的特征信息和候选对象集合中对象的对应维度的特征信息;根据对应维度的预定相似度运算策略,确定对应维度的相似度信息。在一些实施例中,根据对应维度的预定相似度运算策略,确定对应维度的相似度信息包括以下一项或多项:在对应维度为对象标题的情况下,获取第一对象与候选对象集合中对象的对象标题的文本相似度信息,作为对象标题的相似度信息;在对应维度为对象价格的情况下,获取第一对象与候选对象集合中对象的价格差的绝对值与第一对象价格的比值,作为对象价格的相似度信息;在对应维度为类目标识的情况下,根据第一对象与候选对象集合中对象的类目编码的是否相同确定类目标识的相似度信息;或在对应维度为对象属性的情况下,根据第一对象与候选对象集合中对象的对象属性是否相同确定对象属性的相似度信息。在一些实施例中,基于机器学习模型在候选对象集合中确定第二对象包括:将图片相似度信息和预定维度的相似度信息输入多个机器学习模型,其中,机器学习模型的数量不小于3;获取每个机器学习模型针对候选对象集合中对象是否与第一对象相同的单模型判断结果;在单模型判断结果为对象与第一对象相同的单模型判断结果的数量大于预定判断阈值的情况下,确定判断结果为当前对象为与第一对象相同,作为第二对象;根据候选对象集合中每个对象的判断结果,确定一个或多个第二对象。在一些实施例中,机器学习模型包括LR(LogisticRegression,逻辑回归)模型、GBDT(GradientBoostingDecisionTree,梯度提升迭代决策树)模型、XGBoost(eXtremeGradientBoosting,极端梯度提升)模型、SVM(SupportVectorMachine,支持向量机)、随机森林或强分类器Adaboost(AdaptiveBoosting,自适应增强)中的多种。在一些实施例中,机器学习模型为根据相同对象的图片相似度信息和相同对象的预定维度的相似度信息训练生成。在一些实施例中,对象匹配方法还包括以下至少一项:根据第二对象的信息补充第一对象的信息;根据第二对象的价格限定第一对象的许可价格范围;或向用户推送第二对象。通过这样的方法,能够先基于图片得到第一对象的候选的相同的对象集合,进而得到候选对象与第一对象在各个维度的相似度,通过机器学习模型确定相同的对象,从而使第二对象的匹配不受单一编码的限制,提高了对象匹配的全面性。根据本公开的另一些实施例的一个方面,提出一种对象匹配装置,包括:第一对象信息获取单元,被配置为获取第一对象的图片和预定维度的特征信息;候选集合获取单元,被配置为根据第一对象的图片和待选对象的图片获取候选对象集合;相似度获取单元,被配置为获取候选对象集合中的对象与第一对象的图片相似度信息;以及根据第一对象的预定维度的特征信息和候选对象集合中对象的预定维度的特征信息,获取候选对象集合中的对象与第一对象的预定维度的相似度信息;第二对象确定单元,被配置为根据图片相似度信息和预定维度的相似度信息,基于机器学习模型在候选对象集合中确定第二对象。在一些实施例中,对象匹配装置还包括:应用单元,被配置为执行以下至少一项:根据第二对象的信息补充第一对象的信息;根据第二对象的价格限定第一对象的许可价格范围;或向用户推送第二对象。根据本公开的一些实施例的一个方面,提出一种对象匹配装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器的指令执行上文中任意一种对象匹配方法。这样的装置能够先基于图片得到第一对象的候选的相同的对象集合,进而得到候选对象与第一对象在各个维度的相似度,通过机器学习模型确定第二对象,从而使第二对象的匹配不受单一的编码的限制,提高了对象匹配的全面性。根据本公开的一些实施例的一个方面,提出一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现上文中任意一种对象匹配方法的步骤。通过执行这样的存储介质上的指令,能够先基于图片得到第一对象的候选的第二对象集合,进而得到候选对象与第一对象在各个维度的相似度,通过机器学习模型确定第二对象,从而使第二对象的匹配不受单一的编码的限制,提高了对象匹配的全面性。根据本公开的一些实施例的一个方面,提出一种服务平台,包括:对象信息存储器,被配置为存储对象的图片和至少一项预定维度的特征信息;和上文中任意一种对象匹配装置。这样的服务平台能够使对象的匹配不受单一编码的限制,提高了对象匹配的全面性,从而为用户提供更加全面的第二对象,提高用户体验。附图说明<本文档来自技高网...

【技术保护点】
1.一种对象匹配方法,包括:/n获取第一对象的图片和预定维度的特征信息;/n根据所述第一对象的图片和待选对象的图片,获取候选对象集合,并获取所述候选对象集合中的对象与所述第一对象的图片相似度信息;/n根据所述第一对象的预定维度的特征信息和所述候选对象集合中对象的预定维度的特征信息,获取所述候选对象集合中的对象与所述第一对象的预定维度的相似度信息;/n根据所述图片相似度信息和所述预定维度的相似度信息,基于机器学习模型在所述候选对象集合中确定一个或多个第二对象。/n

【技术特征摘要】
1.一种对象匹配方法,包括:
获取第一对象的图片和预定维度的特征信息;
根据所述第一对象的图片和待选对象的图片,获取候选对象集合,并获取所述候选对象集合中的对象与所述第一对象的图片相似度信息;
根据所述第一对象的预定维度的特征信息和所述候选对象集合中对象的预定维度的特征信息,获取所述候选对象集合中的对象与所述第一对象的预定维度的相似度信息;
根据所述图片相似度信息和所述预定维度的相似度信息,基于机器学习模型在所述候选对象集合中确定一个或多个第二对象。


2.根据权利要求1所述的对象匹配方法,其中,
所述预定维度包括对象的标题、对象的价格、对象归属的类目、或对象属性中的一项或多项,其中,所述对象属性包括对象产地、编码、尺寸、重量、保质期或颜色中的一项或多项。


3.根据权利要求1所述的对象匹配方法,其中,所述根据所述第一对象的图片和待选对象的图片,获取候选对象集合,并获取所述候选对象集合中的对象与所述第一对象的图片相似度信息包括:
从所述第一对象的图片中获取非混乱背景的第一对象图片;
确定待选对象的图片与所述非混乱背景的第一对象图片的相似度;
获取所述待选对象中,对象的图片与所述非混乱背景的第一对象图片的相似度超过预定相似度阈值的对象,形成所述候选对象集合;
将所述候选对象集合中的对象的图片与所述非混乱背景的第一对象图片的相似度,作为对应对象与所述第一对象的图片相似度信息。


4.根据权利要求3所述的对象匹配方法,其中,所述从所述第一对象的图片中获取非混乱背景的第一对象图片包括:
在所述第一对象的图片中识别并丢弃纯色图片;
在剩余的图片中识别白色背景色的图片;
在所述剩余的图片中识别单张图片内不同位置的背景色的灰度值差值在预定灰度差阈值范围内的图片;
将所述背景色的灰度值的差值在预定灰度差阈值范围内的图片和所述白色背景色的图片,作为所述非混乱背景的第一对象图片。


5.根据权利要求1所述的对象匹配方法,其中,所述预定维度的相似度信息中包括所述预定维度中每个维度的相似度信息,所述根据所述第一对象的预定维度的特征信息和所述候选对象集合中对象的预定维度的特征信息,获取所述候选对象集合中的对象与所述第一对象的预定维度的相似度信息包括:
针对所述预定维度中的每个维度,获取所述第一对象的特征信息和所述候选对象集合中对象的对应维度的特征信息;
根据所述对应维度的预定相似度运算策略,确定所述对应维度的相似度信息。


6.根据权利要求5所述的对象匹配方法,其中,所述根据所述对应维度的预定相似度运算策略,确定所述对应维度的相似度信息包括以下一项或多项:
在所述对应维度为对象标题的情况下,获取所述第一对象与所述候选对象集合中对象的对象标题的文本相似度信息,作为对象标题的相似度信息;
在所述对应维度为对象价格的情况下,获取所述第一对象与所述候选对象集合中对象的价格差的绝对值与所述第一对象价格的比值,作为对象价格的相似度信息;
在所述对应维度为类目标识的情况下,根据所述第一对象与所述候选对象集合中对象的类目编码的是否相...

【专利技术属性】
技术研发人员:田俊文
申请(专利权)人:北京沃东天骏信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1