物品相似度检测方法和装置、电子设备及存储介质制造方法及图纸

技术编号:38944960 阅读:18 留言:0更新日期:2023-09-25 09:41
本申请提供了一种物品相似度检测方法和装置、电子设备及存储介质,属于金融科技技术领域。包括:获取目标物品对的物品对数据,物品对数据包括第一物品的第一文本数据和第一图像数据、第二物品的第二文本数据和第二图像数据;基于图像编码网络对第一图像数据、第二图像数据进行图像编码,得到第一物品图像特征向量、第二物品图像特征向量;基于文本编码网络对第一文本数据、第一物品图像特征向量、第二文本数据和第二物品图像特征向量进行文本编码,得到第一物品特征向量、第二物品特征向量;基于物品对检测网络、第一物品特征向量、第二物品特征向量检测第一物品和第二物品的物品相似程度,得到检测数据。本申请能够提高物品相似检测的准确性。相似检测的准确性。相似检测的准确性。

【技术实现步骤摘要】
物品相似度检测方法和装置、电子设备及存储介质


[0001]本申请涉及金融科技
,尤其涉及一种物品相似度检测方法和装置、电子设备及存储介质。

技术介绍

[0002]随着互联网的快速发展和电子商务的不断兴起,网络购物逐渐已经成为人们生活中不可或缺的一部分。目前,购物网站上商品的数量每天都在急剧增长,商家对商品通过添加文字描述的这种人工标注方式对商品进行分类,耗费大量的人力物力,显然不能满足日益蓬勃发展的电子商务的发展的要求。
[0003]例如,在保险营销平台中,保险产品的险种、期限、购买条件都存在着异同。为了更好地进行保险推荐,保险营销平台常常倾向于能够将符合当前购买对象的所有同类保险产品一起展示给购买对象进行选择。但在此之前,保险营销平台需要尽可能地将同类保险产品进行标记,否则容易在保险推荐时遗漏部分保险产品,无法做到将所有同类保险产品一起展示给对象。
[0004]目前,在检测两个物品是否为同类物品时,大多数的检测方法常常是将两个物品的物品类目信息、物品属性信息等进行比对,这一方式往往会造成比对信息具有一定的局限性,且实际生活中常常存在不同品类的物品的物品类目信息和物品属性信息较为相似,会对物品相似度检测造成干扰,使得物品相似度检测的准确性较差。

技术实现思路

[0005]本申请实施例的主要目的在于提出一种物品相似度检测方法和装置、电子设备及存储介质,旨在提高物品相似度检测的准确性。
[0006]为实现上述目的,本申请实施例的第一方面提出了一种物品相似度检测方法,所述方法包括:
[0007]获取目标物品对的物品对数据,其中,所述目标物品对包括第一物品和第二物品,所述物品对数据包括所述第一物品的第一文本数据和第一图像数据,所述物品对数据还包括所述第二物品的第二文本数据和第二图像数据;
[0008]将所述物品对数据输入到预设的物品对检测模型中,其中,所述物品对检测模型包括图像编码网络、文本编码网络以及物品对检测网络;
[0009]基于所述图像编码网络对所述第一图像数据进行图像编码,得到第一物品图像特征向量,并基于所述图像编码网络对所述第二图像数据进行图像编码,得到第二物品图像特征向量;
[0010]基于所述文本编码网络对所述第一文本数据和所述第一物品图像特征向量进行文本编码,得到第一物品特征向量,并基于所述文本编码网络对所述第二文本数据和所述第二物品图像特征向量进行文本编码,得到第二物品特征向量;
[0011]基于所述物品对检测网络对所述第一物品特征向量、所述第二物品特征向量进行
相似度计算,得到物品相似评分数据;
[0012]根据所述物品相似评分数据检测所述第一物品和所述第二物品之间的物品相似程度,得到检测数据。
[0013]在一些实施例,所述基于所述图像编码网络对所述第一图像数据进行图像编码,得到第一物品图像特征向量,并基于所述图像编码网络对所述第二图像数据进行图像编码,得到第二物品图像特征向量,包括:
[0014]对所述第一图像数据进行卷积处理,得到第一物品图像卷积特征,并对所述第二图像数据进行卷积处理,得到第二物品图像卷积特征;
[0015]对所述第一物品图像卷积特征进行池化处理,得到第一物品图像池化特征,并对所述第二物品图像卷积特征进行池化处理,得到第二物品图像池化特征;
[0016]对所述第一物品图像池化特征进行线性变换,得到所述第一物品图像特征向量,并对所述第二物品图像池化特征进行线性变换,得到所述第二物品图像特征向量。
[0017]在一些实施例,所述基于所述文本编码网络对所述第一文本数据和所述第一物品图像特征向量进行文本编码,得到第一物品特征向量,并基于所述文本编码网络对所述第二文本数据和所述第二物品图像特征向量进行文本编码,得到第二物品特征向量,包括:
[0018]对所述第一文本数据进行字符映射,得到第一文本字向量,并对所述第一文本字向量和所述第一物品图像特征向量进行拼接,得到第一物品拼接向量;
[0019]基于所述文本编码网络对所述第一物品拼接向量进行文本编码,得到所述第一物品特征向量;
[0020]对所述第二文本数据进行字符映射,得到第二文本字向量,并对所述第二文本字向量和所述第二物品图像特征向量进行拼接,得到第二物品拼接向量;
[0021]基于所述文本编码网络对所述第二物品拼接向量进行文本编码,得到所述第二物品特征向量。
[0022]在一些实施例,所述根据所述物品相似评分数据检测所述第一物品和所述第二物品之间的物品相似程度,得到检测数据,包括:
[0023]比对所述物品相似评分数据和预设的分数阈值;
[0024]若所述物品相似评分数据大于所述分数阈值,则将所述检测数据确定为所述第一物品和所述第二物品是同类物品;
[0025]若所述物品相似评分数据不大于所述分数阈值,则将所述检测数据确定为所述第一物品和所述第二物品不是同类物品。
[0026]在一些实施例,所述基于所述物品对检测网络对所述第一物品特征向量、所述第二物品特征向量进行相似度计算,得到物品相似评分数据,包括:
[0027]基于所述物品对检测网络对所述第一物品特征向量、所述第二物品特征向量进行相似度计算,得到初步评分数据;
[0028]根据预设的调整数据对所述初步评分数据进行评分调整,得到中间评分数据;
[0029]对所述中间评分数据进行加权和运算,得到所述物品相似评分数据。
[0030]在一些实施例,所述获取目标物品对的物品对数据,包括:
[0031]获取所述第一物品的第一物品图像和第一物品文本、所述第二物品的第二物品图像和第二物品文本,其中,所述第一物品文本包括所述第一物品的第一物品标题、第一物品
类目以及第一物品属性,所述第二物品文本包括所述第二物品的第二物品标题、第二物品类目以及第二物品属性;
[0032]对所述第一物品图像进行图像裁剪,得到所述第一图像数据,并对所述第二物品图像进行图像裁剪,得到所述第二图像数据,其中,所述第一图像数据为包含第一物品的最小矩形图像,所述第二图像数据为包含第二物品的最小矩形图像;
[0033]根据预设的拼接顺序对所述第一物品标题、所述第一物品类目以及所述第一物品属性进行拼接,得到所述第一文本数据,并根据所述拼接顺序对所述第二物品标题、所述第二物品类目以及所述第二物品属性进行拼接,得到所述第二文本数据;
[0034]根据第一图像数据、所述第二图像数据、所述第一文本数据以及所述第二文本数据,得到所述物品对数据。
[0035]在一些实施例,在所述将所述物品对数据输入到预设的物品对检测模型中之前,所述方法还包括预先训练所述物品对检测模型,具体包括:
[0036]获取训练数据,其中,所述训练数据包括数据内容均不相同的第一样本数据、第二样本数据以及第三样本数据;
[0037]基于所述第一样本数据对预设的神经网络模型进行第一模型训练,得到初步检测本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种物品相似度检测方法,其特征在于,所述方法包括:获取目标物品对的物品对数据,其中,所述目标物品对包括第一物品和第二物品,所述物品对数据包括所述第一物品的第一文本数据和第一图像数据,所述物品对数据还包括所述第二物品的第二文本数据和第二图像数据;将所述物品对数据输入到预设的物品对检测模型中,其中,所述物品对检测模型包括图像编码网络、文本编码网络以及物品对检测网络;基于所述图像编码网络对所述第一图像数据进行图像编码,得到第一物品图像特征向量,并基于所述图像编码网络对所述第二图像数据进行图像编码,得到第二物品图像特征向量;基于所述文本编码网络对所述第一文本数据和所述第一物品图像特征向量进行文本编码,得到第一物品特征向量,并基于所述文本编码网络对所述第二文本数据和所述第二物品图像特征向量进行文本编码,得到第二物品特征向量;基于所述物品对检测网络对所述第一物品特征向量、所述第二物品特征向量进行相似度计算,得到物品相似评分数据;根据所述物品相似评分数据检测所述物品第一物品和所述第二物品之间的物品相似程度,得到检测数据。2.根据权利要求1所述的物品相似度检测方法,其特征在于,所述基于所述图像编码网络对所述第一图像数据进行图像编码,得到第一物品图像特征向量,并基于所述图像编码网络对所述第二图像数据进行图像编码,得到第二物品图像特征向量,包括:对所述第一图像数据进行卷积处理,得到第一物品图像卷积特征,并对所述第二图像数据进行卷积处理,得到第二物品图像卷积特征;对所述第一物品图像卷积特征进行池化处理,得到第一物品图像池化特征,并对所述第二物品图像卷积特征进行池化处理,得到第二物品图像池化特征;对所述第一物品图像池化特征进行线性变换,得到所述第一物品图像特征向量,并对所述第二物品图像池化特征进行线性变换,得到所述第二物品图像特征向量。3.根据权利要求1所述的物品相似度检测方法,其特征在于,所述基于所述文本编码网络对所述第一文本数据和所述第一物品图像特征向量进行文本编码,得到第一物品特征向量,并基于所述文本编码网络对所述第二文本数据和所述第二物品图像特征向量进行文本编码,得到第二物品特征向量,包括:对所述第一文本数据进行字符映射,得到第一文本字向量,并对所述第一文本字向量和所述第一物品图像特征向量进行拼接,得到第一物品拼接向量;基于所述文本编码网络对所述第一物品拼接向量进行文本编码,得到所述第一物品特征向量;对所述第二文本数据进行字符映射,得到第二文本字向量,并对所述第二文本字向量和所述第二物品图像特征向量进行拼接,得到第二物品拼接向量;基于所述文本编码网络对所述第二物品拼接向量进行文本编码,得到所述第二物品特征向量。4.根据权利要求1所述的物品相似度检测方法,其特征在于,所述根据所述物品相似评分数据检测所述物品第一物品和所述第二物品之间的物品相似程度,得到检测数据,包括:
比对所述物品相似评分数据和预设的分数阈值;若所述物品相似评分数据大于所述分数阈值,则将所述检测数据确定为所述第一物品和所述第二物品是同类物品;若所述物品相似评分数据不大于所述分数阈值,则将所述检测数据确定为所述第一物品和所述第二物品不是同类物品。5.根据权利要求1所述的物品相似度检测方法,其特征在于,所述基于所述物品对检测网络对所述第一物品特征向量、所述第二物品特征向量进行相似度计算,得到物品相似评分数据,包括:基于所述物品对检测网络对所述第一物品特征向量、所述第二物品特征向量进行相似度...

【专利技术属性】
技术研发人员:孙泽烨
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1