集成检测模型的确定方法及装置制造方法及图纸

技术编号:37961528 阅读:16 留言:0更新日期:2023-06-30 09:36
本申请公开了一种集成检测模型的确定方法及装置。方法的一具体实施方式包括:获取第一训练样本集,其中,第一训练样本集中的第一训练样本中包括多模态数据对,和表征多模态数据对中的多模态数据对应的物品是否属于同一最小存货单位的判别标签;通过第一训练样本集训练得到多个检测模型,其中,多个检测模型中的每个检测模型,用于确定所输入的多模态数据对中的多模态数据所表征的物品是否属于同一最小存货单位;基于多个检测模型,采用集成选择的方式,得到集成检测模型。本申请通过集成检测模型检测目标物品是否被变更最小存货单位,在提高了集成检测模型的检测准确度的同时,提高了集成检测模型对于各种物品的通用性。性。性。

【技术实现步骤摘要】
集成检测模型的确定方法及装置


[0001]本申请实施例涉及计算机
,具体涉及深度学习技术,尤其涉及一种集成检测模型的确定方法装置、变更最小存货单位的检测方法及装置。

技术介绍

[0002]电商平台中的商家为了更好地展示物品,提高销量,会适当地调整已上架的物品的主图、卖点等信息,在保证物品不变的情况下,这些操作是合理合规的。然而,部分商家在已有物品链接上将原物品SKU(Stock Keeping Unit,最小存货单位)更换为另一款物品进行销售,更换后的物品在类目、规格、品牌、颜色、型号、品种等属性上发生了改变,这种违规的操作也被称为变更SKU。现有技术中,一般采用大众监督结合人工排查的方式、针对于不同情形设置不同的判断条件和判定阈值的方式,确定商家是否存在违规变更SKU的行为。此类方式工作量较大,检测准确度较低。

技术实现思路

[0003]本申请实施例提出了一种集成检测模型的确定方法装置、变更最小存货单位的检测方法及装置、计算机可读介质及电子设备。
[0004]第一方面,本申请实施例提供了一种集成检测模型的确定方法本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种集成检测模型的确定方法,包括:获取第一训练样本集,其中,所述第一训练样本集中的第一训练样本中包括多模态数据对,和表征所述多模态数据对中的多模态数据对应的物品是否属于同一最小存货单位的判别标签;通过所述第一训练样本集训练得到多个检测模型,其中,所述多个检测模型中的每个检测模型,用于确定所输入的多模态数据对中的多模态数据所表征的物品是否属于同一最小存货单位;基于所述多个检测模型,采用集成选择的方式,得到集成检测模型。2.根据权利要求1所述的方法,其中,所述基于所述多个检测模型,采用集成选择的方式,得到集成检测模型,包括:在迭代选择过程中,基于所述多个检测模型各自输出的检测结果,从所述多个检测模型中选择出目标检测模型,添加至初始集成检测模型,最终得到所述集成检测模型。3.根据权利要求2所述的方法,所述在迭代选择过程中,基于所述多个检测模型各自输出的检测结果,从所述多个检测模型中选择出目标检测模型,添加至初始集成检测模型,最终得到所述集成检测模型,包括:在迭代选择过程中,基于所述多个检测模型各自输出的检测结果,从所述多个检测模型中选择出使得所述初始集成检测模型的检测结果增益最大的目标检测模型,添加至所述初始集成检测模型,并改变所述初始集成检测模型中所添加的检测模型的权重;基于所述初始集成检测模型中的多种检测模型,和所述多种检测模型各自对应的权重,得到所述集成检测模型。4.根据权利要求1所述的方法,其中,所述通过所述第一训练样本集训练得到多个检测模型,包括:对于多个检测模型中的每个检测模型对应的初始检测模型,循环执行如下训练操作,直至得到训练后的检测模型:从所述第一训练样本集中选择未经训练的目标第一训练样本;通过多模态编码器,确定所述目标第一训练样本中的多模态数据对中的多模态数据的多模态特征;利用机器学习方法,以所述多模态特征为输入,以所述目标第一训练样本中的判别标签为期望输出,训练所述初始检测模型。5.根据权利要求4所述的方法,其中,其中,所述多模态编码器包括图像子编码器、文本子编码器和多模态子编码器,以及所述通过多模态编码器,确定所述目标训练样本中的多模态数据对中的多模态数据的多模态特征,包括:通过所述图像子编码器,生成所述目标训练样本中的多模态数据对中的图像数据的图像特征;通过所述文本子编码器生成所述目标训练样本中的多模态数据对中的文本数据的文本特征;根据所述图像特征和所述文本特征,通过所述多模态子编码器生成所述多模态特征。6.根据权利要求5所述的方法,其中,所述多模态编码器通过如下方式训练得到:
获取第二训练样本集,其中,所述第二训练样本集中的第二训练样本包括多模态数据和所述多模态数据中的每种模态的数据所表征的物品的分类标签;采用机器学习方法,以所述第二训练样本中的图像数据和对应于所述图像数据的图像分类标记为输入,以所输入的图像数据对应的分类标签为所述图像分类标记对应的期望输出,并输出所输入的图像数据的图像特征,训练得到所述图像子编码器;采用机器学习方法,以所述第二训练样本中的文本数据和对应于所述文本数据的文本分类标记为输入,以所输入的文本数据对应的分类标签为所述文本分类标记对应的期望输出,并输出所输入的文本数据的文本特征,训练得到所述文本子编码器;采用对比学习方法,以所述第二训练样本集中的同一第二训练样本对应的所述图像分类信息、所述图像特征、所述文本分类信息、所述文本特征为输入,训练得到所述多模态子编码器。7.根据权利要求6所述的方法,其中,所...

【专利技术属性】
技术研发人员:胡磊田俊文孔滕滕
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1