相似度的确定方法、装置、电子设备和存储介质制造方法及图纸

技术编号:28422098 阅读:18 留言:0更新日期:2021-05-11 18:29
本发明专利技术公开了相似度的确定方法、装置、电子设备和存储介质,涉及计算机技术领域。该方法的一具体实施方式包括:对于每个物品组,根据物品组中多个物品的属性信息确定对应物品组的向量构建参数,并根据多个物品的属性信息构建多个物品的特征向量;根据目标物品的类型,确定目标物品所属的目标物品组;基于目标物品的属性信息和目标物品组对应的向量构建参数,构建目标物品的特征向量;根据目标物品的特征向量、目标物品组中多个物品的特征向量,以及目标物品组对应的相似度模型,分别确定目标物品组中多个物品与目标物品的相似度。该实施方式能够避免相似度计算过程会耗费较长的时间,计算结果不能及时得出,时效性差的问题。

【技术实现步骤摘要】
相似度的确定方法、装置、电子设备和存储介质
本专利技术涉及计算机
,尤其涉及一种相似度的确定方法、装置、电子设备和存储介质。
技术介绍
在零售业务中,为了对一些物品店特性进行分析,通常需要确定物品之间的相似性,以便于基于相似性较高的物品进行结合分析,例如对目标物品的销量进行预测。目前,物品之间相似度可以通过机器学习算法训练模型计算,具体为:抓取批量待确定相似度的物品的相关信息,然后结合作为训练数据的物品的相关信息来构建特征向量,再基于构建的特征向量进行模型训练和相似度计算。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:通过机器学习算法进行相似模型训练和相似度计算所使用的数据量较大,同时待确定相似度的物品和作为训练数据的物品之间构建特征向量时相互耦合,需要相互结合构建特征向量,导致模型训练和相似度计算的过程耦合在一起,所以相似度计算过程会耗费较长的时间,计算结果不能及时得出,时效性差。
技术实现思路
有鉴于此,本专利技术实施例提供一种相似度的确定方法、装置、系统和存储介质,能够避免相似度计算过程会耗费较长的时间,计算结果不能及时得出,时效性差的问题。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种相似度的确定方法。本专利技术实施例的一种相似度的确定方法包括:对于每个物品组,根据所述物品组中多个物品的属性信息确定对应所述物品组的向量构建参数,并根据所述多个物品的属性信息和所述物品组对应的向量构建参数,分别构建所述多个物品的特征向量;根据目标物品的类型,确定所述目标物品所属的目标物品组;基于所述目标物品的属性信息和所述目标物品组对应的向量构建参数,构建所述目标物品的特征向量;根据所述目标物品的特征向量、所述目标物品组中多个物品的特征向量,以及所述目标物品组对应的相似度模型,分别确定所述目标物品组中多个物品与所述目标物品的相似度。在一个实施例中,所述根据所述物品组中多个物品的属性信息确定对应所述物品组的向量构建参数,包括:根据目标特征,从所述物品组中多个物品的属性信息中,确定对应所述物品组的向量构建参数,所述向量构建参数包括与所述目标特征关联的向量构建词库和/或目标特征取值区间。在又一个实施例中,若所述向量构建参数包括所述向量构建词库,则所述根据目标特征,从所述物品组中多个物品的属性信息中,确定对应所述物品组的向量构建参数,包括:对所述多个物品的属性信息分词,确定多个向量构建词;根据所述多个物品的目标特征,确定每个所述向量构建词与所述目标特征之间的关联度;从所述多个向量构建词中,筛选出所述关联度大于阈值的向量构建词,作为所述向量构建词库。在又一个实施例中,所述向量构建参数包括目标特征取值区间,则所述根据目标特征,从所述物品组中多个物品的属性信息中,确定对应所述物品组的向量构建参数,包括:根据所述物品组中多个物品的属性信息,确定所述物品组中多个物品的目标特征值;根据所述物品组中多个物品的目标特征值,确定对应所述物品组的目标特征取值区间。在又一个实施例中,所述根据所述目标物品的特征向量、所述目标物品组中多个物品的特征向量,以及所述目标物品组对应的相似度模型,分别确定所述目标物品组中多个物品与所述目标物品的相似度之前,还包括:根据所述目标物品组中多个物品的目标特征,为所述目标物品组中多个物品的特征向量添加标签;根据添加标签后所述目标物品组中多个物品的特征向量,训练预设相似度计算模型,得到所述目标组对应的相似度计算模型。在又一个实施例中,所述根据所述目标物品的特征向量、所述目标物品组中多个物品的特征向量,以及所述目标物品组对应的相似度模型,分别确定所述目标物品组中多个物品与所述目标物品的相似度之后,包括:根据所述目标物品组中多个物品与所述目标物品的相似度,确定与所述待预测新品相似度最大的预设数目个相似物品;根据所述相似物品分别与所述目标物品的相似度,确定每个所述相似物品与所述目标物品的相似占比;根据所述相似物品的目标特征值和所述相似占比,确定所述目标物品的目标特征值。为实现上述目的,根据本专利技术的另一方面,提供了一种相似度的确定装置。本专利技术的一种相似度的确定装置包括:确定单元,用于对于每个物品组,根据所述物品组中多个物品的属性信息确定对应所述物品组的向量构建参数,并根据所述多个物品的属性信息和所述物品组对应的向量构建参数,分别构建所述多个物品的特征向量;所述确定单元,还用于根据目标物品的类型,确定所述目标物品所属的目标物品组;构建单元,用于基于所述目标物品的属性信息和所述目标物品组对应的向量构建参数,构建所述目标物品的特征向量;所述确定单元,还用于根据所述目标物品的特征向量、所述目标物品组中多个物品的特征向量,以及所述目标物品组对应的相似度模型,分别确定所述目标物品组中多个物品与所述目标物品的相似度。在一个实施例中,所述确定单元,具体于根据目标特征,从所述物品组中多个物品的属性信息中,确定对应所述物品组的向量构建参数,所述向量构建参数包括与所述目标特征关联的向量构建词库和/或目标特征取值区间。在又一个实施例中,若所述向量构建参数包括所述向量构建词库,则所述确定单元,具体于:对所述多个物品的属性信息分词,确定多个向量构建词;根据所述多个物品的目标特征,确定每个所述向量构建词与所述目标特征之间的关联度;从所述多个向量构建词中,筛选出所述关联度大于阈值的向量构建词,作为所述向量构建词库。在又一个实施例中,若所述向量构建参数包括目标特征取值区间,则所述确定单元,具体于:根据所述物品组中多个物品的属性信息,确定所述物品组中多个物品的目标特征值;根据所述物品组中多个物品的目标特征值,确定对应所述物品组的目标特征取值区间。在又一个实施例中,还包括:添加单元,用于根据所述目标物品组中多个物品的目标特征,为所述目标物品组中多个物品的特征向量添加标签;训练单元,用于根据添加标签后所述目标物品组中多个物品的特征向量,训练预设相似度计算模型,得到所述目标组对应的相似度计算模型。在又一个实施例中,所述确定单元,还用于:根据所述目标物品组中多个物品与所述目标物品的相似度,确定与所述待预测新品相似度最大的预设数目个相似物品;根据所述相似物品分别与所述目标物品的相似度,确定每个所述相似物品与所述目标物品的相似占比;根据所述相似物品的目标特征值和所述相似占比,确定所述目标物品的目标特征值。为实现上述目的,根据本专利技术实施例的再一个方面,提供了一种电子设备。本专利技术实施例的一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术实施例提供的相似度的确定方法。为实现上述目的,根据本专利技术实施例的又一个方面,提供了一种计算机可读介质。本专利技术实施例的一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本专利技术实施例提供的相似度的确定方法。上述专利技术中的一个实施例具有如下优点或有益效果:本专利技术实施例中目标物品和本文档来自技高网...

【技术保护点】
1.一种相似度的确定方法,其特征在于,包括:/n对于每个物品组,根据所述物品组中多个物品的属性信息确定对应所述物品组的向量构建参数,并根据所述多个物品的属性信息和所述物品组对应的向量构建参数,分别构建所述多个物品的特征向量;/n根据目标物品的类型,确定所述目标物品所属的目标物品组;/n基于所述目标物品的属性信息和所述目标物品组对应的向量构建参数,构建所述目标物品的特征向量;/n根据所述目标物品的特征向量、所述目标物品组中多个物品的特征向量,以及所述目标物品组对应的相似度模型,分别确定所述目标物品组中多个物品与所述目标物品的相似度。/n

【技术特征摘要】
1.一种相似度的确定方法,其特征在于,包括:
对于每个物品组,根据所述物品组中多个物品的属性信息确定对应所述物品组的向量构建参数,并根据所述多个物品的属性信息和所述物品组对应的向量构建参数,分别构建所述多个物品的特征向量;
根据目标物品的类型,确定所述目标物品所属的目标物品组;
基于所述目标物品的属性信息和所述目标物品组对应的向量构建参数,构建所述目标物品的特征向量;
根据所述目标物品的特征向量、所述目标物品组中多个物品的特征向量,以及所述目标物品组对应的相似度模型,分别确定所述目标物品组中多个物品与所述目标物品的相似度。


2.根据权利要求1所述的方法,其特征在于,所述根据所述物品组中多个物品的属性信息确定对应所述物品组的向量构建参数,包括:
根据目标特征,从所述物品组中多个物品的属性信息中,确定对应所述物品组的向量构建参数,所述向量构建参数包括与所述目标特征关联的向量构建词库和/或目标特征取值区间。


3.根据权利要求2所述的方法,其特征在于,若所述向量构建参数包括所述向量构建词库,则所述根据目标特征,从所述物品组中多个物品的属性信息中,确定对应所述物品组的向量构建参数,包括:
对所述多个物品的属性信息分词,确定多个向量构建词;
根据所述多个物品的目标特征,确定每个所述向量构建词与所述目标特征之间的关联度;
从所述多个向量构建词中,筛选出所述关联度大于阈值的向量构建词,作为所述向量构建词库。


4.根据权利要求2所述的方法,其特征在于,所述向量构建参数包括目标特征取值区间,则所述根据目标特征,从所述物品组中多个物品的属性信息中,确定对应所述物品组的向量构建参数,包括:
根据所述物品组中多个物品的属性信息,确定所述物品组中多个物品的目标特征值;
根据所述物品组中多个物品的目标特征值,确定对应所述物品组的目标特征取值区间。


5.根据权利要求1所述的方法,其特征在于,所述根据所述目标物品的特征向量、所述目标物品组中多个物品的特征向量,以及所述目标物品组对应的相似度模型,分别确定所述目标物品组中多个物品与所述目标物品的相似度之前,还包括:
根据所述目标物品组中多个物品的目标特征,为所述目...

【专利技术属性】
技术研发人员:路德棋承玲璐
申请(专利权)人:北京沃东天骏信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1