商品的归并方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:38467248 阅读:26 留言:0更新日期:2023-08-11 14:44
本发明专利技术公开了一种商品的归并方法、装置、存储介质及计算机设备,应用于互联网电商平台,涉及数据处理及金融科技领域。其中方法包括:获取互联网电商平台处的多个商品的描述语句,并确定每个描述语句的词语序列;计算每个词语序列的稠密向量,并将稠密向量划分到多个稠密向量组中,其中,每个稠密向量组中包含相似向量,相似向量为在全部稠密向量中,任意两个稠密向量间的余弦相似度满足预设的相似度阈值的稠密向量;将稠密向量组中每个相似向量对应的商品确定为相似商品。上述方法能够显著提高对互联网商业购物平台的相似商品判定的准确性,促进商品交易。促进商品交易。促进商品交易。

【技术实现步骤摘要】
商品的归并方法、装置、存储介质及计算机设备


[0001]本专利技术涉及数据处理及金融科技领域,尤其是涉及一种商品的归并方法、装置、存储介质及计算机设备。

技术介绍

[0002]随着在线商品交易服务的完善以及各大互联网电商平台的发展,电商平台的商业规模随之越来越大,其能够提供的商业服务的种类逐渐增加,电商平台接入的第三方入驻店铺的数量也随之增加。然而伴随着电商数量的增加,相同或相似经营方向的电商提供的商品也越发同质化,出现了众多的相似商品。如何准确的判定出互联网电商平台的相似商品,对后续的商品推荐工作的有效性具有重大意义。
[0003]当前的相似商品判定的方法多为基于互联网电商平台处上架商品的名称进行判定,将相同的商品名称对应的商品确定为相似商品。然而,为了提高商品的被搜索概率,商家多为上架商品设置相对宽泛且模糊的商品名称,导致商品名称大量雷同,进而导致对相似商品的确定准确率极低,无法起到促进消费,提高交易成功率的作用。

技术实现思路

[0004]有鉴于此,本申请提供了一种商品的归并方法、装置、存储介质及计算机设备,主要目本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种商品的归并方法,应用于互联网电商平台,其特征在于,所述方法包括:获取所述互联网电商平台处的多个所述商品的描述语句,并确定每个所述描述语句的词语序列;计算每个所述词语序列的稠密向量,并将所述稠密向量划分到多个稠密向量组中,其中,每个所述稠密向量组中包含相似向量,所述相似向量为在全部所述稠密向量中,任意两个所述稠密向量间的余弦相似度满足预设的相似度阈值的所述稠密向量;将稠密向量组中每个所述相似向量对应的商品确定为相似商品。2.根据权利要求1所述的方法,其特征在于,所述计算每个所述词语序列的稠密向量,包括:将所述词语序列输入到预训练的词向量生成模型中,得到所述词语序列中每个词语的稠密特征向量,其中,所述词向量生成模型为基于多个词语组成的商品描述语句训练得到;将全部所述词语的稠密特征向量进行求和,得到所述词语序列的稠密向量。3.根据权利要求2所述的方法,其特征在于,所述将全部所述词语的稠密特征向量进行求和,得到所述词语序列的稠密向量,包括:将每个所述词语与预设的词语权重对照信息进行对比,其中,所述词语权重对照信息中记录有预设词语以及与每个所述预设词语对应的预设权重值;将与所述预设词语相同的所述词语确定为权重词语,并将所述预设词语对应的预设权重值赋予所述权重词语对应的稠密特征向量,得到权重词语向量;将所述权重词语之外的全部所述词语确定为默认词语,并为每个所述默认词语对应的稠密特征向量赋予预设的默认权重值,得到默认词语向量;将全部所述权重词语向量和全部所述默认词语向量进行加权求和,得到所述词语序列的稠密向量。4.根据权利要求1所述的方法,其特征在于,所述将所述稠密向量划分到多个稠密向量组中,包括:将全部所述稠密向量确定为向量集合;执行循环过程直至满足预设条件,其中,所述循环过程包括:在所述向量集合中选择出目标稠密向量;分别计算所述目标稠密向量与所述向量集合中除所述目标稠密向量之外的每个所述稠密向量的余弦相似度;将所述余弦相似度与预设的相似度阈值进行比较,将与所述目标稠密向量之间的余弦相似度满足所述相似度阈值的所述稠密向量确定为相似稠密向量,将所述目标稠密向量与所述相似稠密向量确定为所述相似向量并划分到一个稠密向量组;将所述稠密向量组之外的全部稠密向量确定为所述向量集合,并执行所述在所述向量集合中选择出目标稠密向量的步骤;其中,所述预设条件为所述向量集合中的任意两个所述稠密向量间的余弦相似度不满足所述相似度阈值,或所述向量集合中存在不超过一个所述稠密向量。5.根据权利要求1

【专利技术属性】
技术研发人员:王永合
申请(专利权)人:平安付科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1