一种物料寻源方法和系统技术方案

技术编号:37704698 阅读:11 留言:0更新日期:2023-06-01 23:52
本申请提供一种物料寻源方法和系统。该方法包括:爬取外部数据,根据外部数据和企业内部数据构建产业链知识图谱,以获取上下游关系;获取用户埋点数据,根据用户埋点数据构建用户行为序列;将产业链知识图谱和用户行为序列输入产业链图谱与用户行为融合模型进行训练;根据历史检索数据,构建物料与关键词的双塔模型并训练,将所有物料转化为物料向量;双塔模型包括产业链图谱与用户行为融合模型以及关键词模型;将关键词输入关键词模型,得到关键词向量,将关键词向量和所有物料向量做相似度计算,选择相似度最高的至少一个物料作为物料寻源结果。本申请在物料库里面快速的发现替代品和新品,提高产品价格透明度,降低采购成本和相关费用。成本和相关费用。成本和相关费用。

【技术实现步骤摘要】
一种物料寻源方法和系统


[0001]本申请涉及策划采购
,尤其涉及一种融合产业链知识图谱和用户行为序列图表示的物料寻源方法和系统。

技术介绍

[0002]物料寻源一直是策采业务中至关重要的一环,准确的在市场上找到规格、功能相似且性价比更高的替代物料,能从源头上为企业进行降本或者防范风险。又或者从市场上找到合适的新品,从而在产品上与时俱进,使公司产品有独特的新颖力与竞争力。而在策采业务中,物料线较多,不同物料线下物料品类包含万千。
[0003]经过广泛的调研,目前行业内物料寻源的方式大多分为三类:基于行业供应源共享进行物料寻源、利用云服务进行在线寻源搜索、利用用户行为序列构建物料向量进行搜索检索。前两类方案都是在物料端做收集和整理,没有考虑用户历史行为信息,对于用户搜索召回的物料只能通过搜索关键词进行匹配。第三类将用户和物料进行向量化建模,将搜索关键词、用户行为信息、物料属性信息融合进行搜索,但是没有考虑物料在行业上的上下游关系,无法进行新品/替代品发现。

技术实现思路

[0004]有鉴于此,本申请从算法层面,基于产业链图谱和图表示学习算法,构建物料向量化表示模型,帮助业务方在百万级别的物料库里面快速的发现替代品和新品(下面简称物料寻源),提高产品价格透明度,降低采购成本和相关费用。
[0005]基于上述目的,本申请提出了一种物料寻源方法,包括:
[0006]爬取外部数据,根据所述外部数据和企业内部数据构建产业链知识图谱,以获取上下游关系;
[0007]获取用户埋点数据,根据所述用户埋点数据构建用户行为序列;
[0008]将所述产业链知识图谱和用户行为序列输入产业链图谱与用户行为融合模型进行训练;所述产业链图谱与用户行为融合模型包括翻译向量(Translating Embeddings,TransE)模型和图向量模型;
[0009]根据历史检索数据,构建物料与关键词的双塔模型并训练,将所有物料转化为物料向量;所述双塔模型包括产业链图谱与用户行为融合模型以及关键词模型;
[0010]将关键词输入所述关键词模型,得到关键词向量,将所述关键词向量和所有所述物料向量做相似度计算,选择相似度最高的至少一个物料作为物料寻源结果。
[0011]进一步地,所述将所述产业链知识图谱和用户行为序列输入产业链图谱与用户行为融合模型进行训练,包括:
[0012]利用TransE模型训练所述产业链知识图谱中上下游关系的节点向量;
[0013]利用图向量模型训练基于所述用户行为序列的物料向量;
[0014]将所述节点向量和物料向量进行融合压缩得到融合向量;
[0015]将融合向量与所述TransE模型和图向量模型各自的原始向量进行合并后,分别在各自模型的下游任务计算损失,反向传播训练各自模型。
[0016]进一步地,所述爬取外部数据,根据所述外部数据和企业内部数据构建产业链知识图谱,以获取上下游关系,包括:
[0017]根据企业内部已有的结构化数据提取出企业内部实体;
[0018]利用实体识别、关系抽取、实体融合,在爬虫数据中提取产业链图谱需要的实体和关系,结合所述企业内部实体,生成产业链知识图谱;所述知识图谱的每一个关系用三元组表示,即头结点

关系

尾结点形式;
[0019]根据产品与类目的关系映射到对应类目所在产业链节点,根据类目上下游关系,得到当前物料的产业链属性。
[0020]进一步地,所述获取用户埋点数据,根据所述用户埋点数据构建用户行为序列,包括:
[0021]将所有用户的点击序列构建成图结构形式,将不同用户的兴趣通过物料进行关联;
[0022]采用随机游走的形式,根据所述图结构形式的路径游走采样出一个序列;
[0023]反复游走多次,得到多个序列,作为用户行为序列。
[0024]进一步地,所述利用TransE模型训练所述产业链知识图谱中上下游关系的节点向量,包括:
[0025]利用向量层将所述产业链知识图谱中的节点进行向量化表示,得到所述产业链知识图谱中上下游关系的节点向量;
[0026]输入头结点ID和关系ID,分别经过向量层得到头结点向量和关系向量,然后利用向量的三角表示,得到头结点向量和关系向量的和向量,最后评估头结点向量和关系向量与尾结点向量的距离作为损失值,进行反向传播训练模型。
[0027]进一步地,所述图向量模型为跳字(skip

gram)模型。
[0028]进一步地,所述利用图向量模型训练基于所述用户行为序列的物料向量,包括:
[0029]从所述用户行为序列中采用滑窗的形式构建物料对,每次滑窗确定一个中心物料;
[0030]对于每个物料,通过向量参数矩阵得到各自对应的物料向量,用中心物料预测邻居物料,用距离函数作为预测得分,最终损失函数为正样本得分

负样本得分。
[0031]进一步地,所述将所述节点向量和物料向量进行融合压缩得到融合向量,包括:
[0032]对所述节点向量和物料向量进行交叉处理,得到交叉向量;
[0033]经过多层全连接,将交叉向量进行压缩得到需要的维度,再返回给图向量模型和TransE模型做下游任务。
[0034]进一步地,所述双塔模型的输入分别为物料ID和关键词,输出所述关键词是否为点击对应的物料的概率,损失函数采用二分类交叉熵损失函数。
[0035]基于上述目的,本申请还提出了一种物料寻源系统,包括:
[0036]知识图谱模块,用于爬取外部数据,根据所述外部数据和企业内部数据构建产业链知识图谱,以获取上下游关系;
[0037]行为序列模块,用于获取用户埋点数据,根据所述用户埋点数据构建用户行为序
列;
[0038]融合模型模块,用于将所述产业链知识图谱和用户行为序列输入产业链图谱与用户行为融合模型进行训练;所述产业链图谱与用户行为融合模型包括TransE模型和图向量模型;
[0039]双塔模型模块,用于根据历史检索数据,构建物料与关键词的双塔模型并训练,将所有物料转化为物料向量;所述双塔模型包括所述产业链图谱与用户行为融合模型以及关键词模型;
[0040]寻源计算模块,用于将关键词输入所述关键词模型,得到关键词向量,将所述关键词向量和所有所述物料向量做相似度计算,选择相似度最高的至少一个物料作为物料寻源结果。
[0041]基于上述目的,本申请还提出了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述物料寻源方法的步骤。
[0042]基于上述目的,本申请还提出了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述物料寻源方法的步骤。
[0043]总的来说,本申请的优势及给用户带来的体验在于:
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种物料寻源方法,其特征在于,包括:爬取外部数据,根据所述外部数据和企业内部数据构建产业链知识图谱,以获取上下游关系;获取用户埋点数据,根据所述用户埋点数据构建用户行为序列;将所述产业链知识图谱和用户行为序列输入产业链图谱与用户行为融合模型进行训练;所述产业链图谱与用户行为融合模型包括TransE模型和图向量模型;根据历史检索数据,构建物料与关键词的双塔模型并训练,将所有物料转化为物料向量;所述双塔模型包括产业链图谱与用户行为融合模型以及关键词模型;将关键词输入所述关键词模型,得到关键词向量,将所述关键词向量和所有所述物料向量做相似度计算,选择相似度最高的至少一个物料作为物料寻源结果。2.根据权利要求1所述的方法,其特征在于,所述将所述产业链知识图谱和用户行为序列输入产业链图谱与用户行为融合模型进行训练,包括:利用TransE模型训练所述产业链知识图谱中上下游关系的节点向量;利用图向量模型训练基于所述用户行为序列的物料向量;将所述节点向量和物料向量进行融合压缩得到融合向量;将融合向量与所述TransE模型和图向量模型各自的原始向量进行合并后,分别在各自模型的下游任务计算损失,反向传播训练各自模型。3.根据权利要求1所述的方法,其特征在于,所述爬取外部数据,根据所述外部数据和企业内部数据构建产业链知识图谱,以获取上下游关系,包括:根据企业内部已有的结构化数据提取出企业内部实体;利用实体识别、关系抽取、实体融合,在爬虫数据中提取产业链图谱需要的实体和关系,结合所述企业内部实体,生成产业链知识图谱;所述知识图谱的每一个关系用三元组表示,即头结点

关系

尾结点形式;根据产品与类目的关系映射到对应类目所在产业链节点,根据类目上下游关系,得到当前物料的产业链属性。4.根据权利要求1所述的方法,其特征在于,所述获取用户埋点数据,根据所述用户埋点数据构建用户行为序列,包括:将所有用户的点击序列构建成图结构形式,将不同用户的兴趣通过物料进行关联;采用随机游走的形式,根据所述图结构形式的路径游走采样出一个序列;反复游走多次,得到多个序列,作为用户行为序列。5.根据权利要求2所述的方法,其特征在于,所述利用TransE模型训练所述产业链知识图谱中上下游关系的节点向量,包括:利用向量层将所述产业链知识图谱中的节点进行向量化表示,得到所述产业链知识图谱中上下游关系的节点向量;输入头结点ID和关系ID,分别经过向量层得到头结点向量和关系向量,然后利用向量的三角表示,得到头结点向量和关系向量的和向量,最后评估头结点向...

【专利技术属性】
技术研发人员:陈俊伍
申请(专利权)人:广州视源人工智能创新研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1