【技术实现步骤摘要】
一种物料向量化方法和系统
[0001]本申请涉及策划采购
,尤其涉及一种基于UIG-Embedding物料向量化方法和系统。
技术介绍
[0002]物料管理是大型制造业企业比较重要的一个环节,从传统制造业往信息化发展,甚至往智能化发展的过程中,物料的管理对供应链上下游生态建设、企业成本控制、产品质量把控都起着至关重要的作用。如何将物料从线下转为线上信息化管理,构建相应类目体系这是信息化建设的重要环节。而如何将线上物料使用起来,用一种向量来表示物料在不同业务场景下的信息则是目前智能化环节需要考虑的因素。比如在物料寻源业务场景下,此时希望能够利用当前物料信息找到与当前物料规格相近的替代物料或者新品物料;当应用在物料价格分析时,此时希望当前物料信息能够包含其规格属性或者历史信息来做价格预测。或者应用在物料供应商分析的业务场景,此时希望当前物料信息能够包含其供应商信息甚至其上下游产业链信息,帮助用户对物料的供应商进行全面剖析。同时,一个大型企业往往有很多子企业或者子公司,为了强化数据管理与使用,统一物料类目体系也是健全整个集团 ...
【技术保护点】
【技术特征摘要】
1.一种物料向量化方法,其特征在于,包括:获取用户画像数据、物料画像数据、用户行为数据、物料类目体系结构数据;根据所述用户行为数据构建行为意图序列、物料点击序列,根据所述物料类目体系结构数据构建物料图结构;结合所述物料图结构和物料画像数据预训练物料图表示模型;结合所述用户画像数据和所述行为意图序列训练用户行为意图模型,结合所述用户行为意图模型、物料点击序列、物料图表示模型、物料画像数据训练物料点击率预测模型,反向传播微调所述物料图表示模型的参数;在所述物料图表示模型逐渐收敛后,将物料图表示模型微调后的物料向量作为整个物料体系的向量。2.根据权利要求1所述的方法,其特征在于,所述结合所述用户画像数据和所述行为意图序列训练用户行为意图模型,包括:将用户画像数据和行为意图序列作为输入,基于二分类判别训练用户行为意图模型。3.根据权利要求1所述的方法,其特征在于,所述结合所述用户画像数据和所述行为意图序列训练用户行为意图模型,包括:提取所述用户画像数据的离散特征和连续特征,将所述离散特征和连续特征用相同维度的向量表示;提取所述行为意图序列的特征,并进行注意力操作和多头注意力操作,得到注意力向量和多头注意力向量,将注意力向量和多头注意力向量进行对应维度相加,得到最终的意图向量;设置目标函数,用多分类交叉熵损失函数求出最终损失,进而进行反向传播更新模型参数。4.根据权利要求3所述的方法,其特征在于,所述注意力操作包括:令用户画像数据的向量特征为p∈R
1*m
,其中m表示多个画像特征维度;令行为意图序列的向量特征v∈R
k*m
,其中k表示行为意图序列中k个物料类目,将用户画像数据的向量特征和行为意图序列的向量特征进行注意力操作:其中α
i
表示第i个用户行为意图向量的权重,v
i
表示第i个用户行为意图向量,v
’
表示进行注意力操作后的用户行为意图向量特征。5.根据权利要求3所述的方法,其特征在于,所述多头注意力操作包括:将提取的所述行为意图序列的特征均匀分成多份,每份进行一次自注意力操作,最后汇总通过一层MLP矩阵计算,得到最终融合向量。6.根据权利要求1-5任一项所述的方法,其特征在于,所述物料图表示模型为skip
‑
gram模型,用于训练序列数据的语义向量化表示;模型训练时,每个正样本匹配5个负样本,loss公式如下:
其中dist表示h+r向量与t向量的距离,v(t)表示正样本,u(t)表示负样本。7.根据权利要求6所述的方法,其特征在于,所述结合所述物...
【专利技术属性】
技术研发人员:陈俊伍,
申请(专利权)人:广州视源人工智能创新研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。