数据处理的方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号:32128601 阅读:31 留言:0更新日期:2022-01-29 19:22
本公开提供了数据处理的方法、装置、设备、存储介质及程序产品,涉及数据处理领域,尤其涉及大数据、自然语言处理、知识图谱等领域。具体实现方案为:根据用户与物料的关联关系图、用户间的关联关系图、物料间的关联关系图中的至少一个关联关系图,将每一对象的初始表征向量与至少一个关联对象的初始表征向量融合,得到每一对象的表征信息,使得最终得到物料管理系统的用户的表征信息和物料的表征信息包含高阶关联信息,能够更好地表征用户的兴趣偏好和物料的属性特点,响应于接收到对物料管理系统的推荐请求,基于包含高阶关联信息的用户和物料的表征信息进行物料推荐,提高了物料推荐的精准度。的精准度。的精准度。

【技术实现步骤摘要】
数据处理的方法、装置、设备、存储介质及程序产品


[0001]本公开涉及数据处理中的大数据、自然语言处理、知识图谱等领域,尤其涉及一种数据处理的方法、装置、设备、存储介质及程序产品。

技术介绍

[0002]目前的物料推荐系统中,通常都是将各个用户和各个物料独立地来看待,用户和物料的特征表示包含自身的属性信息。根据用户和物料的自身的属性信息,通过进行用户与用户、用户与物料、或者物料与物料之间属性的比较、相似度计算,向用户推荐物料,推荐精度较低。

技术实现思路

[0003]本公开提供了一种数据处理的方法、装置、设备、存储介质及程序产品。
[0004]根据本公开的第一方面,提供了一种数据处理的方法,包括:
[0005]响应于接收到对物料管理系统的推荐请求,获取物料管理系统中用户的表征信息和物料的表征信息,其中,所述用户的表征信息和物料的表征信息是根据关联关系图,将每一对象的初始表征向量与至少一个关联对象的初始表征向量融合得到,所述对象包括以下至少一种:用户、物料;所述关联关系图包括以下至少一个:用户与物料的关联关系图、用本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理的方法,包括:响应于接收到对物料管理系统的推荐请求,获取物料管理系统中用户的表征信息和物料的表征信息,其中,所述用户的表征信息和物料的表征信息是根据关联关系图,将每一对象的初始表征向量与至少一个关联对象的初始表征向量融合得到,所述对象包括以下至少一种:用户、物料;所述关联关系图包括以下至少一个:用户与物料的关联关系图、用户间的关联关系图、物料间的关联关系图;根据所述用户的表征信息和物料的表征信息,进行物料推荐。2.根据权利要求1所述的方法,其中,所述获取物料管理系统中用户的表征信息和物料的表征信息,包括:根据所述物料管理系统中用户的初始表征向量和物料的初始表征向量,构建以下至少一个关联关系图:用户与物料的关联关系图、用户间的关联关系图、物料间的关联关系图;其中,所述用户与物料的关联关系图包括用户节点、物料节点、以及用户节点与物料节点之间的关联关系,所述用户间的关联关系图包括用户节点和用户节点间的关联关系,所述物料间的关联关系图包括物料节点和物料节点间的关联关系,每一所述用户节点对应一个用户,每一所述物料节点对应一个物料,所述用户节点的表征向量为所述用户节点对应用户的初始表征向量,所述物料节点的表征向量为所述物料节点对应物料的初始表征向量;根据每一所述关联关系图,将每一所述关联关系图中每一节点的表征向量与至少一个邻居节点的表征向量进行融合处理,得到每一节点对应的表征信息;根据所述至少一个关联关系图中用户节点对应的表征信息,确定每一用户的表征信息;并根据所述至少一个关联关系图中物料节点对应的表征信息,确定每一物料的表征信息。3.根据权利要求2所述的方法,其中,所述根据每一所述关联关系图,将每一所述关联关系图中每一节点的表征向量与至少一个邻居节点的表征向量进行融合处理,得到每一节点对应的表征信息,包括:对于每一所述关联关系图,根据所述关联关系图对应的表征学习模型,对所述关联关系图进行如下迭代处理:根据本次迭代所使用的融合参数,将所述关联关系图中每一节点的表征向量与至少一个邻居节点的表征向量进行融合处理,得到本次迭代中每一节点对应的融合表征向量,并根据本次迭代中每一节点对应的融合表征向量,更新每一节点的表征向量;其中,所述表征学习模型包括迭代次数和每次迭代所使用的融合参数;在迭代结束后,将所述关联关系图中节点的表征向量作为节点的表征信息。4.根据权利要求3所述的方法,其中,所述融合参数为非线性变换矩阵,所述根据本次迭代所使用的融合参数,将所述关联关系图中每一节点的表征向量与至少一个邻居节点的表征向量进行融合处理,得到本次迭代中每一节点对应的融合表征向量,包括:分别将所述关联关系图中的每一节点作为目标节点,获取所述目标节点的至少一个邻居节点的表征向量的均值向量,并将所述均值向量与所述目标节点的表征向量拼接,得到拼接向量;根据本次迭代所使用的非线性变换矩阵,对所述拼接向量进行非线性变换处理,得到所述目标节点对应的融合表征向量。
5.根据权利要求2

4中任一项所述的方法,其中,所述根据所述至少一个关联关系图中用户节点对应的表征信息,确定每一用户的表征信息,包括:将所述至少一个关联关系图中与同一用户对应的用户节点的表征信息进行合并,将合并得到的信息作为所述同一用户的表征信息。6.根据权利要求2

4中任一项所述的方法,其中,所述根据所述至少一个关联关系图中物料节点对应的表征信息,确定每一物料的表征信息,包括:将所述至少一个关联关系图中与同一物料对应的物料节点的表征信息进行合并,将合并得到的信息作为所述同一物料的表征信息。7.根据权利要求2

6中任一项所述的方法,其中,所述根据所述物料管理系统中用户的初始表征向量和物料的初始表征向量,构建以下至少一个关联关系图:用户与物料的关联关系图、用户间的关联关系图、物料间的关联关系图,包括以下至少一项:根据所述物料管理系统中用户对物料操作行为信息,确定用户与物料间是否具有第一关联,并构建用户与物料的关联关系图,所述第一关联包括以下至少一项:用户搜索过物料、用户发表了物料;根据所述物料管理系统中用户的属性信息及用户间的历史交互信息,确定用户间是否具有第二关联,并构建用户间的关联关系图,所述第二关联包括以下至少一项:来自同一部门、具有同一职能序列、具有共同的上级、具有工作交流、来自同一群组、打开过同一物料、搜索过同一物料;根据所述物料管理系统中物料的属性信息,确定物料间是否具有第三关联,并构建物料间的关联关系图,所述第三关联包括以下至少一项:具有相同的主题或标签、具有相同的作者、标题或摘要的重叠率达到对应阈值。8.一种数据处理的方法,包括:获取样本图,所述样本图包括以下任意一个:用户与物料的关联关系图、用户间的关联关系图和物料间的关联关系图;根据所述样本图和所述样本图对应的表征学习模型,将每一对象的初始表征向量与至少一个关联对象的初始表征向量进行融合处理,得到每一对象对应的表征信息;其中,所述对象包括以下至少一种:用户、物料;根据每一对象对应的表征信息,计算目标函数值;根据所述目标函数值,更新所述表征学习模型的参数。9.根据权利要求8所述的方法,其中,所述用户与物料的关联关系图包括用户节点、物料节点、以及用户节点与物料节点之间的关联关系,所述用户间的关联关系图包括用户节点和用户节点间的关联关系,所述物料间的关联关系图包括物料节点和物料节点间的关联关系,每一所述用户节点对应一个用户,每一所述物料节点对应一个物料,所述用户节点的表征向量为所述用户节点对应用户的初始表征向量,所述物料节点的表征向量为所述物料节点对应物料的初始表征向量;所述根据所述样本图和所述样本图对应的表征学习模型,将每一对象的初始表征向量与至少一个关联对象的初始表征向量进行融合处理,得到每一对象对应的表征信息,包括:根据所述样本图和所述样本图对应的表征学习模型,将每一所述关联关系图中每一节点的表征向量与至少一个邻居节点的表征向量进行融合处理,得到每一节点对应的表征信
息,其中每一节点对应一个对象。10.根据权利要求9所述的方法,其中,所述根据所述样本图和所述样本图对应的表征学习模型,将每一所述关联关系图中每一节点的表征向量与至少一个邻居节点的表征向量进行融合处理,得到每一节点对应的表征信息,包括:根据所述样本图对应的表征学习模型的迭代次数,对所述样本图进行如下迭代处理:根据本次迭代所使用的融合参数,将所述样本图中每一节点的表征向量与至少一个邻居节点的表征向量进行融合处理,得到每一节点对应的融合表征向量,并根据每一节点对应的融合表征向量,更新每一节点的表征向量;其中,所述表征学习模型包括迭代次数和每次迭代所使用的融合参数;在迭代结束后,将所述样本图中节点的表征向量作为节点的表征信息。11.根据权利要求10所述的方法,其中,所述融合参数为非线性变换矩阵,所述根据本次迭代所使用的融合参数,将所述样本图中每一节点的表征向量与至少一个邻居节点的表征向量进行融合处理,得到每一节点对应的融合表征向量,包括:分别将所述样本图中的每一节点作为目标节点,获取所述目标节点的至少一个邻居节点的表征向量的均值向量,并将所述均值向量与所述目标节点的表征向量拼接,得到拼接向量;根据本次迭代所使用的非线性变换矩阵,对所述拼接向量进行非线性变换处理,得到所述目标节点对应的融合表征向量。12.根据权利要求11所述的方法,其中,所述根据所述目标函数值,更新所述表征学习模型的参数,包括:根据所述目标函数值,更新所述表征学习模型中的非线性变换矩阵。13.根据权利要求8

12中任一项所述的方法,其中,所述根据每一对象对应的表征信息,计算目标函数值,包括:针对所述样本图中的第一节点,通过随机游走的方式确定所述第一节点为起点的指定长度的节点序列,其中,所述第一节点为所述样本图中的任一节点;根据所述第一节点的表征信息、第二节点的表征信息和第三节点的表征信息,以及第三节点的数量,计算目标函数值;其中,所述第二节点为包含在所述节点序列中的节点,所述第三节点为所述样本图中未包含在所述节点序列中的节点。14.根据权利要求8

13中任一项所述的方法,其中,所述获取样本图,包括以下至少一项:根据物料管理系统中用户对物料操作行为信息,确定用户与物料间是否具有第一关联,并构建用户与物料的关联关系图,所述第一关联包括以下至少一项:用户搜索过物料、用户发表了物料;根据物料管理系统中用户的属性信息及用户间的历史交互信息,确定用户间是否具有第二关联,并构建用户间的关联关系图,所述第二关联包括以下至少一项:来自同一部门、具有同一职能序列、具有共同的上级、具有工作交流、来自同一群组、打开过同一物料、搜索过同一物料;根据物料管理系统中物料的属性信息,确定物料间是否具有第三关联,并构建物料间
的关联关系图,所述第三关联包括以下至少一项:具有相同的主题或标签、具有相同的作者、标题或摘要的重叠率达到对应阈值。15.一种数据处理的装置,包括:表征信息获取模块,用于响应于接收到对物料管理系统的推荐请...

【专利技术属性】
技术研发人员:曹丞泰徐伟夏晓玲蒋俊翔何伯磊陈坤斌和为
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1