表示模型训练方法及相关装置制造方法及图纸

技术编号:39734626 阅读:14 留言:0更新日期:2023-12-17 23:36
本申请涉及计算机技术领域,提供一种表示模型训练方法及相关装置,用以提升目标信息网络中各节点的特征表示的准确性,其中,该方法包括:利用通过目标信息网络构建的训练数据集,对初始表示模型进行迭代训练,获得目标表示模型,在每次迭代过程中,通过各节点各自的属性信息集,获得相应的属性特征,并通过初始表示模型,获得相应的目标特征,然后分别提取出相应的路径特征,进而采用基于各节点各自的路径特征确定的模型损失,进行调参。通过节点自身包含的属性信息,更全面表征节点特征,从而提高特征准确性。而提高特征准确性。而提高特征准确性。

【技术实现步骤摘要】
表示模型训练方法及相关装置


[0001]本申请涉及计算机
,提供一种表示模型训练方法及相关装置。

技术介绍

[0002]随着计算机技术的不断发展,在电商、视频、音频等各类场景中,通常根据视频、商品、音频、对象等信息的特征表示,实现信息推荐。
[0003]相关技术中,通常构建信息网络,信息网络中的每个节点代表一个信息,且对应每个节点设置有节点标识(ID),比如,一个节点代表一个视频,对应该节点设置的节点ID为视频ID,又比如,一个节点代表一个对象,对应该节点设置的节点ID为对象ID。在特征表示时,需要根据节点ID,生成对应的初始化向量,然后,基于生成的各初始化向量,对特征表示模型进行训练,并通过训练后的特征表示模型,获得每个信息的特征表示,进而根据每个信息的特征表示进行信息推荐。
[0004]然而,由于视频ID、对象ID等节点ID包含的节点内容较少,导致生成的特征的准确性较低,影响模型收敛速度和模型质量,进而影响信息推荐效果。

技术实现思路

[0005]本申请实施例提供一种表示模型训练及相关装置,用以提高特征本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种表示模型训练方法,其特征在于,所述方法包括:基于目标信息网络中归属于多种节点类型的各节点及其之间的连接关系,构建训练数据集;每个训练数据包含:至少两个节点及相应的节点连接信息;基于所述训练数据集,对初始表示模型进行迭代训练,获得目标表示模型,其中,每次迭代过程中,执行以下操作:基于一个训练数据中的至少两个节点各自的属性信息集,获得所述至少两个节点各自的属性特征,并将所述至少两个节点各自的属性特征,作为所述至少两个节点各自的初始特征;将所述至少两个节点各自的初始特征,分别输入至所述初始表示模型,获得相应的目标特征,并基于所述一个训练数据中的节点连接信息,从获得的至少两个目标特征中,分别提取出相应的路径特征;采用基于所述至少两个节点各自的路径特征确定的模型损失,进行调参。2.如权利要求1所述的方法,其特征在于,所述目标信息网络中还包含:每个节点的节点类型,以及相连的每两个节点之间的边的边类型;则所述基于目标信息网络中归属于多种节点类型的各节点及其之间的连接关系,构建训练数据集,包括:基于所述连接关系,从目标信息网络中,提取出各节点路径及其对应的元路径,每条元路径包含:对应节点路径中的各相邻两个节点之间的边的边类型,以及各边类型之间的连接关系;将提取出的各元路径分别作为节点连接信息,并结合所述各节点路径各自包含的第一节点和第二节点,获得训练数据集中的各训练数据。3.如权利要求2所述的方法,其特征在于,所述将提取出的各元路径分别作为节点连接信息,并结合所述各节点路径各自包含的第一节点和第二节点,获得训练数据集中的各训练数据,包括:针对所述各节点路径中的每条节点路径,分别执行以下操作:将当前节点路径对应的元路径,作为所述当前节点路径中的第一节点和第二节点的节点连接信息,并基于当前节点路径中第一节点的第一节点类型,从所述各节点中,选取出属于所述第一节点类型,且与所述第一节点不相连的参考节点;从所述各元路径中,选取出除所述当前节点路径对应的元路径之外的元路径,作为参考元路径,并将所述参考元路径作为所述参考节点和所述第一节点之间的节点连接信息;基于所述第一节点、所述第二节点、所述参考节点,结合所述参考节点和所述第一节点之间的节点连接信息,以及所述当前节点路径中的第一节点和第二节点的节点连接信息,获得一个训练数据。4.如权利要求2所述的方法,其特征在于,所述基于所述连接关系,从目标信息网络中,提取出各节点路径,包括:基于所述连接关系和预设的节点路径长度,从所述各节点中,提取出各初始节点路径,每条初始节点路径包含至少两个节点;按照预设的元路径长度,分别对各初始节点路径进行截取,获得各条节点路径。5.如权利要求4所述的方法,其特征在于,基于所述连接关系,从目标信息网络中,提取
出各元路径,包括:基于所述各初始节点路径各自包含的至少一个边类型,以及所述至少一个边类型之间的连接关系,获得各边类型路径;按照所述元路径长度,分别对所述各边类型路径进行截取,获得各元路径。6.如权利要求1

5中任一项所述的方法,其特征在于,所述基于一个训练数据中的至少两个节点各自的属性信息集,获得所述至少两个节点各自的属性特征,包括:基于所述至少两个节点各自的属性信息集中的至少一个属性信息,获得所述至少两个节点各自的至少一个属性子特征;分别对相应的至少一个属性子特征进行特征拼接,获得所述至少两个节点各自的属性特征。7.如权利要求6所述的方法,其特征在于,所述基于所述至少两个节点各自的属性信息集中的至少一个属性信息,获得所述至少两个节点各自的至少一个属性子特征,包括:基于设定的离散化方式,分别对所述至少两个节点各自的属性信息集中的至少一个属性信息进行离散化处理,获得相应的离散信息;基于获得的所述至少两个节点各自的至少一个离散信息,...

【专利技术属性】
技术研发人员:周厚谦钟辉强
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1