图结构估计模型的训练方法、装置、设备及存储介质制造方法及图纸

技术编号:30403897 阅读:21 留言:0更新日期:2021-10-20 10:57
本发明专利技术实施例公开了一种图结构估计模型的训练方法、装置、设备及存储介质,其中方法包括:获取初始图以及初始图对应的标签信息;初始图包含多个节点,标签信息用于指示初始图中目标节点所属类别,目标节点为初始图的多个节点中任意一个或多个;调用图结构估计模型包括的图预测模型对初始图进行预测处理,得到初始图对应的观测信息;调用图结构估计模型包括的图估计器基于标签信息和观测信息进行估计处理得到估计图;并调用图预测模型对估计图进行预测处理,得到估计图对应的预测信息;基于估计图对应的预测信息和标签信息对图预测模型进行优化。采用本发明专利技术实施例可提供图结构估计模型的准确度。模型的准确度。模型的准确度。

【技术实现步骤摘要】
图结构估计模型的训练方法、装置、设备及存储介质


[0001]本申请涉及图处理领域,尤其涉及一种图结构估计模型的训练方法、装置、设备及存储介质。

技术介绍

[0002]从化学和生物信息学研究到图像和社交网络分析,图无处不在。所谓图,是用于描述社区关系链最直接的工具,由节点和边组成,节点代表社区中的对象,边代表两个对象之间的联系紧密程度。由于图的普遍性,学习图的有效表示并将其应用于下游任务尤其重要。最近,用于图表示学习的图处理模型引起了广泛关注,比如图神经网络(Graph Neural Networks)GNN模型、图卷积网络(Graph Convolutional Network)GCN模型等;以图神经网络GNN模型为例,该模型大致遵循递归消息传递机制,即邻域信息被聚合并传递给邻居。
[0003]目前使用的图处理模型通常是基于图训练样本进行训练得到的,在训练时一般假设图训练样本的图结构是正确,并且符合图处理模型的模型性质。但是图训练样本一般是抽取自实际应用中复杂的交互系统,由于实际应用的交互系统中存在一些错误可能导致图训练样本存在一些缺失、无意义、甚至错误的边,这导致图训练样本与GNN的性质不匹配,从而影响GNN模型的准确度。因此,在图处理领域,如何对用于对图处理的模型进行训练以提高模型的准确度成为研究的热点问题。

技术实现思路

[0004]本专利技术实施例提供了一种图结构估计模型的训练方法、装置、设备及存储介质,可提高图结构估计模型的准确性。
[0005]一方面,本专利技术实施例提供了一种图结构估计模型的训练方法,包括:
[0006]获取初始图以及所述初始图对应的标签信息;所述初始图包含多个节点,所述标签信息用于指示所述初始图中目标节点所属类别,所述目标节点为所述初始图的多个节点中任意一个或多个;
[0007]调用图结构估计模型包括的图预测模型对所述初始图进行预测处理,得到所述初始图对应的观测信息;
[0008]调用所述图结构估计模型包括的图估计器基于所述标签信息和所述观测信息进行估计处理得到估计图;并调用所述图预测模型对所述估计图进行预测处理,得到所述估计图对应的预测信息,所述估计图对应的预测信息用于指示所述估计图中各个节点所属类别;
[0009]基于所述估计图对应的预测信息和所述标签信息对所述图预测模型进行优化。
[0010]一方面,本专利技术实施例还提供了一种图结构估计模型的训练装置,包括:
[0011]获取单元,用于获取初始图以及所述初始图对应的标签信息;所述初始图包含多个节点,所述标签信息用于指示所述初始图中目标节点所属类别,所述目标节点为所述初始图的多个节点中任意一个或多个;
[0012]处理单元,用于调用图结构估计模型包括的图预测模型对所述初始图进行预测处理,得到所述初始图对应的观测信息;
[0013]所述处理单元,还用于调用所述图结构估计模型包括的图估计器基于所述标签信息和所述观测信息进行估计处理得到估计图;并调用所述图预测模型对所述估计图进行预测处理,得到所述估计图对应的预测信息,所述估计图对应的预测信息用于指示所述估计图中各个节点所属类别;
[0014]所述处理单元,还用于基于所述估计图对应的预测信息和所述标签信息对所述图预测模型进行优化。
[0015]一方面,本专利技术实施例提供了一种图结构估计模型的训练设备,其特征在于,包括:处理器,适用于实现一条或多条计算机程序;以及计算机存储介质,计算机存储介质存储有一条或多条计算机程序,一条或多条计算机程序适于由处理器加载并执行:
[0016]获取初始图以及所述初始图对应的标签信息;所述初始图包含多个节点,所述标签信息用于指示所述初始图中目标节点所属类别,所述目标节点为所述初始图的多个节点中任意一个或多个;调用图结构估计模型包括的图预测模型对所述初始图进行预测处理,得到所述初始图对应的观测信息;调用所述图结构估计模型包括的图估计器基于所述标签信息和所述观测信息进行估计处理得到估计图;并调用所述图预测模型对所述估计图进行预测处理,得到所述估计图对应的预测信息,所述估计图对应的预测信息用于指示所述估计图中各个节点所属类别;基于所述估计图对应的预测信息和所述标签信息对所述图预测模型进行优化。
[0017]一方面,本专利技术实施例提供了一种计算机存储介质,计算机存储介质存储有计算机程序,计算机程序被处理器执行时,用于执行:
[0018]获取初始图以及所述初始图对应的标签信息;所述初始图包含多个节点,所述标签信息用于指示所述初始图中目标节点所属类别,所述目标节点为所述初始图的多个节点中任意一个或多个;调用图结构估计模型包括的图预测模型对所述初始图进行预测处理,得到所述初始图对应的观测信息;调用所述图结构估计模型包括的图估计器基于所述标签信息和所述观测信息进行估计处理得到估计图;并调用所述图预测模型对所述估计图进行预测处理,得到所述估计图对应的预测信息,所述估计图对应的预测信息用于指示所述估计图中各个节点所属类别;基于所述估计图对应的预测信息和所述标签信息对所述图预测模型进行优化。
[0019]一方面,本专利技术实施例提供了一种计算机程序产品或计算机程序,计算机程序产品包括计算机程序,计算机程序存储在计算机存储介质中;模型处理设备的处理器从计算机存储介质中读取计算机程序,处理器执行计算机程序,使得模型处理设备执行:
[0020]获取初始图以及所述初始图对应的标签信息;所述初始图包含多个节点,所述标签信息用于指示所述初始图中目标节点所属类别,所述目标节点为所述初始图的多个节点中任意一个或多个;调用图结构估计模型包括的图预测模型对所述初始图进行预测处理,得到所述初始图对应的观测信息;调用所述图结构估计模型包括的图估计器基于所述标签信息和所述观测信息进行估计处理得到估计图;并调用所述图预测模型对所述估计图进行预测处理,得到所述估计图对应的预测信息,所述估计图对应的预测信息用于指示所述估计图中各个节点所属类别;基于所述估计图对应的预测信息和所述标签信息对所述图预测
模型进行优化。
[0021]本专利技术实施例中,提出了一种新对图进行处理的模型,即图结构估计模型,该图结构估计模型由图预测模型和图估计器组成。在对图结构估计模型进行优化的过程中,可调用图结构估计模型中的图预测模型对初始图进行预测处理,得到所述初始图对应的观测信息,所述观测信息包括所述初始图对应的预测信息;然后调用图估计器基于所述标签信息和所述观测信息进行估计处理得到估计图;进一步的,调用所述图预测模型对所述估计图进行预测处理,得到所述估计图对应的预测信息;基于所述估计图对应的预测信息和所述初始图对应的标签信息对所述图预测模型进行优化。
[0022]通过上述过程可见,对图预测模型的优化不仅仅是简单的基于初始图和初始图对应的标签信息,还要基于估计图对图预测模型进行优化。该估计图是图估计器基于图预测模型对初始图进行预测得到的观测信息进行估计得到的。换句话说,该估计图是在图预测模型的角度对初始图进行观测得到本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图结构估计模型的训练方法,其特征在于,包括:获取初始图以及所述初始图对应的标签信息;所述初始图包含多个节点,所述标签信息用于指示所述初始图中目标节点所属类别,所述目标节点为所述初始图的多个节点中任意一个或多个;调用图结构估计模型包括的图预测模型对所述初始图进行预测处理,得到所述初始图对应的观测信息;调用所述图结构估计模型包括的图估计器基于所述标签信息和所述观测信息进行估计处理得到估计图;并调用所述图预测模型对所述估计图进行预测处理,得到所述估计图对应的预测信息,所述估计图对应的预测信息用于指示所述估计图中各个节点所属类别;基于所述估计图对应的预测信息和所述标签信息对所述图预测模型进行优化。2.如权利要求1所述的方法,其特征在于,所述基于所述估计图对应的预测信息和所述标签信息对所述图预测模型进行优化后,所述方法还包括:若未检测到结束训练事件,则获取调用所述图预测模型对所述估计图进行预测处理过程中得到的所述估计图对应的观测信息;调用所述图估计器基于所述标签信息和所述估计图对应的观测信息进行估计处理得到新的估计图,并调用优化后的图预测模型对所述新的估计图进行预测处理,得到所述新的估计图对应的预测信息,所述新的估计图对应的预测信息用于指示所述新的估计图中各个节点所属类别;基于所述新的估计图对应的预测信息和所述标签信息对所述优化后的图预测模型进行更新。3.如权利要求1所述的方法,其特征在于,所述观测信息包括所述初始图对应的预测信息和所述初始图对应的观测图集合,所述初始图对应的预测信息用于所述观测信息,所述观测图集合中包括所述初始图和所述初始图对应的邻居图集合;所述图预测模型包括第一个卷积层和第二个卷积层,所述调用所述图结构估计模型包括的图预测模型对所述初始图进行预测处理,得到所述初始图对应的观测信息,包括:获取所述初始图的节点特征矩阵,并将所述节点特征矩阵输入至所述第一个卷积层以基于所述第一个卷积层对应的第一权重参数进行卷积运算,得到第一个卷积层对应的节点表示矩阵;将所述第一个卷积层对应的节点表示矩阵输入至所述第二个卷积层以基于所述第二个卷积层对应的第二权重参数进行卷积运算,得到第二个卷积层对应的节点表示矩阵;对所述第二个卷积层对应的节点表示矩阵进行归一化处理得到所述初始图对应的预测信息;基于所述第一个卷积层对应的节点表示矩阵构造第一邻居图,以及基于所述第二个卷积层对应的节点表示矩阵构造第二邻居图,并基于所述初始图的节点特征矩阵构建目标邻居图;将所述第一邻居图、所述第二邻居图以及所述目标邻居图组成所述邻居图集合。4.如权利要求3所述的方法,其特征在于,所述图估计器包括结构子模型和观测子模型,所述调用所述图结构估计模型包括的图估计器基于所述标签信息和所述观测信息进行估计处理得到估计图,包括:
调用所述结构子模型基于所述标签信息和所述初始图对应的观测信息中所述初始图对应的预测信息生成N个候选图,N为大于等于1的整数;并基于所述结构子模型的第一参数和所述N个候选图中每个候选图对应的邻接矩阵确定相应候选图对应的生成概率;调用所述观测子模型基于所述观测子模型的第二参数、所述初始图对应的观测信息以及所述每个候选图对应的邻接矩阵,计算相应候选图对应的观测信息存在概率;其中,所述候选图m对应的观测信息存在概率用于表示当所述候选图m作为所述估计图时,所述观测信息存在的概率,m大于等于1且小于等于N;基于每个候选图对应的生成概率和每个候选图对应的观测信息存在概率进行图估计得到估计邻接矩阵,并根据所述估计邻接矩阵生成所述估计图。5.如权利要求4所述的方法,其特征在于,所述N个候选图包括第一候选图,所述调用所述观测子模型基于所述观测子模型的第二参数、所述初始图对应的观测信息以及所述每个候选图对应的邻接矩阵,计算相应候选图对应的观测信息存在概率,包括:获取所述观测信息包括的数据的总数量,以及根据所述第二参数确定观测概率参数;获取所述观测信息中指示节点i和节点j之间存在边的数据的第一数量,以及根据所述第一数量和所述总数量确定所述观测信息中指示节点i和节点j之间不存在边的数据的第二数量;其中,节点i和节点j为所述第一候选图包括的任意两个节点且i小于j;根据所述观测概率参数、所述第一数量以及所述第二数量计算所述节点i和节点j间的边相关概率;将所述第一候选图中每两个节点间的边相关概率进行相乘运算,得到所述第一候选图对应的观测信息存在概率。6.如权利要求5所述的方法,其特征在于,所述观测概率参数包括第一类参数、第二类参数、第三类参数以及第四类参数;其中,所述第一类参数是指当节点i和节点j之间存在边时,所述观测集合中任一数据指示所述节点i和节点j之间边存在的概率;所述第二类参数是指当节点i和节点j之间存在边时,所述观测集合中任一数据指示所述节点i和节点j之间边不存在的概率;所述第三类参数是指当节点i和节点j之间不存在边时,所述观测集合中任一数据指示所述节点i和节点j之间边不存在的概率,所述第四类参数是指当节点i和节点j之间不存在边时,所述观测集合中任一数据指示所述节点i和节点j之间边存在的概率。7.如权利要求4所述的方法,其特征在于,所述N个候选图中包括第一候选图和第二候选图,所述基于每个候选图对应的生成概率和每个候选图对应的观测信息存在概率进行图估计得到估计邻接矩阵,包括:获取所述第一参数的概率...

【专利技术属性】
技术研发人员:王啸王睿嘉牟帅石川肖万鹏鞠奇
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1