【技术实现步骤摘要】
一种基于跨粒度联合训练的图对比表征学习方法及系统
[0001]本专利技术涉及图对比表征学习
,特别是涉及一种基于跨粒度联合训练的图对比表征学习方法及系统。
技术介绍
[0002]数据结构中的图(graph)由节点和边构成。带有边和节点的图数据作为一种可以表达大量信息的数据结构,可用来存储各种领域的数据,包括社会网络、物理系统、蛋白质
‑
蛋白质交互网和常识图。研究人员可以在图上进行很多图分析任务,包括图数据(如生物、化学分子、社交网络等)的链接预测、节点分类、图分类和聚类等。因此,如何在图数据上进行高效学习已经引起了研究人员越来越多的关注,而图表示学习(图表征学习)是一种分析图数据的强大的工具。
[0003]以往的图学习模型(图表征学习模型)大多以监督或半监督的方式进行训练,这在很大程度上依赖于人工注释的数据集质量,使得这些方法在现实场景中的应用面临挑战,尤其是那些需要专家知识的场景,如医学和化学领域,并面临着过拟合、鲁棒性差、泛化能力弱等问题。因此,无需人工标注数据集的无监督图学习,尤其是自监 ...
【技术保护点】
【技术特征摘要】
1.一种基于跨粒度联合训练的图对比表征学习方法,其特征在于,所述方法包括:获取训练图数据;所述训练图数据包括训练图的特征矩阵和邻接矩阵;根据所述训练图数据得到节点级特征和图级特征;根据所述节点级特征和所述图级特征得到融合特征;根据所述融合特征和所述邻接矩阵得到融合图数据;所述融合图数据包括所述融合特征和所述邻接矩阵;分别采用第一扰动方案和第二扰动方案对所述融合图数据进行扰动,得到第一扰动后的融合图数据和第二扰动后的融合图数据;所述扰动方案包括边扰动和节点特征扰动;所述扰动后的融合图数据包括扰动后的融合特征和扰动后的邻接矩阵;利用所述第一扰动后的融合图数据和所述第二扰动后的融合图数据对图学习模型进行训练和优化,得到优化后的图学习模型;所述优化后的图学习模型的输入为第一扰动后的融合图数据和第二扰动后的融合图数据;所述优化后的图学习模型的输出为第一特征向量和第二特征向量;将待表征学习图数据对应的第一扰动后的融合图数据和第二扰动后的融合图数据输入所述优化后的图学习模型中,得到待表征学习图数据对应的第一特征向量和第二特征向量。2.根据权利要求1所述的基于跨粒度联合训练的图对比表征学习方法,其特征在于,所述根据所述训练图数据得到节点级特征和图级特征,具体包括:根据所述训练图数据得到每个节点对应的节点级特征;针对每一节点,将所述节点的邻接节点对应的节点级特征相加后求平均,得到所述节点对应的图级特征。3.根据权利要求1所述的基于跨粒度联合训练的图对比表征学习方法,其特征在于,所述根据所述节点级特征和所述图级特征得到融合特征,具体包括:对所述节点级特征和所述图级特征进行拼接操作,得到融合特征。4.根据权利要求1所述的基于跨粒度联合训练的图对比表征学习方法,其特征在于,所述边扰动具体包括:获取随机采样矩阵;所述随机采样矩阵与所述邻接矩阵的行数和列数均相同;所述随机采样矩阵由0和1构成;所述随机采样矩阵中的每个元素均遵循伯努利分布;利用Hadamard积,将所述邻接矩阵乘以所述随机采样矩阵,得到扰动后的邻接矩阵。5.根据权利要求1所述的基于跨粒度联合训练的图对比表征学习方法,其特征在于,所述节点特征扰动具体包括:获取随机采样向量;所述随机采样向量由0和1构成;所述随机采样向量的维度与所述融合特征的维度相同;所述随机采样向量的每个维度均是以设定概率从伯努利分布中抽取;利用Hadamard积,将所述融合特征乘以所述随机采样向量,得到扰动后的融合特征。6.根据权利要求1所述的基于跨粒度联合训练的图对比表征学习方法,其特征在于,所述图学习模型具体包括第一图卷积神经网络、第二图卷积神经网络、第一双层感知机、第二双层感知机和对比损失函数;所述第一双层感知机与所述第一...
【专利技术属性】
技术研发人员:孙成宇,迟令,胡亮,李宏图,李帅,李拓航,
申请(专利权)人:吉林大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。