当前位置: 首页 > 专利查询>清华大学专利>正文

解离化自监督图表征学习方法、装置、设备及存储介质制造方法及图纸

技术编号:31161205 阅读:26 留言:0更新日期:2021-12-04 10:29
本申请实施例涉及数据处理技术领域,具体涉及一种解离化自监督图表征学习方法、装置、设备及存储介质。旨在提高图表征提取任务的准确度。具体步骤包括:对待输入的多个图结构中的每个图结构进行预处理,得到每个图结构对应的处理后的图结构;将每个图结构与其对应的处理后的图结构输入图表征网络中,得到每个图结构与其对应的处理后的图结构的多通道图表征;统一图多通道表征的维度;对多通道图表征进行实例判别,得到正样本表征之间的相似度;根据正样本表征之间的相似度,得到统一的正样本表征的相似性得分;根据统一的正样本表征的相似性得分,对图表征网络的参数进行调整,得到训练好的图表征网络。练好的图表征网络。练好的图表征网络。

【技术实现步骤摘要】
解离化自监督图表征学习方法、装置、设备及存储介质


[0001]本申请实施例涉及数据处理
,具体而言,涉及一种解离化自监督图表征学习方法、装置、设备及存储介质。

技术介绍

[0002]现实生活中有很多领域需要使用到图结构数据,例如社交网络,交通网络,生物网络等。为了将图结构数据更好的应用于各个领域中,需要对图结构数据的表征进行研究。现有的图结构数据表征的方法中,一种是使用图神经网络对图表征进行监督学习,另一种是使用图神经网络进行非监督的图表征学习通过该学习方法可以得到图结构的整体图表征,还有一种方法是使用图神经网络进行自监督学习,这三种方法都可以得到图结构数据的整体的图表征。
[0003]显示中每个图结构数据中都包含了大量的隐藏因子,通过现有的学习方法训练出的模型,都只能得到图结构数据的整体的向量化表征,众多隐藏因子耦合在表征中,没有对不同隐藏因子下的表征进行区分,因此影响了图结构表征的准确性,导致使用该模型进行下游任务时的准确性不高,模型的性能不够好。

技术实现思路

[0004]本申请实施例提供一种解离化自监督图表本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种解离化自监督图表征学习方法,所述方法包括:对待输入的多个图结构中的每个图结构进行预处理,得到所述每个图结构对应的处理后的图结构;将所述每个图结构与其对应的处理后的图结构输入图表征网络中,所述图表征网络根据每个通道中的隐藏因子对输入的数据进行特征提取,得到所述每个图结构与其对应的处理后的图结构的多通道图表征;对所述多通道图表征进行维度变换,得到统一维度的多通道图表征;对所述统一维度的多通道图表征进行实例判别,得到每个隐藏因子下的图结构的正样本表征之间的相似度;根据所述每个隐藏因子下的图结构的正样本表征之间的相似度,得到统一的正样本表征的相似性得分;根据所述统一的正样本表征的相似性得分,对所述图表征网络的参数进行调整,得到训练好的图表征网络。2.根据权利要求1所述的方法,其特征在于,对待输入的多个图结构中的每个图结构进行预处理,得到所述每个图结构对应的处理后的图结构,包括:对所述每个图结构上的节点特征进行概率扰动;对所述每个图结构上的节点进行随机删除,对节点之间的边进行随机增删操作,得到所述每个图结构对应的处理后的图结构。3.根据权利要求1所述的方法,其特征在于,将所述每个图结构与其对应的处理后的图结构输入图表征网络中,所述图表征网络根据每个通道中的隐藏因子对输入的数据进行特征提取,得到所述每个图结构与其对应的处理后的图结构的多通道图表征,包括:对所述每个图结构与其对应的处理后的图结构中的节点信息进行领居聚合,利用每个节点的邻居信息对节点进行更新,得到更新后的图结构与其对应的处理后的图结构;将所述更新后的图结构与其对应的处理后的图结构输入多个通道中进行节点信息总结,得到所述图结构与其对应的处理后的图结构的多通道图表征;其中,所述多个通道中的每个通道负责总结来自不同隐藏因子的图结构的节点信息。4.根据权利要求1所述的方法,其特征在于,对所述多通道图表征进行维度变换,得到统一维度的多通道图表征,包括:将所述多通道图表征输入多层感知机中;通过所述多层感知机中的全连接层,将所述多通道图表征映射到同一维度中,得到所述统一维度的多通道图表征。5.根据权利要求1所述的方法,其特征在于,对所述统一维度的多通道图表征进行实例判别,得到每个隐藏因子下的图结构的正样本表征之间的相似度,包括:在所述每个隐...

【专利技术属性】
技术研发人员:朱文武王鑫李昊阳
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1