【技术实现步骤摘要】
一种基于充分展开的材料图神经网络的分层解释方法
[0001]本专利技术涉及深度学习领域,具体涉及一种基于充分展开的材料图神经网络的分层解释方法
。
技术介绍
[0002]深度学习技术正在改观大数据研究领域的预测分析,并且已经在图像和语音识别
、
知识问答
、
机器翻译以及其他很多应用领域取得了重大突破
。
通常,深度学习方法是将输入数据经由多层神经网络结构,如前馈神经网络
、
卷积神经网络
(CNN)、
循环神经网络
(RNN)
等,通过多次的迭代训练,最终得到学习模型
。
[0003]近年来,随着机器学习领域的不断发展,图神经网络
(Graph Neural Networks
,
GNNs)
已成为一种非常有前景的技术
。
它们在各种领域的成功应用,如化学
、
材料科学和金融等,使得
GNNs
成为了机器学习工具箱中的热门工具
。
然而,正如很多深度学习模型一样,
GNNs
也面临一个严重的问题,即“黑匣子问题”。
[0004]“黑匣子问题”指的是机器学习模型的内部工作方式很难解释和理解
。
尽管这些模型在许多任务中表现出色,但用户和研究者往往难以了解它们如何作出特定的预测或决策
。
这一不透明性可能会带来信任问题,特别是在关键领域如化学
...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.
一种基于充分展开的材料图神经网络的分层解释方法,其特征在于:包括五个步骤:步骤1,准备具有分层可解释性质的分子性能预测复杂学习任务,把层次领域知识编码为层次知识树,用来表示输入图数据的分层解释约束,复现主流的图神经网络模型,使用训练集和验证集对该模型进行训练,再使用训练好的模型在测试集上进行预测,得到预测结果;步骤2,对每层结构初始化一个粗化结构的特征提取器,提取每层结构的粗化表示,所述粗化模块是一个深度神经网络,汇聚待解释
GNN
对其组成结构的编码表示,学到代表整个聚类的特征;步骤3,对每层图结构初始化一个计算聚类单元重要性的权重分配模块,并通过子图采样来生成候选的分层可解释子图,子图采样涉及重参数化技巧,通过放松,把子图搜索的
NP
问题变为采样分布估计问题,并引入温度参数来控制对离散采样的近似程度;步骤4,基于表示学习的相关概念,设计充分展开方法,把粗化结构的可解释子图,映射到输入子图中的完整组成特征输入到待解释
GNN
中来计算预测的变化,进而通过梯度下降来优化每层结构的粗化模块与权重分配模块,通过对所有数据进行循环迭代训练,直到结果收敛;步骤5,结合步骤2和步骤3中训练好的粗化模块与权重分配模块,生成输入图结构的层次重要性排序,根据领域知识对重要成分依次进行可视化分析,进行技术验证
GNN
的预测过程能否重建领域知识
。2.
如权利要求1所述的一种基于充分展开的材料图神经网络的分层解释方法,其特征在于:步骤1中的所述层次知识树表示为聚类树,由一系列聚类分配矩阵定义,其中表示图的第
l
层聚类图数据
G
(l)
的节点集合,表示原始图节点
v
i
属于第
l
层图的集群节点否则为
0。3.
如权利要求2所述的一种基于充分展开的材料图神经网络的分层解释方法,其特征在于:步骤2在由
GNN
模型生成的节点嵌入
Z
=
f
emb
(G
,
X)
的基础上,首先学习一个粗化模块该模块汇聚了每个高级别聚类的表示,并获得其特征嵌入其中是第
l
层次图中聚类的数量,
h
*
表示粗化模块的输出嵌入大小,具体表示为:其中是一个由
技术研发人员:季煜文,时磊,刘志盟,王戈,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。