【技术实现步骤摘要】
结构数据的生成方法、装置、设备、介质及程序产品
[0001]本申请涉及人工智能领域,特别涉及一种结构数据的生成方法、装置、设备、介质及程序产品。
技术介绍
[0002]随着人工智能(Artificial Intelligence,AI)的发展,AI应用于越来越多的领域中,其中,在智能医疗领域中,AI可驱动药物发现,协助专业人员研发新药。
[0003]在相关技术中,可以将化学分子结构映射生成对应的图结构的分子图,然后通过图卷积神经网络(Graph Convolutional Network,GCN),基于消息传播过程来学习这些分子图,再通过GCN生成新的特征表示,在决策过程中,根据新的特征表示对应的新结构以符合有机分子化学规则的形式,添加到现有图中,得到新分子对应的分子图。
[0004]然而,在上述新分子的结构生成过程中,由于GCN的低通特性将表征分子的图数据平滑化,以致解码时无法重建完备的原始信号,最终导致生成分子多样性和有效性不足,生成效率低。
技术实现思路
[0005]本申请实施例提供了一 ...
【技术保护点】
【技术特征摘要】
1.一种结构数据的生成方法,其特征在于,所述方法包括:获取样本结构数据的结构特征表示和节点特征表示,所述结构特征表示用于指示组成所述样本结构数据的节点之间的连接情况,所述节点特征表示用于指示所述组成所述样本结构数据的节点对应的节点类型;基于所述结构特征表示和所述节点特征表示,生成隐层特征表达,所述隐层特征表达用于指示在至少两个频带上所述样本结构数据中节点之间的结合情况;将所述隐层特征表达输入至待训练解码器中进行结构重建,得到预测结构数据,所述预测结构数据用于对所述待训练解码器进行训练,得到目标解码器,所述目标解码器用于对输入的采样数据进行结构重建得到目标结构数据,所述采样数据为对目标数据分布的候选数据进行采样得到的数据。2.根据权利要求1所述的方法,其特征在于,所述基于所述结构特征表示和所述节点特征表示,生成隐层特征表达,包括:基于所述结构特征表示和所述节点特征表示在所述至少两个频带上分别编码得到中间特征数据,所述中间特征数据用于指示所述样本结构数据在对应的频带上节点之间的结合情况;基于所述目标数据分布对所述至少两个频带分别对应的所述中间特征数据进行聚合,得到所述隐层特征表达。3.根据权利要求2所述的方法,其特征在于,所述基于所述结构特征表示和所述节点特征表示在所述至少两个频带上分别编码得到中间特征数据,包括:将所述结构特征表示和所述节点特征表示输入至待训练编码器中,根据所述结构特征表示和所述节点特征表示之间的概率分布情况,输出所述至少两个频带分别对应的所述中间特征数据,所述中间特征数据为由所述待训练编码器编码得到的编码结果。4.根据权利要求2所述的方法,其特征在于,所述至少两个频带包括目标频带;所述基于所述结构特征表示和所述节点特征表示在所述至少两个频带上分别编码得到中间特征数据,包括:基于所述结构特征表示和所述节点特征表示获取所述样本结构数据的节点在所述至少两个频带上分别对应的特征空间中的节点特征向量;获取所述至少两个频带对应的所述节点特征向量之间的均值数据和方差数据;将所述均值数据和所述方差数据确定为所述中间特征数据。5.根据权利要求1至4任一所述的方法,其特征在于,所述将所述隐层特征表达输入至待训练解码器中进行结构重建,得到预测结构数据,包括:通过所述待训练解码器对所述隐层特征表达通过卷积进行结构重建,获取解码结构特征表示和解码节点特征表示;基于所述解码结构特征表示和所述解码节点特征表示,生成所述预测结构数据。6.根据权利要求1至4任一所述的方法,其特征在于,所述方法还包括:基于所述样本结构数据和所述预测结构数据之间的差异情况,得到训练损失值;响应于所述训练损失值达到目标损失阈值,确定所述待训练解码器训练完成,得到所述目标解码器;或者,响应于所述训练损失值与所述目标损失阈值匹配失败,对所述待训练解码器对应的模型参数进行迭代训练。
7.根据权利要求6所述的方法,其特征在于,所述基于所述样本结构数据和所述预测结构数据之间的差异情况,得到训练损失值,包括:获取所述样本结构数据和所述预测结构数据在特征空间中的距离度量数据;获取所述预测结构数据对应的节点分布和所述目标数据分布之间的散度数据,所述节点分布用于指示所述预测结构数据在所述特征空间中节点特征向量的分布情况;基于所述距离度量数据和所述散度数据得到所述训练损失...
【专利技术属性】
技术研发人员:李蓝青,高子琪,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。