分子性质预测方法、装置、设备、介质及产品制造方法及图纸

技术编号:37183425 阅读:18 留言:0更新日期:2023-04-20 22:48
本申请适用于人工智能技术领域,提供一种分子性质预测方法、装置、设备、介质及产品,其中方法包括:基于第一分子数据集进行分子特征提取,得到第一特征提取结果;基于所述第一特征提取结果,进行分子物化性质预测,得到第一物化性质预测结果。物化性质预测结果。物化性质预测结果。

【技术实现步骤摘要】
分子性质预测方法、装置、设备、介质及产品


[0001]本申请属于人工智能
,尤其涉及一种分子性质预测方法、装置、设备、介质及产品。

技术介绍

[0002]能源材料小分子的各项物化性能长期以来依赖实验测试,消耗大量的实验资源。随着高性能计算技术的发展,科学计算模拟成为获取小分子物化性能数据的重要手段,例如通过科学计算模拟得到小分子的电导率等物化性能。
[0003]但面对海量小分子数据进行科学计算模拟时,如何提高计算效率,缩减计算周期,成为这一阶段需要解决的技术问题。

技术实现思路

[0004]本申请实施例提供了一种分子性质预测方法、装置、设备、介质及产品,以解决如何提高对海量小分子数据科学计算模拟的计算效率,缩减计算周期的问题。
[0005]本申请实施例的第一方面提供了一种分子性质预测方法,包括:
[0006]基于第一分子数据集进行分子特征提取,得到第一特征提取结果;
[0007]基于所述第一特征提取结果,进行分子物化性质预测,得到第一物化性质预测结果。
[0008]本申请实施例的技术方案中,将科学计算模拟过程转化成模型化的数据处理流程,引入对数据集合中分子数据的特征提取及在特征提取基础上实施分子物化性质预测的处理手段,提升海量分子数据的物化性质预测效率,缩减计算周期。
[0009]在一些实施例中,所述基于第一分子数据集进行分子特征提取,得到第一特征提取结果,包括:
[0010]从所述第一分子数据集中提取分子构型信息对应的信息文本;
[0011]基于所述信息文本进行特征提取,得到所述分子构型信息对应的特征向量表示;
[0012]将所述特征向量表示确定为所述第一特征提取结果。
[0013]该处理过程,将分子构型信息对应的信息文本作为特征提取对象,实施特征提取处理,提升分子构型特征提取的可实现性及特征提取效率。
[0014]在一些实施例中,所述基于所述第一特征提取结果,进行分子物化性质预测,得到第一物化性质预测结果,包括:
[0015]基于所述第一特征提取结果,计算特征提取结果在设定分子物化性质的概率分布,得到所述第一物化性质预测结果。
[0016]该过程,通过计算概率分布,利于对物化性质预测结果进行置信度评估,提升预测结果的可解释性及可信度。
[0017]在一些实施例中,所述基于所述第一特征提取结果,计算特征提取结果在设定分子物化性质的概率分布,得到所述第一物化性质预测结果,包括:
[0018]基于所述第一特征提取结果,通过高斯过程回归计算特征提取结果在设定分子物化性质的概率分布,得到所述第一物化性质预测结果。
[0019]该过程,通过引入高斯过程回归实施物化性质预测处理,提升物化性质预测结果的可解释性及可量化性。
[0020]在一些实施例中,所述基于第一分子数据集进行分子特征提取,得到第一特征提取结果之前,还包括:
[0021]对预构建的分子构型文件进行格式转化,得到分子构型信息对应的信息文本;
[0022]基于所述信息文本,生成所述第一分子数据集。
[0023]这样,实现对分子构型数据的文本化转换,确保后续分子构型特征提取的可实现性及特征提取效率。
[0024]在一些实施例中,所述基于所述信息文本,生成所述第一分子数据集,包括:
[0025]标记所述分子构型文件中构型重复的目标分子;
[0026]根据所述目标分子对所述信息文本进行去重,生成包含去重后的所述信息文本的所述第一分子数据集。
[0027]这样,实现对分子构型信息对应的信息文本的构型去重。
[0028]在一些实施例中,所述基于第一分子数据集进行分子特征提取,得到第一特征提取结果由分子性质预测模型中的第一模型部分实施;
[0029]所述基于所述第一特征提取结果,进行分子物化性质预测,得到第一物化性质预测结果由所述分子性质预测模型中的第二模型部分实施。
[0030]该过程,通过分子性质预测模型实施分子性质预测方法,将分子性质预测方法与人工智能模型进行结合,将分子构效关系模型化,自动实施分子性质预测方法的处理流程,进而提升海量分子数据的物化性质预测效率,缩减计算周期。
[0031]在一些实施例中,所述方法还包括:
[0032]基于目标分子训练样本,对所述分子性质预测模型进行模型训练,直至所述分子性质预测模型满足设定的收敛条件。
[0033]该过程,通过对模型进行预训练,确保分子性质预测模型学习到分子构型与分子物化性质之间的映射关系,使得模型构建成为一个分子构效关系模型,确保模型实施分子性质预测方法的有效性。
[0034]在一些实施例中,所述基于目标分子训练样本,对所述分子性质预测模型进行模型训练,直至所述分子性质预测模型满足设定的收敛条件,包括:
[0035]基于预训练的所述第一模型部分对所述目标分子训练样本进行特征提取,得到分子样本特征;
[0036]基于所述分子样本特征对所述第二模型部分进行训练,直至所述第二模型部分满足设定的所述收敛条件。
[0037]这样,确保在模型训练的初始阶段,特征提取结果具备可靠的精度,提升模型整体训练精度及训练效率。
[0038]在一些实施例中,所述基于所述分子样本特征对所述第二模型部分进行训练之后,还包括:
[0039]在所述第二模型部分满足设定的所述收敛条件的情况下,从第二分子数据集中选
取多个目标分子数据;
[0040]基于多个所述目标分子数据,生成所述目标分子训练样本;
[0041]返回执行所述基于预训练的所述第一模型部分对所述目标分子训练样本进行特征提取,得到分子样本特征的步骤,直至所述第二模型部分满足设定的所述收敛条件。
[0042]该过程,以单次较少的训练所需样本实施多轮次的模型训练,提高模型训练效率及缩短模型训练周期。
[0043]在一些实施例中,所述从第二分子数据集中选取多个目标分子数据,包括:
[0044]基于所述第一模型部分,对所述第二分子数据集划分出的多个数据集合分别进行分子特征提取,得到第二特征提取结果;
[0045]基于所述第二模型部分,对所述第二特征提取结果进行分子物化性质预测,得到第二物化性质预测结果;
[0046]基于所述第二分子性质预测结果从多个所述数据集合中选取目标集合;
[0047]将所述目标集合中包含的多个分子数据确定为所述目标分子数据。
[0048]该实施过程,基于满足收敛条件的训练后模型持续从分子数据集中选取不同批次的少量样本持续实施模型优化训练,提高模型训练效率,缩短模型训练周期。
[0049]在一些实施例中,所述基于所述第二分子性质预测结果从多个所述数据集合中选取目标集合,包括:
[0050]基于所述第二分子性质预测结果,对每一所述数据集合进行打分,得到集合分值;
[0051]基于所述集合分值,从多个所述数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分子性质预测方法,其特征在于,包括:基于第一分子数据集进行分子特征提取,得到第一特征提取结果;基于所述第一特征提取结果,进行分子物化性质预测,得到第一物化性质预测结果。2.根据权利要求1所述的方法,其特征在于,所述基于第一分子数据集进行分子特征提取,得到第一特征提取结果,包括:从所述第一分子数据集中提取分子构型信息对应的信息文本;基于所述信息文本进行特征提取,得到所述分子构型信息对应的特征向量表示;将所述特征向量表示确定为所述第一特征提取结果。3.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征提取结果,进行分子物化性质预测,得到第一物化性质预测结果,包括:基于所述第一特征提取结果,计算特征提取结果在设定分子物化性质的概率分布,得到所述第一物化性质预测结果。4.根据权利要求3所述的方法,其特征在于,所述基于所述第一特征提取结果,计算特征提取结果在设定分子物化性质的概率分布,得到所述第一物化性质预测结果,包括:基于所述第一特征提取结果,通过高斯过程回归计算特征提取结果在设定分子物化性质的概率分布,得到所述第一物化性质预测结果。5.根据权利要求1所述的方法,其特征在于,所述基于第一分子数据集进行分子特征提取,得到第一特征提取结果之前,还包括:对预构建的分子构型文件进行格式转化,得到分子构型信息对应的信息文本;基于所述信息文本,生成所述第一分子数据集。6.根据权利要求5所述的方法,其特征在于,所述基于所述信息文本,生成所述第一分子数据集,包括:标记所述分子构型文件中构型重复的目标分子;根据所述目标分子对所述信息文本进行去重,生成包含去重后的所述信息文本的所述第一分子数据集。7.根据权利要求1至6任一项所述的方法,其特征在于,所述基于第一分子数据集进行分子特征提取,得到第一特征提取结果由分子性质预测模型中的第一模型部分实施;所述基于所述第一特征提取结果,进行分子物化性质预测,得到第一物化性质预测结果由所述分子性质预测模型中的第二模型部分实施。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:基于目标分子训练样本,对所述分子性质预测模型进行模型训练,直至所述分子性质预测模型满足设定的收敛条件。9.根据权利要求8所述的方法,其特征在于,所述基于目标分子训练样本,对所述分子性质预测模型进行模型训练,直至所述分子性质预测模型满足设定的收敛条件,包括:基于预训练的所述第一模型部分对所述目标分子训练样本进行特征提取,得到分子样本特征;基于所述分子样本特征对所述第二模型部分进行训练,直至所述第二模型部分满足设定的所述收敛条件。
10.根据权利要求9所述的方...

【专利技术属性】
技术研发人员:杨一方赵旭山徐波丁则锐张倩
申请(专利权)人:宁德时代新能源科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1