当前位置: 首页 > 专利查询>季华实验室专利>正文

发光材料性质预测方法、系统、电子设备和存储介质技术方案

技术编号:30273071 阅读:13 留言:0更新日期:2021-10-09 21:30
本发明专利技术涉及数据处理技术领域,尤其涉及一种发光材料性质预测方法、系统、电子设备和存储介质,发光材料性质预测方法包括:对无标签的发光材料分子数据进行节点层面的预训练,训练结果作为第一编码器;第一编码器对无标签的发光材料分子数据进行编码,标签从无的发光材料分子数据中抽取出发光材料分子中预定义的官能团,对所述官能团进行分组并组成序列,将序列作为自监督学习的标签进行训练,训练结果作为第二编码器;使用所述第二编码器对待预测的发光材料分子数据进行编码,对待预测的发光材料的性质进行预测。本发明专利技术通过设计节点层面和图层面的建模方法,让分子结构更好地被表征,解决了现有方法中出现的特征丢失问题。解决了现有方法中出现的特征丢失问题。解决了现有方法中出现的特征丢失问题。

【技术实现步骤摘要】
发光材料性质预测方法、系统、电子设备和存储介质


[0001]本专利技术涉及数据处理
,尤其涉及一种发光材料性质预测方法、系统、电子设备和存储介质。

技术介绍

[0002]有机电致发光材料(以下简称发光材料)指在电场作用下能发出光的高分子或小分子有机材料。基于电子给体(Donor)和电子受体(Acceptor)形成的有机发光分子在有机电致发光材料领域里具有非常重要的地位。给

受体型有机发光分子特有的电荷转移特性,使其成为调控分子激发态特性的理想体系,基于给体单元和受体单元的分子设计,可实现较小的单线态

三线态能极差,进而实现100%的激子利用率。传统的方法会在实验室由给体和受体合成发光材料,在获得分子的基础上,进而验证分子发光的性质。凭借实验研发人员的个人经验,可以优先选择可能性更大的给体和受体,减少实验的次数。
[0003]然而基于传统方法的有机电致发光材料性质检测需要耗费大量的人力、物力、财力,并且极其依靠一些进口设备。比如如果有100个给体和100个受体,则至少有10000中组合方式,依次实验验证需要耗费大量的时间。即使依靠一些研发人员的个人经验能够选出效果更好地给体和受体,但是依靠个人经验的方法不能大范围推广。
[0004]随着机器学习技术在全世界范围内的发展,各个研究领域均开始不同程度地应用机器学习技术。面对一些传统的问题,机器学习从统计、数学、计算机的思路出发,为许多传统学科提供了新的思路,并且取得了一定成果,比如遥感领域、医学图像领域、代码安全领域等。所以也出现了一系列基于机器学习方法的预测材料性质的技术。然而这些技术虽然已经引入了深度学习的方法加速材料预测的进度,但是该方法严重依赖有限元模型生成的材料性能关系表,如果待预测的材料性能不具有高质量的数据,则几乎不能预测,不具有推广性。该技术方法的预测准确率只能保持在30%左右,虽然加速了性质预测的速度,但是在预测的精准度方法还有待提升。
[0005]综上所述,现有的发光材料性质预测技术具有人工试验成本过高、预测模型过于依赖人工标注、预测准确率过低的缺点,分子结构建模较为粗糙等缺点。

技术实现思路

[0006]本专利技术的目的在于提供一种发光材料性质预测方法,旨在解决现有技术中预测准确率过低、分子结构建模粗糙的缺陷。
[0007]为了实现上述目的,本专利技术提供的技术方案为:一种发光材料性质预测方法,包括:第一预训练步骤:对无标签的发光材料分子数据进行节点层面的预训练,训练结果作为第一编码器;第二预训练步骤:利用所述第一编码器对无标签的发光材料分子数据进行编码,从无标签的发光材料分子数据中抽取出发光材料分子中预定义的官能团,官能团为化学原
子组成的具有预定功能的基团,就是原子集合,对所述官能团进行分组并组成序列,将序列作为自监督学习的标签进行训练,训练结果作为第二编码器;预测步骤:使用所述第二编码器对待预测的发光材料分子数据进行编码,对待预测的发光材料的性质进行预测。
[0008]进一步地,所述第一预训练步骤具体包括以下步骤:步骤一:选择无标签发光材料中的一个分子,遍历该分子中的所有原子,选出键的数量大于等于2的所有原子作为中心原子组成序列Y,所述序列Y作为所述第一预训练的标签序列;步骤二:遍历序列Y中的每个原子,选择其中一个原子设为y,以y为中心,抽取y附近的k层近邻和键作为子结构;步骤三:将抽取出的子结构遮盖掉原子y,剩余部分使用图神经网络进行编码,被遮盖的y原子作为图神经网络训练的标签,剩余部分是指抽取出来的子结构去掉遮盖原子的部分;步骤四:对所述序列Y中所有的中心原子进行训练,剔除掉不能收敛或者收敛的误差大于预定值的中心原子;步骤五:对无标签发光材料的所有分子重复所述步骤一至步骤四的步骤,训练出基于节点层面的图模型作为所述第一编码器。
[0009]进一步地,所述图神经网络输入的边信息为所述子结构的邻接矩阵,节点信息为子结构中每个原子的类型、形式电荷、连接的氢原子个数、是否为杂化态原子特征组成的特征矩阵。
[0010]进一步地,所述k的值为2。
[0011]进一步地,所述第二预训练步骤具体包括以下步骤:步骤一:对无标签的发光材料分子官能团按照发光性质进行分组,根据分组的结果对预训练数据进行模糊分组,选择其中一个分组的发光材料化学分子,作为每一次预训练的数据集;步骤二:利用所述第一编码器对发光材料化学分子中的每一个原子进行编码,累加每一个原子的编码,作为最终分子层面的编码。
[0012]步骤三:抽取出该发光材料化学分子其中一个分组下面所有的官能团,组成序列F,作为分子层面预训练的标签序列。
[0013]步骤四:使用多分类模型对步骤二获得的最终分子层面的编码和步骤三获得的官能团分子层面预训练的标签序列进行训练;步骤五:当一个分组的官能团训练结束时,对得到的图模型进行评估,将评估后的图模型作为第二编码器;步骤六:选择其他全部分组的官能团逐一重复步骤二至步骤五,其中,每一分组的官能团训练评估后分别获得一个第二编码器。
[0014]进一步地,所述预测步骤具体包括以下步骤:步骤一:根据发光材料性质分组,选择需要预测的发光性质对应的第二编码器,对发光材料分子数据进行编码;步骤二:把获得的分子编码作为图模型输入,输入多层感知机,把分子性质转换为
数值化数据,并且将分子性质转换得到的数值化数据作为图模型的正确的标签;步骤三:依次传递所述数值化数据进入多层感知机,得到图神经网络的最后实际输出的发光材料分子数据具有该预测的发光性质的第一概率;步骤四:计算图神经网络的最后实际输出的发光材料分子数据具有该预测的发光性质的第一概率和发光材料分子数据真实具有该预测的发光性质的第二概率之间的误差,判断误差是否在允许范围内;步骤五:若误差在允许范围内,则进入步骤六,若误差不在允许范围内,则误差传回网络,更新网络参数,返回步骤三;步骤六:结束训练,对图模型进行评估测试,并且根据测试结果,对图模型的超参数、结构、层数进行修改,得到训练好的图模型;步骤七:使用训练好的图模型对待预测的发光材料的性质进行预测。
[0015]进一步地,所述发光性质包括光致发光性质、电致发光性质和振子强度中的一种或多种。
[0016]相应地,还提供一种发光材料性质预测系统,包括:节点预训练系统、图预训练系统和分子性质预测系统;所述节点预训练系统对无标签的发光材料分子结构进行自监督预训练,建模方法结合发光材料分子结构本身的化学特征,让预训练模型以k近邻为基本单位学习发光材料分子结构特征,训练得到第一编码器;所述图预训练系统针对发光性质对官能团分组,对不同分组的官能团的化学性质训练不同的预训练模型,并且所述图预训练系统利用所述第一编码器,在预训练的时候添加节点层面的特征,训练得到第二编码器;所述分子性质预测系统利用所述第二编码器,对发光材料分子进行嵌入编码,然后利用得到的第二编码器对发光材料的性质进行预测。
[0017]相应地,还提供一种电子设备,包括存储器和处理器,所述存储本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种发光材料性质预测方法,其特征在于,包括:第一预训练步骤:对无标签的发光材料分子数据进行节点层面的预训练,训练结果作为第一编码器;第二预训练步骤:利用所述第一编码器对无标签的发光材料分子数据进行编码,从无标签的发光材料分子数据中抽取出发光材料分子中预定义的官能团,官能团为化学原子组成的具有预定功能的基团,就是原子集合,对所述官能团进行分组并组成序列,将序列作为自监督学习的标签进行训练,训练结果作为第二编码器;预测步骤:使用所述第二编码器对待预测的发光材料分子数据进行编码,对待预测的发光材料的性质进行预测。2.根据权利要求1所述的一种发光材料性质预测方法,其特征在于,所述第一预训练步骤具体包括以下步骤:步骤一:选择无标签发光材料中的一个分子,遍历该分子中的所有原子,选出键的数量大于等于2的所有原子作为中心原子组成序列Y,所述序列Y作为所述第一预训练的标签序列;步骤二:遍历序列Y中的每个原子,选择其中一个原子设为y,以y为中心,抽取y附近的k层近邻和键作为子结构;步骤三:将抽取出的子结构遮盖掉原子y,剩余部分使用图神经网络进行编码,被遮盖的y原子作为图神经网络训练的标签,剩余部分是指抽取出来的子结构去掉遮盖原子的部分;步骤四:对所述序列Y中所有的中心原子进行训练,剔除掉不能收敛或者收敛的误差大于预定值的中心原子;步骤五:对无标签发光材料的所有分子重复所述步骤一至步骤四的步骤,训练出基于节点层面的图模型作为所述第一编码器。3.根据权利要求2所述的一种发光材料性质预测方法,其特征在于,所述图神经网络输入的边信息为所述子结构的邻接矩阵,节点信息为子结构中每个原子的类型、形式电荷、连接的氢原子个数、是否为杂化态原子特征组成的特征矩阵。4.根据权利要求2所述的一种发光材料性质预测方法,其特征在于,所述k的值为2。5.根据权利要求1所述的一种发光材料性质预测方法,其特征在于,所述第二预训练步骤具体包括以下步骤:步骤一:对无标签的发光材料分子官能团按照发光性质进行分组,根据分组的结果对预训练数据进行模糊分组,选择其中一个分组的发光材料化学分子,作为每一次预训练的数据集;步骤二:利用所述第一编码器对发光材料化学分子中的每一个原子进行编码,累加每一个原子的编码,作为最终分子层面的编码;步骤三:抽取出该发光材料化学分子其中一个分组下面所有的官能团,组成序列F,作为分子层面预训练的标签序列;步骤四:使用多分类模型对步骤二获得的最终分子层面的编码和步骤三获得的官能团分子层面预训练的标签序列进行训练;步骤五:当一个分组的官能团训练结束时,对得到的图模型进行评估,将评估后的图模
型作为第二编...

【专利技术属性】
技术研发人员:王悦胡晗毕海李志强
申请(专利权)人:季华实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1