发光材料性质预测方法、系统、电子设备和存储介质技术方案

技术编号：30273071 阅读：13 留言：0更新日期：2021-10-09 21:30

本发明专利技术涉及数据处理技术领域，尤其涉及一种发光材料性质预测方法、系统、电子设备和存储介质，发光材料性质预测方法包括：对无标签的发光材料分子数据进行节点层面的预训练，训练结果作为第一编码器；第一编码器对无标签的发光材料分子数据进行编码，标签从无的发光材料分子数据中抽取出发光材料分子中预定义的官能团，对所述官能团进行分组并组成序列，将序列作为自监督学习的标签进行训练，训练结果作为第二编码器；使用所述第二编码器对待预测的发光材料分子数据进行编码，对待预测的发光材料的性质进行预测。本发明专利技术通过设计节点层面和图层面的建模方法，让分子结构更好地被表征，解决了现有方法中出现的特征丢失问题。解决了现有方法中出现的特征丢失问题。解决了现有方法中出现的特征丢失问题。

全部详细技术资料下载

【技术实现步骤摘要】
发光材料性质预测方法、系统、电子设备和存储介质

[0001]本专利技术涉及数据处理
，尤其涉及一种发光材料性质预测方法、系统、电子设备和存储介质。

技术介绍

[0002]有机电致发光材料（以下简称发光材料）指在电场作用下能发出光的高分子或小分子有机材料。基于电子给体(Donor)和电子受体(Acceptor)形成的有机发光分子在有机电致发光材料领域里具有非常重要的地位。给
‑
受体型有机发光分子特有的电荷转移特性，使其成为调控分子激发态特性的理想体系，基于给体单元和受体单元的分子设计，可实现较小的单线态
‑
三线态能极差，进而实现100%的激子利用率。传统的方法会在实验室由给体和受体合成发光材料，在获得分子的基础上，进而验证分子发光的性质。凭借实验研发人员的个人经验，可以优先选择可能性更大的给体和受体，减少实验的次数。
[0003]然而基于传统方法的有机电致发光材料性质检测需要耗费大量的人力、物力、财力，并且极其依靠一些进口设备。比如如果有100个给体和100个受体，则至少有10000中组合方式，依次实验验证需要耗费大量的时间。即使依靠一些研发人员的个人经验能够选出效果更好地给体和受体，但是依靠个人经验的方法不能大范围推广。
[0004]随着机器学习技术在全世界范围内的发展，各个研究领域均开始不同程度地应用机器学习技术。面对一些传统的问题，机器学习从统计、数学、计算机的思路出发，为许多传统学科提供了新的思路，并且取得了一定成果，比如遥感领域、医学图像领域、代码安全...

【技术保护点】

【技术特征摘要】
1.一种发光材料性质预测方法，其特征在于，包括：第一预训练步骤：对无标签的发光材料分子数据进行节点层面的预训练，训练结果作为第一编码器；第二预训练步骤：利用所述第一编码器对无标签的发光材料分子数据进行编码，从无标签的发光材料分子数据中抽取出发光材料分子中预定义的官能团，官能团为化学原子组成的具有预定功能的基团，就是原子集合，对所述官能团进行分组并组成序列，将序列作为自监督学习的标签进行训练，训练结果作为第二编码器；预测步骤：使用所述第二编码器对待预测的发光材料分子数据进行编码，对待预测的发光材料的性质进行预测。2.根据权利要求1所述的一种发光材料性质预测方法，其特征在于，所述第一预训练步骤具体包括以下步骤：步骤一：选择无标签发光材料中的一个分子，遍历该分子中的所有原子，选出键的数量大于等于2的所有原子作为中心原子组成序列Y，所述序列Y作为所述第一预训练的标签序列；步骤二：遍历序列Y中的每个原子，选择其中一个原子设为y，以y为中心，抽取y附近的k层近邻和键作为子结构；步骤三：将抽取出的子结构遮盖掉原子y，剩余部分使用图神经网络进行编码，被遮盖的y原子作为图神经网络训练的标签，剩余部分是指抽取出来的子结构去掉遮盖原子的部分；步骤四：对所述序列Y中所有的中心原子进行训练，剔除掉不能收敛或者收敛的误差大于预定值的中心原子；步骤五：对无标签发光材料的所有分子重复所述步骤一至步骤四的步骤，训练出基于节点层面的图模型作为所述第一编码器。3.根据权利要求2所述的一种发光材料性质预测方法，其特征在于，所述图神经网络输入的边信息为所述子结构的邻接矩阵，节点信息为子结构中每个原子的类型、形式电荷、连接的氢原子个数、是否为杂化态原子特征组成的特征矩阵。4.根据权利要求2所述的一种发光材料性质预测方法，其特征在于，所述k的值为2。5.根据权利要求1所述的一种发光材料性质预测方法，其特征在于，所述第二预训练步骤具体包括以下步骤：步骤一：对无标签的发光材料分子官能团按照发光性质进行分组，根据分组的结果对预训练数据进行模糊分组，选择其中一个分组的发光材料化学分子，作为每一次预训练的数据集；步骤二：利用所述第一编码器对发光材料化学分子中的每一个原子进行编码，累加每一个原子的编码，作为最终分子层面的编码；步骤三：抽取出该发光材料化学分子其中一个分组下面所有的官能团，组成序列F，作为分子层面预训练的标签序列；步骤四：使用多分类模型对步骤二获得的最终分子层面的编码和步骤三获得的官能团分子层面预训练的标签序列进行训练；步骤五：当一个分组的官能团训练结束时，对得到的图模型进行评估，将评估后的图模
型作为第二编...

【专利技术属性】
技术研发人员：王悦，胡晗，毕海，李志强，
申请(专利权)人：季华实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人