System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于材料科学应用,具体涉及一种聚酯大分子3d图数据结构的表征与验证方法。
技术介绍
1、传统意义上,大规模的实验和检测分析是新材料研发的必要过程,对资源和设备的要求较高,需进行长时间和大批量的重复和调配试验。因此,导致新材料的研发过程通常较长。随着计算机模拟方法的出现,基于密度泛函理论(dft)、马尔科夫链和分子动力学理论,特别是人工智能、深度学习技术理论的迅速发展,推动了材料科学的一次计算革命,使得研究人员能够通过计算机技术更有效地探索材料原子结构与材料性能关系。然而,现有的计算机模拟技术依然无法通过单体结构、配比等特点与材料的很多宏观性能(如色差、光泽、耐久性等)建立关联关系,从而实现这些材料特性的预测及配方的设计。
2、随着材料数据的积累、人工智能深度学习算法更深层次的发展与应用,以及硬件算力的指数级增长,基于数据驱动的科学研究已成为了科学家们的研究热点。目前,深度学习算法是数据驱动研究发展的核心内容,已经被广泛地应用于生物制药及化学合成中,并开始在材料科学领域崭露头角。在材料科学领域,全世界范围内存在的材料种类数量高达10100,这些材料绝大部分存在同类结构并且其特性及性能均已被详细表征和描述,并形成了例如qm9、esol等公共数据库,为大规模的机器学习和预测模型的建立提供了先决条件。大量研究表明,利用基于大数据分析的模型学习算法,构建材料结构特征与材料性能关系模型,能够实现材料性能的有效预测,从而加快材料的研发过程。
3、目前,深度学习在加速新材料开发的研究中已出现较多研究成果,例如,
技术实现思路
1、本专利技术的目的在于提供一种聚酯大分子3d图数据结构的表征与验证方法,该方法能够准确给出分子结构的三维空间信息,实现聚酯大分子的有效表征,提升聚酯材料韧性分类预测准确度,以促进新材料研发过程中配方的高效设计。
2、本专利技术的上述目的可以通过以下技术方案来实现:一种聚酯大分子3d图数据结构的表征与验证方法,包括以下步骤:
3、(1)收集聚酯材料的历史配方数据,形成数据集,所述数据集包括用于制备聚酯材料的单体化学名称、单体smiles编码数据、单体配比数据、工艺参数和聚酯材料韧性测试分类数据;
4、(2)根据步骤(1)中所收集的配方数据,采用加权计算方法对单体smiles编码数据进行处理,得出聚酯大分子的smiles编码数据;
5、(3)采用几何扩散模型,构建用于生成3d分子构象的深度网络模型,利用公共数据库完成模型训练,得到预训练模型,输入步骤(2)中所得聚酯大分子smiles编码数据,再经过微调处理,实现聚酯大分子3d图数据结构的表征;
6、(4)将步骤(3)中所得聚酯大分子3d图数据以及步骤(1)中对应的聚酯材料韧性测试分类数据形成数据集,并划分为训练集和测试集;
7、(5)采用3d图结构学习模型,以步骤(3)中生成的聚酯大分子3d图数据作为网络输入,对应步骤(1)中聚酯材料韧性测试分类数据作为输出参数,经过在本地数据上的训练集和测试集进行训练-测试处理,实现对于聚酯材料韧性的分类预测。
8、本专利技术方法通过构建单体结构(包括smile和图结构数据)、配方个、反应条件、聚酯材料大分子结构(包括smile和图结构数据)等特征因素与材料性能的映射关系数据库,探明单体分子结构、配方等因素对于材料拉伸韧性性能的影响,以实现新型聚酯产品大分子结构的3d图数据表征,并通过材料性能的高精度预测完成方法验证;本专利技术能够实现聚酯产品研发周期的有效缩短,提升研发过程的数字化水平以及企业经济效益,并同时促进新材料产品质量提升。
9、在上述聚酯大分子3d图数据结构的表征与验证方法中:
10、可选地,步骤(1)中利用rdkit函数包,将单体化学结构转化为单体smiles编码数据。
11、可选地,步骤(1)中所述工艺参数包括合成温度。
12、可选地,步骤(1)中所述聚酯材料韧性测试分类数据分为三类,包括正反通过均开裂、正面通过无裂纹反面有裂纹、正反面通过均无裂纹,在数据集中分别以-1、0和1表示。
13、可选地,步骤(2)中采用加权计算方法对单体smiles编码数据进行处理,得出聚酯大分子的smiles编码数据包括:通过将堆叠单体分子smiles与对应配方中配比值的内积得到聚酯大分子的smiles结果,计算流程可按照式(1)进行:
14、
15、其中,smipoly和smimono分别表示聚酯大分子和单体分子的smiles表达式;concat(·)表示堆叠运算;wi为配方数据中的配比值;n为所需单体数量。
16、可选地,步骤(3)中所述深度网络模型为通过采用针对计算化学开发的深度张量网络schnet和图同构网络(graph isomorphism network,gin)分别作为双通道baseline的两个数据流处理单元,并同时在schnet中接入attention模块,所构成的一种深度网络模型。
17、可选地,步骤(3)中所述公共数据库为qm9数据库。
18、可选地,步骤(3)中采用迁移学习方法经过微调处理。
19、可选地,步骤(4)中所述训练集和测试集的比例为8:2。
20、可选地,步骤(5)中所述3d图结构学习模型为一种几何构象增强分子表征学习算法,geognn。
21、可选地,步骤(5)中采用相关系数的平方值r2作为精度评价指标,当r2≥0.9时,则认为所述聚酯大分子3d图数据表征方法为有效。
22、本专利技术方法还可进一步通过基于3d图结构数据对聚酯大分子的有效表征,设计含有关键基因的新型聚酯材料配方,预测其材料韧性性能,对预测结果韧性较好的配方进行合成验证,指导配方的优化和新产品研发。
23、进一步地,本专利技术提供的聚酯大分子3d图数据结构的表征与验证方法,包括以下步骤:
24、(1)收集聚酯材料的历史配方数据,包括转换生成用于制备聚酯材料的单体化学名称、单体smiles编码数据、单体配比数据、工艺参数和聚酯材料韧性测试本文档来自技高网...
【技术保护点】
1.一种聚酯大分子3D图数据结构的表征与验证方法,其特征在于包括以下步骤:
2.根据权利要求1所述聚酯大分子3D图数据结构的表征与验证方法,其特征在于:步骤(1)中利用RDKit函数包,将单体化学结构转化为单体SMILES编码数据。
3.根据权利要求1所述聚酯大分子3D图数据结构的表征与验证方法,其特征在于:步骤(1)中所述工艺参数包括合成温度。
4.根据权利要求1所述聚酯大分子3D图数据结构的表征与验证方法,其特征在于:步骤(1)中所述聚酯材料韧性测试分类数据分为三类,包括正反通过均开裂、正面通过无裂纹反面有裂纹、正反面通过均无裂纹,在数据集中分别以-1、0和1表示。
5.根据权利要求1所述聚酯大分子3D图数据结构的表征与验证方法,其特征在于:步骤(2)中采用加权计算方法对单体SMILES编码数据进行处理,得出聚酯大分子的SMILES编码数据包括:通过将堆叠单体分子SMILES与对应配方中配比值的内积得到聚酯大分子的SMILES结果,计算流程可按照式(1)进行:
6.根据权利要求1所述聚酯大分子3D图数据结构的表征与验
7.根据权利要求1所述聚酯大分子3D图数据结构的表征与验证方法,其特征在于:步骤(3)中所述公共数据库为QM9数据库。
8.根据权利要求1所述聚酯大分子3D图数据结构的表征与验证方法,其特征在于:步骤(4)中所述训练集和测试集的比例为8:2。
9.根据权利要求1所述聚酯大分子3D图数据结构的表征与验证方法,其特征在于:步骤(5)中所述3D图结构学习模型为一种几何构象增强分子表征学习算法GeoGNN。
10.根据权利要求1所述聚酯大分子3D图数据结构的表征与验证方法,其特征在于:步骤(5)中采用相关系数的平方值R2作为精度评价指标,当R2≥0.9时,则认为所述聚酯大分子3D图数据表征方法为有效。
...【技术特征摘要】
1.一种聚酯大分子3d图数据结构的表征与验证方法,其特征在于包括以下步骤:
2.根据权利要求1所述聚酯大分子3d图数据结构的表征与验证方法,其特征在于:步骤(1)中利用rdkit函数包,将单体化学结构转化为单体smiles编码数据。
3.根据权利要求1所述聚酯大分子3d图数据结构的表征与验证方法,其特征在于:步骤(1)中所述工艺参数包括合成温度。
4.根据权利要求1所述聚酯大分子3d图数据结构的表征与验证方法,其特征在于:步骤(1)中所述聚酯材料韧性测试分类数据分为三类,包括正反通过均开裂、正面通过无裂纹反面有裂纹、正反面通过均无裂纹,在数据集中分别以-1、0和1表示。
5.根据权利要求1所述聚酯大分子3d图数据结构的表征与验证方法,其特征在于:步骤(2)中采用加权计算方法对单体smiles编码数据进行处理,得出聚酯大分子的smiles编码数据包括:通过将堆叠单体分子smiles与对应配方中配比值的内积得到聚酯大分子的smiles结果,计算流程可按照式(1)进行:
6.根据...
【专利技术属性】
技术研发人员:段嘉旭,马志平,陶友季,祁黎,王俊,万超,彭煌,
申请(专利权)人:中国电器科学研究院股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。