System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于原子特征预测离子液体物性的机器学习方法技术_技高网

一种基于原子特征预测离子液体物性的机器学习方法技术

技术编号:40077372 阅读:13 留言:0更新日期:2024-01-17 01:41
本发明专利技术涉及离子液体性质预测技术领域,提供了一种基于原子特征预测离子液体物性的机器学习方法。本发明专利技术通过构建用于表示离子液体物理化学性质的阴离子、阳离子的原子特征,将阴离子、阳离子的原子特征分别补齐后进行线性组合,表示成该离子液体的特征,并基于原子特征建立AI模型,实时准确预测离子液体物理化学性质。本发明专利技术提供的AI预测模型具备较强的泛化能力,能够同时预测多种离子液体在多种温度、压力条件下的物理化学性质;适用范围广,减少实验、计算消耗,降低成本,安全。

【技术实现步骤摘要】

本专利技术涉及离子液体性质预测,尤其涉及一种基于原子特征预测离子液体物性的机器学习方法


技术介绍

1、离子液体作为新型的电解质溶液、润滑剂、气体吸收剂在能源、摩擦、环保等领域具有巨大的应用前景,研究离子液体的物理化学性质是推动其工业应用的关键步骤。典型的物化性质,如密度、粘度、电导率等是离子液体工业用途中必须考虑的因素。迄今为止,离子液体的物理化学性质可通过实验表征、理论计算、模型评估等三类方法获得。实验表征方法是指借助仪器获取相关物化性质方法;理论计算是指通过分子动力学软件、量子化学软件计算获得离子液体的相关物化性质;模型评估是指通过显式的经验方程根据输入量计算得到离子液体的物化性质。具体如下:

2、(一)借助实验仪器测量离子液体的物化性质:

3、离子液体常见的物理化学性质,如:密度、粘度、介电常数、电导率、熔点等,均可以通过实验仪器测量得到。例如,密度计、粘度计、电导率仪可以分别用来测量离子液体的密度、粘度和电导率性质;离子液体的熔点可以通过温度传感器和热流传感器构建差示扫描量热仪进行测量;离子液体的介电常数可以波导反射法、平板(圆柱)电容器测量法获得。

4、(二)通过理论计算方法获取离子液体的物化性质:

5、通过计算机模拟可以计算出离子液体的物理化学性质,根据计算原理和模拟规模可以分为两种方法,即第一性原理计算方法和分子动力学计算方法。第一性原理计算方法从电子层面对分子、原子间的相互作用进行精确描述,计算精度高。一般情况下,常见的第一性原理计算理论方程的计算复杂度正比于体系总电子数的三次方,在此精度条件下,借助相关的软件,如vasp、gaussian、cp2k等可以用来计算离子液体的物理、化学性质。第一性原理计算方法模拟的体系原子数在500以内,模拟的时长不超过1纳秒。分子动力学方法采用经验力场描述分子、原子之间的相互作用,经验力场通过数值拟合的方式简化了相互作用的描述形式,降低了计算复杂度,可以模拟复杂的离子液体体系,如单分子原子数超过100的聚离子液体。此外,分子动力学方法模拟的时间尺度可以达到几百纳秒,长时间的轨迹采样适用于计算电导率、扩散系数等动力学性质。常用的分子动力学软件包括:lammps,gromacs,tinker,material studio等。另一方面,与第一性原理计算方法相比,分子动力学方法损失了部分精度,基于同一套经验力场模拟,分子动力学方法无法精确计算离子液体的全部物理化学性质。

6、(三)通过热力学及统计模型获取离子液体的物理化学性质;

7、这类方法的基本思路是以实验测得或计算获得的数据为基础,建立经验方程,通过数据拟合技术对方程进行修正并获得方程系数。典型的热力学统计模型案例如:理想气体及真实气体状态方程的构建和修正。热力学及统计模型方法已经被广泛用于离子液体密度、粘度、电导率的计算,通常针对某一类离子液体,选取特定温度、压力范围内的离子液体的数据,进行方程修正和参数拟合,一般使用的数据量在几十条到三百条之间。

8、离子液体物理化学性质计算主要要考虑两方面因素:准确性和实时性。实验仪器测量离子液体物理化学性质的方法主要适用于常规条件下性质的获取,对于苛刻实验条件,如高温、高压条件,实验方法难以实施、危险系数大。另外,实验方法不可避免地存在实验误差,需要多次测量、校正,获得比较准确的结果,测量耗时长。理论计算的结果可重复性高,但第一性原理计算方法消耗的计算资源大,所能模拟体系的时间和空间规模受限,难以计算原子数规模较大的离子液体物理化学性质以及离子液体的动力学性质。分子动力学计算方法通过损失部分精度提升计算模拟的时间规模和空间规模,因此,计算结果的准确性与第一性原理方法存在一定的差距。另一方面,第一性原理计算方法和分子动力学计算方法均是通过分析原子的运动轨迹获得离子液体的物理化学性质,原子运动轨迹的收集过程比较耗时,通常需要几小时至几周,因此理论计算方法获得离子液体物理化学性质的另一个缺点是实效性差。热力学及统计模型方法由于拟合数据规模的限制,模型方程只能针对特定温度、压力范围内某一类离子液体的物理化学性质计算,使用条件苛刻,使用范围狭小,无法准确计算所有离子液体的物理化学性质。


技术实现思路

1、本专利技术旨在解决以上技术问题至少其中之一,通过ai方法构建实时准确的、适用范围广的离子液体物理化学性质预测模型。本专利技术通过构建用于表示离子液体物理化学性质的原子特征,并基于原子特征建立ai模型,实时准确预测离子液体物理化学性质。

2、为构建此ai模型,需要收集、整理离子液体数据集,构建、筛选出有效的原子特征,制定合理有效的模型训练策略,并对模型计算结果进行准确性评估和泛化能力、可扩展性测试。本专利技术提供的具体技术方案如下:

3、本专利技术提供了一种基于原子特征预测离子液体物性的机器学习方法,包括以下步骤:

4、1)离子液体数据收集及清洗:从公开的离子液体热力学性质数据库搜集离子液体的物理化学性质,经数据清洗删除无效数据和错误数据;

5、2)离子液体原子特征构建及筛选:分别对离子液体的阳离子、阴离子进行原子特征构建,将阳离子、阴离子的原子特征分别补齐后进行线性组合,表示成该离子液体的特征,将离子液体的特征与物理化学性质一一对应,得到离子液体特征数据集;离子液体原子特征从组成原子的属性特征和组成原子间的连接关系两方面进行构建,筛选去除与模型不相关的原子属性特征;然后以原子数最多的阳离子、阴离子分别作为特征数目参照,对其余阳离子、阴离子的特征进行补齐,使其余阳离子、阴离子的特征数目与原子数最多的阳离子、阴离子的特征数目相同;

6、3)数据集划分:将制得的数据集划分为训练集和测试集;

7、4)模型训练:根据离子液体的特征,在训练集上进行离子液体物理化学性质预测模型训练,得到模型;

8、5)模型评估:通过测试集对模型进行评估,包括模型准确性评估和模型泛化能力评估两方面;

9、6)模型优化:根据模型评估的结果进行模型性能优化,在模型参数空间内寻找最优参数组合,从而得到最优模型。

10、优选地,步骤1)中所述离子液体热力学性质数据库为ilthermo v2.0。

11、优选地,步骤1)中:

12、所述离子液体为单组分纯离子液体,温度范围为208.15k到528.55k;

13、所述离子液体的物理化学性质包括密度、粘度、电导率、临界温度、临界压力、亨利系数。

14、优选地,步骤1)中所述无效数据包括离子液体的类别、物理化学性质缺失的数据,所述错误数据包括同一种离子液体在相同温度、压力条件下出现不同的物理化学性质数据。

15、优选地,步骤2)中:

16、所述组成原子的属性特征包括原子的尺寸、原子的坐标、原子的电荷、原子的能量参数、原子的质量;

17、所述组成原子间的连接关系通过原子间距离特征进行描述,对于一个包含n个原子的阳离子或阴离子本文档来自技高网...

【技术保护点】

1.一种基于原子特征预测离子液体物性的机器学习方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于原子特征预测离子液体物性的机器学习方法,其特征在于,步骤1)中:所述离子液体热力学性质数据库为ILThermo v2.0。

3.根据权利要求1所述的一种基于原子特征预测离子液体物性的机器学习方法,其特征在于,步骤1)中:

4.根据权利要求1所述的一种基于原子特征预测离子液体物性的机器学习方法,其特征在于,步骤1)中所述无效数据包括离子液体的类别、物理化学性质缺失的数据,所述错误数据包括同一种离子液体在相同温度、压力条件下出现不同的物理化学性质数据。

5.根据权利要求1所述的一种基于原子特征预测离子液体物性的机器学习方法,其特征在于,步骤2)中:

6.根据权利要求5所述的一种基于原子特征预测离子液体物性的机器学习方法,其特征在于,步骤2)中所述筛选去除与模型不相关的原子属性特征,具体为:对于离子液体的五种原子属性特征,采用去一方法进行尝试,筛选去除与模型不相关的原子属性特征。

7.根据权利要求1所述的一种基于原子特征预测离子液体物性的机器学习方法,其特征在于,步骤2)中所述特征补齐的方法采用补零的策略。

8.根据权利要求1所述的一种基于原子特征预测离子液体物性的机器学习方法,其特征在于,步骤4)中所述模型训练的算法包括:随机森林方法,支持向量机方法,XGBoost方法。

9.根据权利要求1所述的一种基于原子特征预测离子液体物性的机器学习方法,其特征在于,步骤5)中所述模型准确性评估从决定系数、均方误差、平均绝对误差三方面进行评价,模型泛化能力评估通过比较测试集和训练集上模型性能的相差来衡量。

10.根据权利要求1所述的一种基于原子特征预测离子液体物性的机器学习方法,其特征在于,步骤6)中所述在模型参数空间内寻找最优参数组合具体为:通过性能评价指标发掘模型优化策略,通过五折交叉验证的方法对模型进行多次测试,并以平均结果衡量参数调节的优劣;结合网格搜索或随机搜索的参数自动调优技术,在模型参数空间内寻找最优参数组合。

...

【技术特征摘要】

1.一种基于原子特征预测离子液体物性的机器学习方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于原子特征预测离子液体物性的机器学习方法,其特征在于,步骤1)中:所述离子液体热力学性质数据库为ilthermo v2.0。

3.根据权利要求1所述的一种基于原子特征预测离子液体物性的机器学习方法,其特征在于,步骤1)中:

4.根据权利要求1所述的一种基于原子特征预测离子液体物性的机器学习方法,其特征在于,步骤1)中所述无效数据包括离子液体的类别、物理化学性质缺失的数据,所述错误数据包括同一种离子液体在相同温度、压力条件下出现不同的物理化学性质数据。

5.根据权利要求1所述的一种基于原子特征预测离子液体物性的机器学习方法,其特征在于,步骤2)中:

6.根据权利要求5所述的一种基于原子特征预测离子液体物性的机器学习方法,其特征在于,步骤2)中所述筛选去除与模型不相关的原子属性特征,具体为:对于离子液体的五种原子属性特征,采用去一方法进行尝试,筛选去除...

【专利技术属性】
技术研发人员:杨振戴中洋宋灿灿王晨阳周国兵华东升
申请(专利权)人:江西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1