疏水性有机物被动采样材料(硅橡胶)与水之间分配系数的预测方法技术

技术编号:20684322 阅读:21 留言:0更新日期:2019-03-27 20:02
一种疏水性有机物被动采样材料(硅橡胶)与水分配系数的预测方法,属于污染物环境暴露测试技术领域。首先通过文献收集173个疏水性有机化合物硅橡胶‑水分配系数的实验值,其次,获取化合物的Padel描述符,最后,采用遗传算法‑多元线性回归分析构建预测疏水性有机物Ksrw的QSAR模型。构建的模型涵盖63个新兴污染物,具有良好的拟合度、稳健性和预测能力,且应用域明确。使用本发明专利技术所建模型可以直接通过有机化合物分子结构参数快速预测应用域内疏水性有机物的Ksrw值,且预测准确、简单经济,不仅能更好地衡量硅橡胶被动采样器的性能,也为化学品的暴露风险评价和监管提供技术支持,对污染物的环境暴露测试具有重要的意义。

【技术实现步骤摘要】
疏水性有机物被动采样材料(硅橡胶)与水之间分配系数的预测方法
本专利技术涉及一种采用定量-结构活性关系(QSAR)模型预测疏水性有机物被动采样材料(硅橡胶)与水之间分配系数的方法,属于污染物环境暴露测试
技术背景单相被动采样技术目前广泛应用于不同水体疏水性有机物浓度的监测中。硅橡胶因具有分配系数高和传输阻力低的特点常被用作单相被动采样材料。疏水性有机物的硅橡胶-水分配系数(Ksrw)是硅橡胶作为被动采样材料的一个重要参数,也是评价被动采样材料性能和准确计算水体中有机物浓度的一个重要指标,其定义式为Ksrw=Csr/Cw,其中Csr(mol/kg硅橡胶)和Cw(mol/L水)分别表示疏水性有机物在硅橡胶和水之间达到分配平衡时的浓度。Ksrw的准确测定对于疏水性有机物在水溶液中浓度的测定、水体中疏水性有机物的分布、源识别、暴露风险评价、环境决策制定都有着重要的意义。通常Ksrw可通过助溶剂方法实验测定。但是实验测定受到诸如温度、离子强度、有机质等多种因素的影响。对于高疏水性有机物,因其极易吸附在实验装置表面,达到平衡所需时间长,实验测定困难,且不同实验室和不同来源吸附材料得到的Ksrw的重现性差。因此非常有必要发展实验替代技术用于获取疏水性有机物的Ksrw。QSAR模型有助于实现有毒有害化学品污染管理的“预先防范原则”,能够减少或替代相关实验,弥补实验数据的缺失、降低实验费用,目前有关预测疏水性有机物的Ksrw方法的研究较少,且现有研究所建模型中,模型化合物多数是多环芳烃和多氯联苯,且缺少应用域表征和机理解释。因此,随着新兴污染物的增加,有必要发展一个能快速高效的预测疏水性有机物Ksrw的QSAR模型。
技术实现思路
本专利技术的目的是建立可高效快速预测疏水性有机物Ksrw的预测方法。首先通过文献收集疏水性有机化合物Ksrw的实验值,其次,获取化合物的Padel描述符,最后,采用遗传算法-多元线性回归分析(GA-MLR)构建预测疏水性有机物Ksrw的QSAR模型。本方法可直接通过有机化合物的分子结构参数(分子结构描述符)预测Ksrw,进而在被动采样中快速、准确地得到水中化合物的浓度,为化合物的暴露风险评价和管理提供依据。本专利技术的技术方案:一种疏水性有机物被动采样材料(硅橡胶)与水之间分配系数的预测方法,步骤如下:首先,通过文献收集疏水性有机物在AltesilTM透明硅橡胶-水之间的logKsrw值,如果一个疏水性有机物的logKsrw值有多个来源,则取平均值,共得到173个疏水性有机物的logKsrw值,其中63个新兴污染物;其次,根据疏水性有机物名称和CAS号,确定其各分子结构;采用MOPAC对各分子结构进行优化,生成最终用于计算描述符的mol文件;再计算优化后的分子结构的Padel描述符,共得到1444个一维和二维结构描述符、881个指纹描述符;对符合以下特征的描述符进行舍弃:(1)常数或近常数描述符;(2)存在缺失的描述符;(3)对相关性大于0.98的描述符。经舍弃后,最终得到683个Padel描述符;将收集到的疏水性有机物随机划分,30%作为训练集,用于模型构建,其余作为验证集,用于模型外部验证;最后,采用遗传算法-多元线性回归分析对训练集数据进行建模,并对模型结果进行表征与验证,所得模型如下:ntra=122,m=6,next=51;式中,Ksrw为硅橡胶-水分配系数;ntra为训练集化合物数目;next为验证集化合物数目;m为描述符个数;apol是原子极化率之和;AATS5i是第一离子势加权的lag5平均Broto-Moreau自相关系数;GATS1s是本征状态加权的lag1Geary自相关系数;minssO是最小氧原子型电状态;ETAdEpsilonA是不饱和原子数和电负性原子数贡献测度;MLFERA溶质氢键酸性总和。所述的疏水性有机物包括多环芳烃、烷基多环芳烃、多氯联苯、氯苯、杀虫剂、杀菌剂、杀藻剂、芳香剂、紫外光过滤剂、有机磷阻燃剂、酞酸酯、烷基酚和双酚A。疏水性有机物结构中含有碳碳双键、醇羟基、酚羟基、羰基、酯基、亚硫酸酯基、磷酸酯基、硝基、亚氨基、叔氨基、氰基、醚键、氧原子、氮原子、氟原子、氯原子、溴原子、磷原子和硫原子基团。因此,本专利技术所构建的模型能更好地预测结构相似的化合物的Ksrw值,有助于利用被动采样快速、准确地计算疏水性有机物在水体中溶解浓度值。同时为疏水性有机物的暴露风险评价和监管提供数据支持。分子结构优化方法为MM2预优化,PM6进一步优化,其使用的关键词:eps=78.6CHARGE=0EFGNORM=0.01POLARMULLIKSHIFT=80。所得模型的调整决定系数R2adj=0.817,训练集均方根误差RMSEtra=0.480,训练集平均绝对误差MAEtra=0.363,说明模型具有良好的拟合能力;去一法交叉验证系数(Q2LOO)、去多法交叉验证系数(Q2LMO)、Y-随机决定系数(R2Yscr)分别为Q2LOO=0.794,Q2LMO=0.786,R2Yscr=0.049,说明模型具有良好的稳定性;外部验证的决定系数R2ext=0.819,验证集均方根误差RMSEext=0.423,验证集平均绝对误差MAEext=0.333,3个预测平方相关系数分别为Q2ext-F1=0.826,Q2ext-F2=0.817,Q2ext-F3=0.865,一致性相关系数CCCext=0.903,表明模型具有良好的预测能力;R2和Q2之差远小于0.3,说明模型不存在过拟合现象。预测值和实验值拟合关系见图1。从图中可见,预测值和实验值拟合较好,说明模型预测能力良好。用标准残差δ*对杠杆值h的Williams图对模型的应用域进行表征(见图2),一般认为δ*的绝对值大于3.0时,该化合物是离群点。当杠杆值h大于警戒值h*时,表明该化合物结构与其他化合物结构有显著差异。图2中,h*=0.172,由图可见,有3种化合物的杠杆值h大于警戒值h*,其中酞酸二异癸酯和磷酸三辛酯是训练集化合物,说明这两种化合物会对模型产生影响,六氯-1,3-丁二烯是验证集化合物,但六氯-1,3-丁二烯的实验值(4.840)和预测值(5.783)比较接近,说明模型有较好的预测能力。所有化合物的标准残差δ*的绝对值均小于3.0,没有离群点,表明该模型可用于预测结构性质相似的有机化合物的Ksrw。本专利技术的有益效果:本专利技术可以通过有机化合物分子结构参数快速预测应用域内疏水性有机物的Ksrw值,且预测准确、简单经济。构建的模型涵盖新兴污染物,具有良好的拟合度、稳健性和预测能力,且应用域明确。因此,使用本专利技术所建模型预测疏水性有机物的Ksrw具有更高的可靠性,不仅能更好地衡量硅橡胶被动采样器的性能,也为化学品的暴露风险评价和监管提供技术支持,对污染物的环境暴露测试具有重要的意义。附图说明图1为训练集和验证集的实验值和预测值的拟合图。图2为Williams图。具体实施方式以下结合附图和技术方案,进一步说明本专利技术的具体实施方式。实施例1给定一个有机物特拉斯麝香预测其logKsrw值。首先优化特拉斯麝香的分子结构,然后基于优化的分子结构计算出6个Padel描述符,描述符分别为apol,AATS5i,GATS1s本文档来自技高网
...

【技术保护点】
1.一种疏水性有机物被动采样材料(硅橡胶)与水之间分配系数的预测方法,其特征在于,步骤如下:首先,通过文献收集疏水性有机物在AltesilTM透明硅橡胶‑水之间的log Ksrw值,如果一个疏水性有机物的log Ksrw值有多个来源,则取平均值,共得到173个疏水性有机物的log Ksrw值,其中有63个新兴污染物;其次,根据疏水性有机物名称和CAS号,确定其各分子结构;采用MOPAC对各分子结构进行优化,生成最终用于计算描述符的mol文件;再计算优化后的分子结构的Padel描述符,共得到1444个一维和二维结构描述符、881个指纹描述符;对符合以下特征的描述符进行舍弃:(1)常数或近常数描述符;(2)存在缺失的描述符;(3)对相关性大于0.98的描述符;经舍弃后,最终得到683个Padel描述符;将收集到的疏水性有机物随机划分,30%作为训练集,用于模型构建,其余作为验证集,用于模型外部验证;最后,采用遗传算法‑多元线性回归分析对训练集数据进行建模,并对模型结果进行表征与验证,所得模型如下:

【技术特征摘要】
1.一种疏水性有机物被动采样材料(硅橡胶)与水之间分配系数的预测方法,其特征在于,步骤如下:首先,通过文献收集疏水性有机物在AltesilTM透明硅橡胶-水之间的logKsrw值,如果一个疏水性有机物的logKsrw值有多个来源,则取平均值,共得到173个疏水性有机物的logKsrw值,其中有63个新兴污染物;其次,根据疏水性有机物名称和CAS号,确定其各分子结构;采用MOPAC对各分子结构进行优化,生成最终用于计算描述符的mol文件;再计算优化后的分子结构的Padel描述符,共得到1444个一维和二维结构描述符、881个指纹描述符;对符合以下特征的描述符进行舍弃:(1)常数或近常数描述符;(2)存在缺失的描述符;(3)对相关性大于0.98的描述符;经舍弃后,最终得到683个Padel描述符;将收集到的疏水性有机物随机划分,30%作为训练集,用于模型构建,其余作为验证集,用于模型外部验证;最后,采用遗传算法-多元线性回归分析对训练集数据进行建模,并对模型结果进行表征与验证,所得模型如下:ntra=122,m=6,next=51;式中,Ksrw为硅橡胶-水分配系数;ntra为训练集化合物数目;next...

【专利技术属性】
技术研发人员:孙慧超李雪花祁晓娟
申请(专利权)人:辽宁师范大学大连理工大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1