预测水相中有机物与硫酸自由基水相反应速率常数的定量结构活性关系模型制造技术

技术编号:16529219 阅读:35 留言:0更新日期:2017-11-09 21:03
本发明专利技术公开了一种通过定量结构活性关系预测水相中有机物与硫酸自由基反应速率常数的方法。基于化合物结构计算具有结构特征的分子描述符,采用多元线性回归方法,构建了有机化合物

【技术实现步骤摘要】
预测水相中有机物与硫酸自由基水相反应速率常数的定量结构活性关系模型
本专利技术涉及一种通过建立定量构效关系模型(QSAR)预测水相中有机物与硫酸自由基反应速率常数的方法,属于生态风险评价测试策略

技术介绍
高级氧化技术(AdvancedoxidationProcesses,AOPs)是水污染控制中常用的工艺,在去除水体含有的微量污染物方面具有良好的发展前景。其原理是通过激发产生羟基自由基、硫酸自由基等活性物种,进而攻击水体中的各类污染物,将其降解为CO2、水和矿物盐类,从而实现水体中毒害物质的脱除。根据自由基激活方式的不同,高级氧化技术分为:光化学氧化、电化学氧化、光催化氧化、湿式催化氧化、声化学氧化、湿式氧化及Fenton氧化等。传统的高级氧化技术大多基于羟基自由基作为活性物种来完成降解反应,但这一体系对反应条件的要求(较低pH下进行反应)比较苛刻,故具有一定的局限性。基于硫酸自由基(SO4·-)为活性物种的高级氧化技术,具有较宽的pH适用性和较强的氧化能力,越来越受到研究者的关注。有机污染物与SO4·-的水相反应速率常数是表征污染物与SO4·-反应能力与强度的物理量,具有越大数值的化合物具有越强的SO4·-反应活性,越容易被SO4·-降解。因此,获取污染物的数值,有助于污水处理中选择合适的工艺参数(如设计反应时间,药物的投加量等),也有助于评价该污染物在环境中的持久性与生态风险。化合物的数值的主要实验测定方法是竞争动力学法,该方法虽然可以获得比较准确的结果,但成本较高、耗费人力物力。目前有报道的有数值的化合物仅约200种,远不能满足SO4·-氧化技术工程参数的需求,也无法满足化学品风险管理的需要。截止2017年5月,美国化学文摘社(ChemicalAbstractsService,CAS)登记的化学品已超过1.29亿种,已经得到市场化的化学品超过14万种,面对数量如此庞大的化学品,单靠实验测定显然无法满足对的需要。因此,非常有必要发展可靠的实验替代技术用于获取有机物的数值。定量结构-活性关系(QuantitativeStructureActivityRelationship,QSAR)是指有机污染物的分子结构与其理化性质、环境行为或毒理学效应参数之间的定量关系,通过建立QSAR模型对有机物的各项性质进行预测,具有降低测试费用、缩短测试时间、弥补实验数据缺失、评估试验数据不确定性等诸多优势,因此QSAR技术在化学品风险管理中得到了广泛应用。为此2007年世界经济合作与发展组织(OECD)提出了QSAR模型发展的使用准则:(1)具有明确定义的环境指标;(2)具有明确的算法;(3)定义了模型的应用域;(4)模型具有适当的拟合度、稳定性和预测能力;(5)最好能够进行机理解释。该准则的提出为QSAR模型的发展和使用指明了方向。目前有报道的针对有机物与硫酸自由基水相反应速率常数的QSAR模型共有三例。文献“Environ.Sci.Technol,2015,49:13394-13402”选取分子的氧碳比及LUMO与HOMO的能量差作为分子描述符,预测了85种有机物分子(含有的基团包括碳碳双键、碳碳三键、醇羟基、酚羟基、醛基、羰基、羧基、酯基、氨基、醚键、氯原子、溴原子、二硫键等)的数值,相关系数R2达到0.86以上,但所含的化合物数目较少,模型应用域偏窄。文献“RSCAdv.2016,110:108448-108457”利用PaDEL描述符基于单一决策树和梯度提升决策树两种机器学习方法建立了预测同样85种有机物分子数值的QSAR模型,该文献报道的模型参数虽然较好,但缺少明确的计算公式,算法不透明,很大程度上限制了该模型的应用。文献“WaterRes.2017,116:106-115”基于基团贡献方法建立了两个预测113种有机物分子数值的QSAR模型,该模型仅需分子结构式即可确定各描述符的值并计算出反应速率常数,但缺点在于模型的外部验证能力不理想(外部验证系数R2ext仅有0.42-0.62,即预测能力不佳)。综上,基于硫酸自由基的反应在高级氧化技术中具有良好的发展前景,但目前数值缺失还十分严重,限制了这一技术的发展潜力,而对该参数的实验测定耗时费力,难以大批量进行,现有的QSAR模型覆盖化合物数量较少,缺少同时具备性能良好、使用方便等优势的模型。因此有必要基于现有实验数据的基础上,发展覆盖化合物范围更广的、便于应用的、可准确预测的QSAR模型,以满足化学品风险管理的需求。
技术实现思路
本专利技术提供了一种简便、准确、高效预测有机化学品与硫酸自由基水相反应速率常数的方法,该方法可以根据有机物分子结构预测其从而得以评估其环境持久性及水环境行为和归趋,进而为化学品风险评价与管理提供支持,并为基于硫酸自由基的高级氧化技术发展提供必要的数据支撑。本专利技术的技术方案:一种预测水相中有机物与硫酸自由基水相反应速率常数的定量结构活性关系模型,步骤如下:收集得到197种有机化合物的实验测定值,根据目标化合物名称和CAS号,确定目标化合物对应的结构,接下来对各分子结构进行MM2预优化,在此基础上,以PM6eps=78.6CHARGE=0EF1SCFGNORM=0.0100MULLIKPOLARDEBUGSHIFT=80为关键词,对三维mol文件进行PM6结构优化,生成最终用于计算描述符的mol文件和out文件;所述的有机化合物中含有碳碳双键、碳碳三键、醇羟基、酚羟基、羰基、醛基、羧基、酯基、酰胺基、硝基、氨基、氰基、醚键、二硫键、氟原子、氯原子、溴原子、碘原子和/或砷原子。有机化合物的结构通过量子化学描述符和Dragon描述符进行描述,量子化学描述符从优化后的结构中提取,Dragon描述符根据优化后的结构,计算得到4885个Dragon描述符,对符合以下原则的Dragon描述符进行舍弃:(1)标准偏差值低于0.0001的描述符;(2)常数或近常数描述符;(3)相关性不小于0.99的描述符;(4)存在缺失值的描述符;最终得到1241个Dragon描述符。将197种有机化合物随机分成5组,按照4:1的比例分为训练集和验证集;用去多法(Leave-many-out)将每组各做一次验证集,同时其余四组为训练集,使用逐步多元线性回归(MLR)方法对训练集数据进行拟合建模,用决定系数R2adj和均方根误差RMSE表征模型拟合度,按照拟合度的高低进行排序;然后进行内部验证和外部验证,用去一法交叉验证系数Q2LOO和Bootstrapping法交叉验证系数Q2BOOT表征模型的稳健性;用R2ext、Q2ext及RMSEext表征模型预测能力;综合模型的拟合度、稳健性、预测能力等多项指标选出最合适的模型,所得模型如下:logk=2.383×(AVS_B(p))+0.614×(EHOMO)-1.043×(GATS3m)-0.566×(SaaaC)+0.716×(nArNO2)-0.312×(MPC05)+0.482×(IC1)-1.625×(SpMax_EA(dm))+8.317ntrain=158,m=8,R2adj=0.819,Q2LOO=0.805,Q2BOOT=0.787,RMSEtrain=0.486,next=39,R2ext本文档来自技高网
...
预测水相中有机物与硫酸自由基水相反应速率常数的定量结构活性关系模型

【技术保护点】
一种预测水相中有机物与硫酸自由基水相反应速率常数的定量结构活性关系模型,其特征在于,步骤如下:收集得到197种有机化合物的

【技术特征摘要】
1.一种预测水相中有机物与硫酸自由基水相反应速率常数的定量结构活性关系模型,其特征在于,步骤如下:收集得到197种有机化合物的-实验测定值,根据目标化合物名称和CAS号,确定目标化合物对应的结构,接下来对各分子结构进行MM2预优化,在此基础上,以PM6eps=78.6CHARGE=0EF1SCFGNORM=0.0100MULLIKPOLARDEBUGSHIFT=80为关键词,对三维mol文件进行PM6结构优化,生成最终用于计算描述符的mol文件和out文件;有机化合物的结构通过量子化学描述符和Dragon描述符进行描述,量子化学描述符从优化后的结构中提取,Dragon描述符根据优化后的结构,计算得到4885个Dragon描述符,对符合以下原则的Dragon描述符进行舍弃:(1)标准偏差值低于0.0001的描述符;(2)常数或近常数描述符;(3)相关性不小于0.99的描述符;(4)存在缺失值的描述符;最终得到1241个Dragon描述符;将197种有机化合物随机分成5组,按照4:1的比例分为训练集和验证集;用去多法(Leave-many-out)将每组各做一次验证集,同时其余四组为训练集,使用逐步多元线性回归(MLR)方法对训练集数据进行拟合建模,用决定系数R2adj和均方根误差RMSE表征模型拟合度,按照拟合度的高低进行排序;然后进行内部验证和外部验证,用去一法交叉验证系数Q2LOO和Bootstrapping法交叉验证系数Q2BOOT表征模型的稳健性;用R2ext、Q2ext及RMSEext表征模型预测能力;综合模型的拟合度、稳健性、预测能力等多项指标选出最合适的模型,所得模型如下:logk=2.383×(AVS_B(p))+0.614×(EHOMO)-1.043×(GATS3m)-0.566×(SaaaC)+0.716×(nArNO2)-0.312×(MPC05)+0.482×(IC1)-1.625×(SpMax_EA(dm))+8.317ntrain=158,m...

【专利技术属性】
技术研发人员:乔显亮吴昊傅志强张新
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1