一种预测有机化学品的皮肤渗透系数的方法技术

技术编号:11083414 阅读:256 留言:0更新日期:2015-02-26 09:57
本发明专利技术涉及健康风险评估测试策略领域,具体来说,涉及一种预测有机化学品的皮肤渗透系数方法。在获得化合物分子结构的基础上,通过计算表征结构特征的描述符,应用定量结构活性关系QSAR构建预测模型,与传统试验方法测定皮肤渗透参数相比,符合动物福利保护,减少了测试时间和成本,能够快速有效的预测皮肤渗透系数。本发明专利技术严格按照经济合作与发展组织(OECD)提出QSAR模型构建和使用准则规定的5个标准,通过计算化合物物理化学、电性能、拓扑和量子化学参数作为预测描述符,利用K-S分组将原始数据进行分类,筛选出7种最优描述符,运用清晰、简单、快速、透明的GA-MLR算法,模型应用域明确,具有良好的拟合效果、稳健性和预测能力。皮肤渗透系数预测模型能够准确、高效地完成化合物皮肤渗透系数的预测,为有机化合物健康危害评价提供有效方法。

【技术实现步骤摘要】

本专利技术涉及健康风险评估测试策略领域,具体来说,涉及一种预测有机化学品的 皮肤渗透系数方法。 技术背景 化合物通过皮肤渗入人体后可能会产生皮肤刺激、发炎和过敏等症状。皮肤经常 会有意识或无意识地暴露于化合物,为此化合物的皮肤吸收性成为安全评价过程的一个重 要组成部分。皮肤渗透系数是皮肤与化学品接触风险评估的一个关键指标,REACH法规中, 年产量或进口量超过It时,所有物质都必须进行皮肤敏感度检测,年产量或进口量低于It 时,对皮肤敏感度进行分类和评估可以依据可得到的信息、(Q) SAR和交互比对。 根据OE⑶化学品测试指南,豚鼠(0E⑶406)和小鼠(0E⑶429)作为皮肤敏感度测 试生物,但是传统皮肤渗透系数测试不仅需要花费大量费用和时间,而且与动物福利相悖, 目前没有国际上公认的测试方法用于预测化学品引起皮肤渗透系数的能力。定量结构-皮 肤渗透系数关系(QSAR)替代动物试验方法获得数据信息已经用于提供对皮肤渗透系数的 完整评估,得到的预测模型比实验测试更快、更有效,同时反映和揭示有机污染物的分子结 构和皮肤渗透系数之间的内在联系,具有弥补测试数据的缺失、降低测试费用、评估数据的 不确定性的优点。OECD提出QSAR模型构建和使用准则规定的5个标准:(1)具有明确定义 的环境指标;(2)明确的算法;(3)定义了模型的应用域;(4)模型具有适当的拟合度、稳定 性和预测能力;(5)最好能够进行机理解释。QSAR模型在有机化学品的生态风险评价领域 得到了越来越广泛的重要和应用。 目前,已有研究者开展了应用QSAR方法构建了有机化合物皮肤渗透系数预测 模型。如文献Elsevier, New York:1990,93构建了化合物皮肤渗透系数与理化性 质之间的关系模型,该模型采用辛醇/水分配系数构建了 90多种化合物皮肤渗透系 数预测模型,后经修正、引入分子质量参数后,模型的R2达到了 〇. 67 ;文献Chemical research in toxicology 1998, 11 (8),902-908利用正辛醇/水分配系数、分子体积 和熔点完成了皮肤渗透系数的预测,模型的R2最高可达0.765。文献Toxicology in Vitro 1995, 9 (I),27-37采用多元回归分析法建立了简单快速的皮肤渗透系数QSPR模 型。由于上世纪90年代中期文献报道皮肤致敏度预测研究引入的结构参数较少,预测 准确度低。进入 21 世纪后,文献Quantitative Structure-Activity Relationships 2000, 19(5),467-474?和 Toxicological Sciences 2000, 55(1),215-222,,引入了电性 能和空间参数完成了对42种酯类的皮肤刺激性预测研究。文献QSAR&Combinatorial Science 2008, 27 (1),49-59研究发现化合物皮肤刺激性与分子体系、分子折射率、分子形 状、空间效应、偶极矩、解离常数pKa、正辛醇/水分配系数IogKow等物理化学性质密切相 关,其中IogKow对皮肤渗透系数的影响最大。紧接着,文献Journal of pharmaceutical sciences 2009, 98 (11),4069-4084进一步改进了皮肤渗透系数QSAR预测模型,利用 C0DESSA和Dragon两种软件计算了构成、拓扑、几何、热力学、量子化学、静电、官能团组和 其他描述符,他们采用神经网络算法构建了非线性的皮肤渗透系数系数的定量构效关系, 最后所得的相关系数R2为〇. 93。但是神经网络属于黑箱子操作,无法提取预测规则,预测 能力和训练能力可能会出现过拟合的矛盾问题,可理解性差,不利于模型应用和机理解释。 因此,亟需建立一个涵盖多种类化合物、模型结构简单、预测规则透明、易于理解、精确、快 速有效的QSAR模型,并且能够节约时间、人力、物力,符合动物保护原则,同时按照OECD导 则进行模型的应用域表征和机理解释的皮肤渗透系数QSAR模型,为化学品的接触风险评 估提供重要数据支持。
技术实现思路
本专利技术的目的是针对上述不足之处,提供一种简洁、快速、有效预测化学品皮肤渗 透系数的方法。该方法根据化学物质的分子结构预测皮肤渗透系数,进而对目标化合物的 皮肤渗透系数进行预测和评价。为化学品的健康风险评估提供重要数据支持。 -种预测有机化学品的皮肤渗透系数的方法,其特征在于: 步骤一、从收集132个化合物的皮肤渗透系数数据; 步骤二、按照K-S分组方法将步骤一的样本数据集进行分组,其中训练集共选取 92个样本化合物,验证集共选取40个样本化合物;所述训练集用于构建预测模型,验证集 数据用于外部验证,内部验证采用留一法交互验证(即L00-CV);分组后的数据如下: 皮肤渗透性模型化合物信息 本文档来自技高网
...
一种预测有机化学品的皮肤渗透系数的方法

【技术保护点】
一种预测有机化学品的皮肤渗透系数的方法,其特征在于:步骤一、从收集132个化合物的皮肤渗透系数数据;步骤二、按照K‑S分组方法将步骤一的样本数据集进行分组,其中训练集共选取92个样本化合物,验证集共选取40个样本化合物;所述训练集用于构建预测模型,验证集数据用于外部验证,内部验证采用留一法交互验证;分组后的数据如下:皮肤渗透性模型化合物信息步骤三、建立模型:采用遗传算法进行变量选择,所使用的相关参数为:种群数100,变异概率0.5,模型中允许的最大特征个数10,其他参数均为默认值;当增加变量数目对模型结果影响不大时,筛选出影响皮肤渗透性的7个最优描述符数,采用多元线性回归方法建立了线性模型;筛选出7种分子描述符及模型如下:GLA‑MLR线性方程:Log Fl=–0.323–0.510BEHm8–0.316GGI2–0.064RDF030u–2.173Mor17v–0.446G2s+1.587H5m+2.546RTu+(ntr=92  R2tr=0.862  RMSEtr=0.290  ntr=40  R2tst=0.614RMSEtst=0.290  Q2loo=0.835  Q2ext=0.705);所述BEHm8表示Burden特征值,GGI2表示拓扑电荷指数,RDF030u表示分子体积,Mor17v表示分子的3D结构和大小,G2s属于WHIM描述符,H5m表示分子的大小和原子的性质,RTu+表示化合物结构片段的相关信息;所述训练集和验证集实验值和预测值的相关系数分别达到0.862和0.614;其中,n为样本化合物的数目,R2为内部检验的相关系数,RMSE为均方根误差,Q2为外部检验的相关系数;步骤四、预测未知化合物的皮肤渗透系数,未知化合物经过分子结构的输入和结构优化过程,通过Dragon软件计算7种描述符,分别为上述BEHm8、GGI2、RDF030v、Mor17v、G2s、H5m、RTu+,利用步骤三的预测模型得到未知化合物预测值。...

【技术特征摘要】
1. 一种预测有机化学品的皮肤渗透系数的方法,其特征在于: 步骤一、从收集132个化合物的皮肤渗透系数数据; 步骤二、按照K-S分组方法将步骤一的样本数据集进行分组,其中训练集共选取92个 样本化合物,验证集共选取40个样本化合物;所述训练集用于构建预测模型,验证集数据 用于外部验证,内部验证采用留一法交互验证;分组后的数据如下: 皮肤渗透性模型化合物信息步骤三、建立模型:采用遗传算法进行变量选择,所使用的相关参数为:种群数100,变 异概率0. 5,模型中允许的最大特征个数10,其他参数均为默认值;当增加变量数目对模型 结果影响不大时,筛选出影响皮肤渗透性的7个最优描述符数,采用多元线性回归方法建 立了线性模型; 筛选出7种分子描述符及模型如下: GLA-MLR线性方程: Log Fl = - 0. 323 - 0. 510BEHm8 - 0. 316GGI2 - 0. 064RDF030u - 2. 173Morl7v - 0.446G2s+l. 587H5m+2. 546RTu+ (ntr = 92 R2tr = 0. 862 RMSEtr = 0. 290 ntr = 40 R2tst = 0. 614 ...

【专利技术属性】
技术研发人员:刘济宁范德玲王蕾石利利
申请(专利权)人:环境保护部南京环境科学研究所
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1