一种基于分子指纹描述符的DBPs毒性预测方法技术

技术编号:41709175 阅读:11 留言:0更新日期:2024-06-19 12:39
本发明专利技术为一种基于分子指纹描述符的DBPs毒性预测方法,通过构建DBPs毒性数据集并获取对应的SMILES编码;基于所述SMILES编码获得对应的分子描述符;对所述分子指纹描述符进行预处理和筛选;将筛选后得到的数据集进行划分为训练集和外部测试集;构建预测DBPs毒性的QSAR模型;通过不同评价指标对模型进行评价,最终得到拟合优良,准确率高,鲁棒性较好的QSAR模型。本发明专利技术有效地克服了DBPs的毒性检测仪器珍贵,检测过程困难的问题,降低了检测能耗,为保障水质安全的进一步工作奠定了基础。同时对难以量化的新兴DBPs毒性的风险评价与健全管理具有指导意义和实用价值。

【技术实现步骤摘要】

本专利技术涉及化合物毒性预测,主要涉及一种基于分子指纹描述符的dbps毒性预测方法。


技术介绍

1、饮用水消毒是饮用水质保障的关键指标之一,饮用水监测是一项具有挑战性和耗时的任务。流行病学研究表明,饮用消毒饮用水可能会增加健康风险。因此,探究dbps的毒性对于降低与饮用水消毒相关的健康风险至关重要。近年来,由于算法以及算力的进步,科学家开始将机器学习引入计算毒理学领域,以提高毒性预测的正确性如利用特定算法,qsar模型可以首先学习现有数据(即训练数据)中结构特征(即描述符)和化学活性之间的相关规则,然后有效地利用所学规则预测新物质的毒性。

2、例如cn116541785b《基于深度集成机器学习模型的毒性预测方法及系统》提供了一种“基于深度集成机器学习模型的毒性预测方法及系统,包括:基于随机森林、支持向量机回归、有向信息传递神经网络及attentive fp模型作为基模型搭建stacking集成模型,利用急性毒性数据构建数据集对stacking集成模型进行训练及评价,并基于活性悬崖来划分毒性预测模型的适用域,生成毒性预测模型,获取待测毒性数据对应本文档来自技高网...

【技术保护点】

1.一种基于分子指纹描述符的DBPs毒性预测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于分子指纹描述符的DBPs毒性预测方法,其特征在于,所述方法还包括对分子描述符进行条件筛选之前对分子描述符进行数据预处理,所述数据预处理具体为将原始数据扩展为均值为0、标准差为1的标准数据。

3.根据权利要求2所述的一种基于分子指纹描述符的DBPs毒性预测方法,其特征在于,对所述分子描述符进行条件筛选具体为:

4.根据权利要求1所述的一种基于分子指纹描述符的DBPs毒性预测方法,其特征在于,所述方法还包括构建基于WOA-SVR模型的预测DBPs毒...

【技术特征摘要】

1.一种基于分子指纹描述符的dbps毒性预测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于分子指纹描述符的dbps毒性预测方法,其特征在于,所述方法还包括对分子描述符进行条件筛选之前对分子描述符进行数据预处理,所述数据预处理具体为将原始数据扩展为均值为0、标准差为1的标准数据。

3.根据权利要求2所述的一种基于分子指纹描述符的dbps毒性预测方法,其特征在于,对所述分子描述符进行条件筛选具体为:

4.根据权利要求1所述的一种基于分子指纹描述符的dbps毒性预测方法,其特征在于,所述方法还包括构建基于woa-svr模型的预测dbps毒性的qsar模型之前将所述分子描述符数据集按照9:1的比例划分为训练集和外部测试集,并将训练集按照7:3的比例划分为qsar模型训练集和qsar模型测试集。

5.根据权利要求4所述的一种基于分子指纹描述符的dbps毒性预测方法,其特征在于,构建基于woa-svr模型的预测dbps毒性的qsar模型,利用所述分子描述符数据集对所述qsar模型进行训练,获得训练完成的qsar模型具体为:

6.根据权利要求5所述的一种基于分子指纹描述符的dbps毒性预测方法,其特征在于,所述外部验证和内部验证具体为将外部测试集和qsar模型测试集输入训练完成的svr模型,获得svr模型的预测结果,根据所述预测结果和对应的真实值...

【专利技术属性】
技术研发人员:许东东蒋柱武潘纯涛白雪张宏宇
申请(专利权)人:福建理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1