当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于机器学习预测化合物环境危害性的方法技术

技术编号:32645496 阅读:129 留言:0更新日期:2022-03-12 18:26
本发明专利技术公开了一种基于机器学习预测化合物环境危害性的方法,所述的化合物环境危害性是指化合物的持久性和迁移性及毒性,或化合物的高持久性和高迁移性,包括以下步骤:(1)建立化合物环境危害性筛选标准;(2)采集样本标签和样本数据,对样本数据进行预处理;(3)基于机器学习算法构建预测模型,利用预处理后的样本数据优化预测模型参数;(4)预测待测化合物是否具有环境危害性。本发明专利技术方法是以化合物的分子结构为基础,根据化合物结构与其PMT属性或vPvM属性之间的关系建立预测模型,填补了当前技术在PMT物质和vPvM物质预测领域内的空白,具有批量、快速、精准的优点,可为化合物风险评价与管控提供指导。价与管控提供指导。价与管控提供指导。

【技术实现步骤摘要】
一种基于机器学习预测化合物环境危害性的方法


[0001]本专利技术涉及一种化合物属性预测领域,尤其涉及一种基于机器学习预测化合物环境危害性的方法。

技术介绍

[0002]随着新化合物的生产和使用,每年大量化学物质进入环境介质,具有潜在的生态和环境健康效应。投入生产和使用的新化合物中,具有潜在的持久性、迁移性和毒性(persistent,mobile and toxic,PMT)及高持久性和高移动性(very persistent and very mobile,vPvM)属性。如何筛选出PMT/vPvM物质是当前化合物环境风险评估与管控领域亟需解决的难题。
[0003]PMT/vPvM是一种物质属性概念,当前研究并未公开预测化合物PMT/vPvM属性的方法,而新化合物的申报及环境风险评估与管控领域需要判别化合物的PMT/vPvM属性。因此,当前亟需开发一种可以批量、快速、精准预测物质PMT/vPvM属性的技术方法,通过该种方法筛选出PMT/vPvM物质,服务于PMT/vPvM物质的环境风险评估与管控。
[0004]公开号为CN1本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习预测化合物环境危害性的方法,其特征在于,所述的化合物环境危害性是指化合物的持久性和迁移性及毒性,或化合物的高持久性和高迁移性,具体包括以下步骤:(1)建立化合物环境危害性筛选标准;(2)在化合物数据库中抽取部分化合物作为样本,根据步骤(1)建立的筛选标准筛选样本,将筛选结果作为样本标签;导出样本的smiles表达式后提取样本的特异性分子特征作为样本数据,对样本数据进行预处理;(3)基于机器学习算法构建预测模型,利用预处理后的样本数据对预测模型在样本标签的监督下进行训练,以优化预测模型参数;(4)导出待测化合物的smiles表达式后提取待测化合物的特异性分子特征,作为待测数据输入至参数优化的预测模型中,预测待测化合物是否具有环境危害性。2.根据权利要求1所述的基于机器学习预测化合物环境危害性的方法,其特征在于,所述的化合物数据库包括PubChem、ECHA、ChemDB和ChEMBL。3.根据权利要求1所述的基于机器学习预测化合物环境危害性的方法,其特征在于,步骤(2)中,根据步骤(1)建立的筛选标准筛选样本,如果样本符合化合物环境危害性筛选标准,则样本标签为1,否则样本标签为0。4.根据权利要求3所述的基于机器学习预测化合物环境...

【专利技术属性】
技术研发人员:庄树林赵启明高雨晨张家晨张良苟艺源
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1