【技术实现步骤摘要】
一种基于机器学习预测化合物环境危害性的方法
[0001]本专利技术涉及一种化合物属性预测领域,尤其涉及一种基于机器学习预测化合物环境危害性的方法。
技术介绍
[0002]随着新化合物的生产和使用,每年大量化学物质进入环境介质,具有潜在的生态和环境健康效应。投入生产和使用的新化合物中,具有潜在的持久性、迁移性和毒性(persistent,mobile and toxic,PMT)及高持久性和高移动性(very persistent and very mobile,vPvM)属性。如何筛选出PMT/vPvM物质是当前化合物环境风险评估与管控领域亟需解决的难题。
[0003]PMT/vPvM是一种物质属性概念,当前研究并未公开预测化合物PMT/vPvM属性的方法,而新化合物的申报及环境风险评估与管控领域需要判别化合物的PMT/vPvM属性。因此,当前亟需开发一种可以批量、快速、精准预测物质PMT/vPvM属性的技术方法,通过该种方法筛选出PMT/vPvM物质,服务于PMT/vPvM物质的环境风险评估与管控。
[00 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习预测化合物环境危害性的方法,其特征在于,所述的化合物环境危害性是指化合物的持久性和迁移性及毒性,或化合物的高持久性和高迁移性,具体包括以下步骤:(1)建立化合物环境危害性筛选标准;(2)在化合物数据库中抽取部分化合物作为样本,根据步骤(1)建立的筛选标准筛选样本,将筛选结果作为样本标签;导出样本的smiles表达式后提取样本的特异性分子特征作为样本数据,对样本数据进行预处理;(3)基于机器学习算法构建预测模型,利用预处理后的样本数据对预测模型在样本标签的监督下进行训练,以优化预测模型参数;(4)导出待测化合物的smiles表达式后提取待测化合物的特异性分子特征,作为待测数据输入至参数优化的预测模型中,预测待测化合物是否具有环境危害性。2.根据权利要求1所述的基于机器学习预测化合物环境危害性的方法,其特征在于,所述的化合物数据库包括PubChem、ECHA、ChemDB和ChEMBL。3.根据权利要求1所述的基于机器学习预测化合物环境危害性的方法,其特征在于,步骤(2)中,根据步骤(1)建立的筛选标准筛选样本,如果样本符合化合物环境危害性筛选标准,则样本标签为1,否则样本标签为0。4.根据权利要求3所述的基于机器学习预测化合物环境...
【专利技术属性】
技术研发人员:庄树林,赵启明,高雨晨,张家晨,张良,苟艺源,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。