【技术实现步骤摘要】
化学品亚慢性毒性预测模型的建立方法及预测方法
[0001]本专利技术涉及化学品环境健康风险评估和食品安全评价
,具体涉及一种化学品亚慢性毒性预测模型的建立方法、预测方法及电子设备。
技术介绍
[0002]食品添加剂、塑料包装材料、各类日用品、化妆品、农药等消费品与工业产品是我们日常生活与工农业生产中不可或缺的一部分,其使用周期经常伴随人的一生。这些产品在生产、运输和使用等过程中会特意或非特意的引入大量化学品,由此引发的环境安全和健康问题目前已不可忽视。
[0003]化学污染可引发健康风险已获得共识,多数短时间内即会导致致命性危害的高毒性化学品已经被广泛禁用。但仍存在大量未知毒性的化学品长期暴露在人使用和接触范围内,如何评估化学品长时间暴露引发的健康风险是目前化学品风险评估面临的核心问题之一。慢性毒性及亚慢性毒性是评估化学品长期暴露风险的重要毒理学依据。
[0004]慢性毒性评估周期更长(1年以上),而亚慢性毒性实验周期相对较短(通常为80
‑
100天)。尽管慢性毒性暴露时间更长,但其过 ...
【技术保护点】
【技术特征摘要】
1.一种化学品亚慢性毒性预测模型的建立方法,包括:获取已知具有未观察到有害作用水平值的亚慢性毒性对应的化学品样本数据集,所述化学品样本数据集包括化学品的SMILES编码;将所述SMILES编码进行转换,得到具有N
×
F数字矩阵的化学品样本数据集;根据所述具有N
×
F数字矩阵的化学品样本数据集构建随机森林模型,并对所述随机森林模型进行交叉验证,得到最优化学品亚慢性毒性预测模型。2.根据权利要求1所述的方法,其中,所述获取已知具有未观察到有害作用水平值的亚慢性毒性对应的化学品样本数据集,包括:获取已知具有未观察到有害作用水平值的亚慢性毒性对应的化学品原始数据集,所述原始数据集包括化学品CAS号和SMILES编码;对所述化学品原始数据集进行预处理,得到预处理后的原始数据集;根据所述原始数据集中包括的化学品CAS号和SMILES编码,对所述预处理后的原始数据集进行比较分析,得到分析结果;根据所述分析结果,确定所述已知具有未观察到有害作用水平值的亚慢性毒性对应的化学品样本数据集。3.根据权利要求1所述的方法,其中,将所述SMILES编码进行转换得到具有N
×
F数字矩阵的化学品样本数据集,包括:根据所述SMILES编码,确定与SMILES编码对应的化学品的PubChem分子指纹;根据所述PubChem分子指纹,得到所述化学品的具有N
×
F数字矩阵。4.根据权利要求1所述的方法,其中,根据所述具有N
×
F数字矩阵的化学品样本数据集构建随机森林模型,并对所述随机森林模型进行交叉验证,得到最优化学品亚慢性毒性预测模型,包括:将所述具有N
×
F数字矩阵的化学品样本数据集按照预设比例划分为训练集和测试集,并将所述具有N
×
F数字矩阵的化学品样本数据集作为输入,构建随机森林模型;利用所述训练集训练所述随机森林模型,优化所述随机森林模型的超参数,确定最优超参数;利用所述测试集测试所述最优超参数下的随机森林模型,得到最优化学品亚慢性...
【专利技术属性】
技术研发人员:薛峤,赵璐,张爱茜,潘文筱,刘娴,
申请(专利权)人:中国科学院生态环境研究中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。