一种化学品潜在长期健康危害分类预测方法、介质及系统技术方案

技术编号:38527635 阅读:10 留言:0更新日期:2023-08-19 17:03
本发明专利技术提供了一种化学品潜在长期健康危害分类预测方法、介质及系统,属于化学品危害技术领域,该方法包括:根据已知的化学品对人体的潜在长期健康危害类别,获取不同危害类别的代表性化学品组;对不同危害类别的代表性化学品组中的每种化学品,获取化学物质结构指纹特征;建立化学品潜在长期健康危害预测模型;获取待分析化学品的化学物质结构指纹特征;利用化学品潜在长期健康危害预测模型对待分析化学品的化学物质结构指纹特征进行分析,得到待分析化学品的潜在长期健康危害分类。本化学品潜在长期健康危害分类预测方法、介质及系统能够解决难以通过实验的方式来分析化学品对人体的潜在长期健康危害难以得到危害分类的技术问题。技术问题。技术问题。

【技术实现步骤摘要】
一种化学品潜在长期健康危害分类预测方法、介质及系统


[0001]本专利技术属于化学品危害
,具体而言,涉及一种化学品潜在长期健康危害分类预测方法、介质及系统。

技术介绍

[0002]化学品对人体产生危害主要包括:腐蚀性、易燃易爆性、放射性、环境污染、生物毒性等,其中生物毒性为当化学品进入人体后,会在生物体内发生一系列的生物化学反应,如与生物大分子如蛋白质、脂质、核酸等结合,从而影响正常的生物过程。例如,某些化学品可与DNA结合,导致DNA损伤或突变,从而引发癌症或遗传疾病。主要包括如下:细胞毒性:化学品可能对细胞产生直接的毒性作用,如破坏细胞膜、干扰细胞内信号传导、抑制酶活性等。这些作用可能导致细胞功能障碍、细胞死亡或组织损伤。
[0003]免疫系统影响:化学品可能对免疫系统产生影响,如激活或抑制免疫细胞、干扰细胞因子和趋化因子的产生等。这些影响可能导致免疫系统功能紊乱,使个体更容易感染病原微生物或发生过敏反应。
[0004]内分泌干扰:某些化学品具有内分泌干扰活性,即它们可以模拟或抑制内分泌系统中的激素,从而影响生物体内的激素平衡。这可能导致生殖系统、神经系统、免疫系统等多个系统的功能障碍。
[0005]神经毒性:化学品可能对神经系统产生毒性作用,如干扰神经递质的合成、释放和传导、抑制酶活性、诱导氧化应激等。这些作用可能导致神经功能障碍、神经退行性疾病等。
[0006]生态毒性:化学品可能对生态系统产生危害,如影响水生生物的生长、繁殖和行为、干扰陆生生物的食物链等。这些影响可能导致生物多样性减少、生态系统功能紊乱等。
[0007]生殖毒性:某些化学品可能对生殖系统造成损害,导致生育能力降低或胎儿发育异常。这类化学品被称为生殖毒性物质,如铅、汞等。
[0008]化学品对人体的短期危害容易观察,不过由于不少化学品会对人体产生潜在的长期健康危害,这一类的危害由于短期没有或只有极其轻微的症状或反应,用通用的实验的方式短时间内无法得到实验结果,因此难以分析化学品对人体的潜在长期健康危害的分类。

技术实现思路

[0009]有鉴于此,本专利技术提供一种化学品潜在长期健康危害分类预测方法、介质及系统,能够解决难以通过实验的方式来分析化学品对人体的潜在长期健康危害难以得到危害分类的技术问题。
[0010]本专利技术是这样实现的:本专利技术的第一方面提供一种化学品潜在长期健康危害分类预测方法,其中,包括以下步骤:S10、根据已知的化学品对人体的潜在长期健康危害类别,获取不同危害类别的代
表性化学品组;S20、对不同危害类别的代表性化学品组中的每种化学品,根据化学品的分子结构、物理化学性质、生物活性数据提取化学物质结构指纹特征;S30、建立化学品潜在长期健康危害预测模型;S40、获取待分析化学品的化学物质结构指纹特征;S50、利用化学品潜在长期健康危害预测模型对待分析化学品的化学物质结构指纹特征进行分析,得到待分析化学品的潜在长期健康危害分类。
[0011]在上述技术方案的基础上,本专利技术的一种化学品潜在长期健康危害分类预测方法还可以做如下改进:其中,所述根据已知的化学品对人体的潜在长期健康危害类别,获取不同危害类别的代表性化学品组的步骤,具体包括:获取多个化学品名称,建立待选代表化学品列表,其中所述待选代表化学品列表包含的待选化学品数量为Cn;获取所述待选代表化学品列表中的每个待选化学品的技术资料,包括科技文章、专利、专著或文献;选择大语言模型并根据所述每个待选化学品的技术资料建立所述大语言模型的化学品毒性知识库;对大语言模型进行针对化学品毒性的总结进行微调;使用微调后的大语言模型对每个待选化学品的技术资料进行总结,得到待选化学品的毒性数据,包括危害类别和致毒剂量;针对每一种危害类别的待选化学品,根据致毒剂量,均匀选择Cm个待选化学品,建立该危害类别的代表性化学品组。
[0012]进一步的,所述对大语言模型进行针对化学品毒性的总结进行微调的步骤,具体包括:对知识库中与每个待选化学品相关的毒性描述语句进行筛选,得到每个待选化学品的毒性描述数据集;利用大语言模型对所述毒性描述数据集中的每个描述语句进行危害类别分类,得到第一分类集,所述第一分类集包括多个分类元素,每个分类元素对应一个描述语句及大语言模型对这个描述语句的危害类别分类;获取对第一分类集中每个分类元素的人工标签,其中人工标签为专业人员对每个分类元素的打分数据,分为

1、0、1,三种分值,其中,

1表示分类错误,1表示分类正确,0表示该分类元素既有包含的分类又包含错误的分类;删除第一分类集中分值为

1的分类元素,形成第二分类集;采用第二分类集对大语言模型进行微调。
[0013]进一步的,所述建立化学品潜在长期健康危害预测模型库的步骤具体包括:建立训练样本、所述训练样本为代表性化学品组中的每种化学品及其化学物质结构指纹特征,其中训练的输入为化学物质结构指纹特征,训练的输出为化学品的危害类别;建立神经网络并训练、采用卷积神经网络模型建立化学品潜在长期健康危害预测模型雏形;
模型训练、利用训练样本对化学品潜在长期健康危害预测模型雏形进行训练,得到化学品潜在长期健康危害预测模型。
[0014]进一步的,所述卷积神经网络的结构包含若干输入层、卷积层、激活层、池化层和全连接层,其中所述输入层用于接收矩阵处理后的化学品的化学物质结构指纹特征,所述卷积层用于对输入数据进行卷积操作,提取局部特征,所述激活层用于对卷积层的输出进行非线性变换,所述池化层用于对激活层的输出进行降采样,所述全连接层用于将池化层的输出展平并进行线性变换,输出化学品的危害类别。
[0015]进一步的,所述卷积神经网络的训练步骤包括初始化参数、前向传播、计算损失、反向传播以及迭代训练多个步骤。
[0016]进一步的,对化学品的化学物质结构指纹特征进行矩阵处理的步骤,具体包括:对所述化学物质结构指纹特征进行预处理,包括缺失值处理、异常值处理以及数据标准化;对预处理后的化学物质结构指纹特征建立矩阵,包括特征值提取、特征值选择以及特征矩阵构建。
[0017]其中,所述Cn=500;所述Cm=10。
[0018]本专利技术的第二方面提供一种计算机可读存储介质,其中,所述计算机可读存储介质中存储有程序指令,所述程序指令运行时用于执行上述的一种化学品潜在长期健康危害分类预测方法。
[0019]本专利技术的第三方面提供一种化学品潜在长期健康危害分类预测系统,其中,包含上述的计算机可读存储介质。
[0020]与现有技术相比较,本专利技术提供的一种化学品潜在长期健康危害分类预测方法、介质及系统的有益效果是:1.待分析化学品的化学物质结构指纹特征,利用利用化学品潜在长期健康危害预测模型对待分析化学品的化学物质结构指纹特征进行分析,得到待分析化学品的潜在长期健康危害分类,无需对待分析化学品的潜在长期健康危害进行实验,得到结果高效;2.利用微调后的大语言模型对每个待选化学品的技术资料本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种化学品潜在长期健康危害分类预测方法,其特征在于,包括以下步骤:S10、根据已知的化学品对人体的潜在长期健康危害类别,获取不同危害类别的代表性化学品组;S20、对不同危害类别的代表性化学品组中的每种化学品,根据化学品的分子结构、物理化学性质、生物活性数据提取化学物质结构指纹特征;S30、建立化学品潜在长期健康危害预测模型;S40、获取待分析化学品的化学物质结构指纹特征;S50、利用化学品潜在长期健康危害预测模型对待分析化学品的化学物质结构指纹特征进行分析,得到待分析化学品的潜在长期健康危害分类。2.根据权利要求1所述的一种化学品潜在长期健康危害分类预测方法,其特征在于,所述根据已知的化学品对人体的潜在长期健康危害类别,获取不同危害类别的代表性化学品组的步骤,具体包括:获取多个化学品名称,建立待选代表化学品列表,其中所述待选代表化学品列表包含的待选化学品数量为Cn;获取所述待选代表化学品列表中的每个待选化学品的技术资料,包括科技文章、专利、专著或文献;选择大语言模型并根据所述每个待选化学品的技术资料建立所述大语言模型的化学品毒性知识库;对大语言模型进行针对化学品毒性的总结进行微调;使用微调后的大语言模型对每个待选化学品的技术资料进行总结,得到待选化学品的毒性数据,包括危害类别和致毒剂量;针对每一种危害类别的待选化学品,根据致毒剂量,均匀选择Cm个待选化学品,建立该危害类别的代表性化学品组。3.根据权利要求2所述的一种化学品潜在长期健康危害分类预测方法,其特征在于,所述对大语言模型进行针对化学品毒性的总结进行微调的步骤,具体包括:对知识库中与每个待选化学品相关的毒性描述语句进行筛选,得到每个待选化学品的毒性描述数据集;利用大语言模型对所述毒性描述数据集中的每个描述语句进行危害类别分类,得到第一分类集,所述第一分类集包括多个分类元素,每个分类元素对应一个描述语句及大语言模型对这个描述语句的危害类别分类;获取对第一分类集中每个分类元素的人工标签,其中人工标签为专业人员对每个分类元素的打分数据,分为

1、0、1,三种分值,其中,

1表示分类错误,1表示分类正确,0表示该分类元素既有包含的分类又包含错误的分类;删除第一...

【专利技术属性】
技术研发人员:车礼东张少岩刘宝黄红花赵祖亮李少杰王金花张庆建范晓明管晓倩
申请(专利权)人:青岛海关技术中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1