当前位置: 首页 > 专利查询>暨南大学专利>正文

识别持久性有机污染物的深度学习方法和装置制造方法及图纸

技术编号:33617512 阅读:9 留言:0更新日期:2022-06-02 00:35
本发明专利技术属于环境监测领域,其公开了一种识别持久性有机污染物的深度学习方法和装置。方法包括:针对待识别的化合物,提取多个分子描述符,分子描述符的数量大于等于分子描述符阈值,分子描述符阈值为2201;以预设方式对多个分子描述符进行排列,得到二维结构特征描述矩阵;使用预先训练完成的深度卷积神经网络模型对二维结构特征描述矩阵进行处理,确定待识别的化合物是否为持久性有机污染物。装置包括提取模块、得到模块和确定模块。通过本方案从而能提高对商业化学品中潜在的持久性有机污染物的识别精度,且极大拓展了该深度卷积神经网络模型的鲁棒性,使其可以更加快速有效的识别具有不同化学结构以及元素组成的复杂有机化合物。合物。合物。

【技术实现步骤摘要】
识别持久性有机污染物的深度学习方法和装置


[0001]本专利技术属于环境监测领域,特别涉及一种识别持久性有机污染物的深度学习方法和装置。

技术介绍

[0002]上世纪五十年代以来,持久性有机污染物作为工业添加剂(例如:阻燃剂、表面处理剂、稳定剂等)以及农药(例如:林丹、DDTs、灭蚁灵等)被大量生产和使用,在全球各地引发了一系列区域环境污染事件,使人们逐渐认识到了这类化学品对环境和人类健康的危害性。这类化合物具备很强的持久性、生物累积性及毒性。
[0003]传统实验室鉴定方法昂贵且耗时,在实际应用中无法满足海量化学品的快速鉴定需求。而基于模型预测的方法主要为加权评分算法,该方法相对粗糙,其训练数据通常只包含几百种化学品,且仅使用了少量精心挑选过的分子描述符。由于单个分子描述符仅能识别提取特定的化学结构,在面对非相似结构的化学物质,特别是新型替代品时的鉴定能力会出现明显退化。

技术实现思路

[0004]本专利技术的目的是提出一种识别持久性有机污染物的深度学习方法和装置,能有效提高持久性有机污染物的识别精度,极大拓展模型的鲁棒性,使其可以更加快速有效的识别具有不同化学结构以及元素组成的复杂有机化合物。
[0005]为达到上述目的,本专利技术一方面提出了一种识别持久性有机污染物的深度学习方法,其包括以下步骤:
[0006]针对待识别的化合物,提取多个分子描述符,所述分子描述符的数量大于等于分子描述符阈值,所述分子描述符阈值为2201;以预设方式对多个所述分子描述符进行排列,得到二维结构特征描述矩阵;使用预先训练完成的深度卷积神经网络模型对所述二维结构特征描述矩阵进行处理,确定待识别的化合物是否为持久性有机污染物;其中,所述预设方式与训练所述深度卷积神经网络模型的训练数据集中各样本被提取的所有分子描述符的排列方式相同。
[0007]在如上所述的深度学习方法中,可选地,所述深度神经网络模型包括:输入层、隐层和输出层;沿数据的处理方向,所述隐层依次包括:第一卷积层、第二卷积层、第一池化层、第三卷积层、第四卷积层、第二池化层和全连接层,与第一池化层还连接有第一遗忘门,与所述第二池化层还连接有第二遗忘门,与所述全连接层还连接有第三遗忘门。
[0008]在如上所述的深度学习方法中,可选地,在所述针对待识别的化合物,提取多个分子描述符之前,所述深度学习方法还包括:构建所述训练数据集,所述训练数据集包括:多种持久性有机污染物和多种非持久性有机污染物。
[0009]在如上所述的深度学习方法中,可选地,所述持久性有机污染物的种类为1309,所述非持久性有机污染物的种类为9990;所述分子描述符的数量为 2201。
[0010]在如上所述的深度学习方法中,可选地,所述使用预先训练完成的深度卷积神经网络模型对所述二维结构特征描述矩阵进行处理,确定待识别的化合物是否为持久性有机污染物,包括:根据所述二维结构特征描述矩阵判断目标化合物是否低于设定阈值,若是,则确定待识别的化合物不为持久性有机污染物;若否,则确定待识别的化合物为持久性有机污染物。
[0011]另一方面还提供了一种识别持久性有机污染物的深度学习装置,其包括:提取模块,用于针对待识别的化合物,提取多个分子描述符,所述分子描述符的数量大于等于分子描述符阈值,所述分子描述符阈值为2201;得到模块,用于以预设方式对多个所述分子描述符进行排列,得到二维结构特征描述矩阵;确定模块,用于使用预先训练完成的深度卷积神经网络模型对所述二维结构特征描述矩阵进行处理,确定待识别的化合物是否为持久性有机污染物,训练所述深度卷积神经网络模型的训练数据集中各样本被提取的所有分子描述符的排列方式与所述预设方式相同。
[0012]在如上所述的深度学习装置中,可选地,所述确定模块中的深度神经网络模型包括:输入层、隐层和输出层;沿数据的处理方向,所述隐层依次包括:第一卷积层、第二卷积层、第一池化层、第三卷积层、第四卷积层、第二池化层和全连接层,与第一池化层还连接有第一遗忘门,与所述第二池化层还连接有第二遗忘门,与所述全连接层还连接有第三遗忘门。
[0013]在如上所述的深度学习装置中,可选地,所述深度学习装置还包括:训练数据集构建模块,用于构建训练数据集,所述训练数据集包括:多种持久性有机污染物和多种非持久性有机污染物。
[0014]在如上所述的深度学习装置中,可选地,所述持久性有机污染物的种类为1309,所述非持久性有机污染物的种类为9990;所述分子描述符的数量为 2201。
[0015]在如上所述的深度学习装置中,可选地,所述确定模块用于根据二维结构特征描述矩阵判断目标化合物是否低于设定阈值,若是,则确定待识别的化合物不为持久性有机污染物;若否,则确定待识别的化合物为持久性有机污染物。
[0016]本专利技术实施例提供的技术方案带来的有益效果是:
[0017]通过针对待识别的化合物,提取多个分子描述符,分子描述符的数量大于等于分子描述符阈值,分子描述符阈值为2201,以预设方式对多个分子描述符进行排列,得到二维结构特征描述矩阵,使用预先训练完成的深度卷积神经网络模型对二维结构特征描述矩阵进行处理,确定待识别的化合物是否为持久性有机污染物,从而能提高对商业化学品中潜在的持久性有机污染物的识别精度,且极大拓展了该深度卷积神经网络模型的鲁棒性,使其可以更加快速有效的识别具有不同化学结构以及元素组成的复杂有机化合物。
附图说明
[0018]图1为本专利技术一实施例提供的一种识别持久性有机污染物的深度学习方法的流程示意图;
[0019]图2为本专利技术另一实施例提供的一种识别持久性有机污染物的深度学习方法的流程示意图;
[0020]图3为本专利技术实施例提供的一种识别持久性有机污染物的深度学习装置的结构示
emerging environmental substances,监测新出现环境污染物的参考实验室、研究中心和相关组织的网络)的第三方化学品库。
[0034]步骤202,构建深度卷积神经网络模型。
[0035]具体地,深度卷积神经网络(Deep Convolutional Neural Network)是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习(DeepLearning)的代表算法之一。深度卷积神经网络具有极强的表征学习能力,能学习和存贮大量的输入

输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习方法是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。
[0036]参见图4,建立十二层的深度卷积神经网络模型,其包括:输入层、隐层及输出层,其中,隐层包括:四个卷积神经网络层、两个池化层、三个遗忘神经门(或称遗忘门)以及一个全连接层。四个卷积神经网络层包括:第一卷积神经网络层(或称卷积层1/第一卷积层)、第二卷积神经网络层(或称卷积层2/第二卷积层)、第三卷积神经网络层(或称卷积层3/第三卷积层) 和第四卷积神本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种识别持久性有机污染物的深度学习方法,其特征在于,所述深度学习方法包括:针对待识别的化合物,提取多个分子描述符,所述分子描述符的数量大于等于分子描述符阈值,所述分子描述符阈值为2201;以预设方式对多个所述分子描述符进行排列,得到二维结构特征描述矩阵;使用预先训练完成的深度卷积神经网络模型对所述二维结构特征描述矩阵进行处理,确定待识别的化合物是否为持久性有机污染物;其中,所述预设方式与训练所述深度卷积神经网络模型的训练数据集中各样本被提取的所有分子描述符的排列方式相同。2.根据权利要求1所述的深度学习方法,其特征在于,所述深度神经网络模型包括:输入层、隐层和输出层;沿数据的处理方向,所述隐层依次包括:第一卷积层、第二卷积层、第一池化层、第三卷积层、第四卷积层、第二池化层和全连接层,与第一池化层还连接有第一遗忘门,与所述第二池化层还连接有第二遗忘门,与所述全连接层还连接有第三遗忘门。3.根据权利要求1所述的深度学习方法,其特征在于,在所述针对待识别的化合物,提取多个分子描述符之前,所述深度学习方法还包括:构建所述训练数据集,所述训练数据集包括:多种持久性有机污染物和多种非持久性有机污染物。4.根据权利要求3所述的深度学习方法,其特征在于,所述持久性有机污染物的种类为1309,所述非持久性有机污染物的种类为9990;所述分子描述符的数量为2201。5.根据权利要求1所述的深度学习方法,其特征在于,所述使用预先训练完成的深度卷积神经网络模型对所述二维结构特征描述矩阵进行处理,确定待识别的化合物是否为持久性有机污染物,包括:根据所述二维结构特征描述矩阵判断目标化合物是否低于设定阈值,若是,则确定待识别的化合物不为持久性有机污染物;若否,则确定待识...

【专利技术属性】
技术研发人员:孙翔飞曾永平麦磊谢梦仪江瑞芬
申请(专利权)人:暨南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1