当前位置: 首页 > 专利查询>上海大学专利>正文

基于深度学习的Vocs组分分子质谱图预测方法、装置和存储介质制造方法及图纸

技术编号:36852539 阅读:13 留言:0更新日期:2023-03-15 17:26
本申请公开了基于深度学习的Vocs组分分子质谱图预测方法、装置和存储介质,本申请的方法包括根据NIST数据库中的分子和质谱图数据训练DeepVocsMass模型;向所述DeepVocsMass模型输入质谱图,得到相似度函数;根据所述相似度函数计算质谱图的相似度;输出相似度最高的质谱图。本申请通过深度学习技术对Vocs分子进行质谱图预测,通过训练深度神经网络模型,预测Vocs分子的质谱图,并通过与标准库进行对比,确定Vocs质谱图,实现对Vocs质谱监测结果的成份分析,对于大气环境Vocs治理和监测具有重要意义。重要意义。重要意义。

【技术实现步骤摘要】
基于深度学习的Vocs组分分子质谱图预测方法、装置和存储介质


[0001]本申请涉及深度学习领域,尤其是基于深度学习的Vocs组分分子质谱图预测方法、装置和存储介质。

技术介绍

[0002]当遇到一种身份不明的物质时,研究人员经常对样品进行质谱分析,并将观察到的光谱与先前收集的光谱库进行比较,以识别分子。但是,这种方法将无法识别不在现有库中的分子。
[0003]质谱法是一种广泛应用于化合物分析鉴定的技术。气相色谱

质谱特别适合于热稳定型Vocs挥发性有机物的检测。色谱质谱方法是气相色谱法中最常用的硬电离方法,它可以生成广泛的片段用于结构鉴定。频谱与数据库的匹配一直是常规的方法,计算数据库中未知谱与标准谱的相似性,将相似性最高的标准谱的结构作为未知谱的结构。该方式虽然使用广泛,但存在覆盖问题,如果该Vocs挥发性有机物不在数据库中,将无法被正确识别。
[0004]基于规则的方法、量子化学计算和机器学习是计算理论质谱的常用策略。基于规则的方法通常需要专家从大量的实验光谱中总结出解理规则,这需要专业的知识和努力。有研究分析了NIST中的190,825个条目并发现了68条电离的裂解规则。量子化学计算方法采用平衡和采样策略,随机选择快照,然后应用级联生产运行来生成片段。这种方法已经被一些具有代表性的谱证明,但需要较高的CPU计算能力和运行时间。
[0005]因此,相关技术存在的上述技术问题亟待解决。

技术实现思路

[0006]本申请旨在解决相关技术中的技术问题之一。为此,本申请实施例提供基于深度学习的Vocs组分分子质谱图预测方法、装置和存储介质,能够。
[0007]根据本申请实施例一方面,提供一种基于深度学习的Vocs组分分子质谱图预测方法,所述方法包括:
[0008]根据NIST数据库中的分子和质谱图数据训练DeepVocsMass模型;
[0009]向所述DeepVocsMass模型输入质谱图,得到相似度函数;
[0010]根据所述相似度函数计算质谱图的相似度;
[0011]输出相似度最高的质谱图。
[0012]在其中一个实施例中,所述根据NIST数据库中的分子和质谱图数据训练DeepVocsMass模型,包括:
[0013]构建质谱图生成模型;
[0014]将分子输入深度网络模型,训练得到所述DeepVocsMass模型。
[0015]在其中一个实施例中,所述构建质谱图生成模型,包括:
[0016]将分子转为为分子指纹;
[0017]对每个所述分子指纹输入全连接神经网络模型进行训练,得到所述全连接神经网络模型对分子的质谱图表示。
[0018]在其中一个实施例中,将分子输入深度网络模型,包括:
[0019]将所述分子指纹转换为长度为2000的向量,输入所述深度网络模型。
[0020]在其中一个实施例中,所述DeepVocsMass模型采用迁移深度网络模型的方式,输出层是一个与指定最大荷质比大小相同的全连接层,采用分类交叉熵作为损失函数,采用Adam优化算法作为优化器。
[0021]在其中一个实施例中,在根据所述相似度函数计算质谱图的相似度后,所述方法还包括:
[0022]构建相似度对比模型;
[0023]将待预测的目标质谱图输入所述相似度对比模型,输出所述待预测的目标质谱图与所述NIST数据库中相似度最高的若干个排序结果。
[0024]在其中一个实施例中,所述DeepVocsMass模型的每个层都接受前序的所有层作为额外输入。
[0025]根据本申请实施例一方面,提供基于深度学习的Vocs组分分子质谱图预测装置,所述装置包括:
[0026]第一模块,用于根据NIST数据库中的分子和质谱图数据训练DeepVocsMass模型;
[0027]第二模块,用于向所述DeepVocsMass模型输入质谱图,得到相似度函数;
[0028]第三模块,用于根据所述相似度函数计算质谱图的相似度;
[0029]第四模块,用于输出相似度最高的质谱图。
[0030]根据本申请实施例一方面,提供基于深度学习的Vocs组分分子质谱图预测装置,所述装置包括:
[0031]至少一个处理器;
[0032]至少一个存储器,所述存储器用于存储至少一个程序;
[0033]当至少一个所述程序被至少一个所述处理器执行时实现如前面实施例所述的基于深度学习的Vocs组分分子质谱图预测方法。
[0034]根据本申请实施例一方面,提供存储介质,所述存储介质存储有处理器可执行的程序,所述处理器可执行的程序被处理器执行时实现如前面实施例所述的基于深度学习的Vocs组分分子质谱图预测方法。
[0035]本申请实施例提供的基于深度学习的Vocs组分分子质谱图预测方法、装置和存储介质的有益效果为:本申请的方法包括根据NIST数据库中的分子和质谱图数据训练DeepVocsMass模型;向所述DeepVocsMass模型输入质谱图,得到相似度函数;根据所述相似度函数计算质谱图的相似度;输出相似度最高的质谱图。本申请通过深度学习技术对Vocs分子进行质谱图预测,通过训练深度神经网络模型,预测Vocs分子的质谱图,并通过与标准库进行对比,确定Vocs质谱图,实现对Vocs质谱监测结果的成份分析,对于大气环境Vocs治理和监测具有重要意义。
[0036]本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
[0037]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]图1为本申请实施例提供的基于深度学习的Vocs组分分子质谱图预测方法的流程图;
[0039]图2为本申请实施例提供的基于深度学习的Vocs组分分子质谱图预测方法的质谱图预测图例;
[0040]图3为本申请实施例提供的基于深度学习的Vocs组分分子质谱图预测装置的示意图;
[0041]图4为本申请实施例提供的另一种基于深度学习的Vocs组分分子质谱图预测装置的示意图。
具体实施方式
[0042]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0043]本申请的说明书和权利要求书及附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于深度学习的Vocs组分分子质谱图预测方法,其特征在于,所述方法包括:根据NIST数据库中的分子和质谱图数据训练DeepVocsMass模型;向所述DeepVocsMass模型输入质谱图,得到相似度函数;根据所述相似度函数计算质谱图的相似度;输出相似度最高的质谱图。2.根据权利要求1所述的基于深度学习的Vocs组分分子质谱图预测方法,其特征在于,所述根据NIST数据库中的分子和质谱图数据训练DeepVocsMass模型,包括:构建质谱图生成模型;将分子输入深度网络模型,训练得到所述DeepVocsMass模型。3.根据权利要求2所述的基于深度学习的Vocs组分分子质谱图预测方法,其特征在于,所述构建质谱图生成模型,包括:将分子转为为分子指纹;对每个所述分子指纹输入全连接神经网络模型进行训练,得到所述全连接神经网络模型对分子的质谱图表示。4.根据权利要求3所述的基于深度学习的Vocs组分分子质谱图预测方法,其特征在于,将分子输入深度网络模型,包括:将所述分子指纹转换为长度为2000的向量,输入所述深度网络模型。5.根据权利要求2所述的基于深度学习的Vocs组分分子质谱图预测方法,其特征在于,所述DeepVocsMass模型采用迁移深度网络模型的方式,输出层是一个与指定最大荷质比大小相同的全连接层,采用分类交叉熵作为损失函数,采用Adam优化算法作为优化器。6.根据权利要求1所述的基于深度学习的Vocs组分分子质...

【专利技术属性】
技术研发人员:刘立峰程平吕鑫石磊徐维嘉王文重张建军
申请(专利权)人:上海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1