System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请属于化合物分析,尤其涉及一种化合物的化学结构确定方法、装置及终端设备。
技术介绍
1、质谱技术在分析复杂系统中多样性小分子的内容方面发挥着至关重要的作用,尤其是在生物复杂体系中,如代谢组学等。在小分子化合物的定性分析中,传统的定性方法主要是将待解析化合物的质谱与标准质谱数据库中的质谱进行匹配,以获取待解析化合物的相关数据,确定待解析化合物的结构特征,但这种方法无法实现对数据库中未收录的化合物进行结构解析,存在分析覆盖面小的问题亟需解决。
技术实现思路
1、本申请目的在于提供一种化合物的化学结构确定方法、装置及终端设备,旨在解决现有技术中无法实现对数据库中未收录的化合物进行结构解析,存在分析覆盖面小的问题。
2、本申请实施例的第一方面提供了一种化合物的化学结构确定方法,其特征在于,所述化学结构确定方法包括:
3、根据待确定化合物的质谱图确定所述待确定化合物的分子式和至少一个临近质谱图,每个临近质谱图对应一临近化合物;
4、根据所述分子式确定出至少一个候选化合物;
5、根据每个候选化合物在化学空间中与所述每个临近化合物的空间距离,确定所述待确定化合物的化学结构。
6、优选地,在所述根据待确定化合物的质谱图确定所述待确定化合物的分子式和临近质谱图之前,所述化学结构确定方法还包括:
7、将待匹配质谱图数据库中的每个质谱图转换为对应的自然语言;
8、将每个质谱图的自然语言输入至一数据转换模型,由所述数据
9、将所述每个质谱图对应的质谱数值向量保存至一数值矩阵中。
10、优选地,所述根据待确定化合物的质谱图确定所述待确定化合物的至少一个临近质谱图包括:
11、将所述待确定化合物的质谱图转换为自然语言输入至所述数据转换模型,由所述数据转换模型输出所述待确定化合物对应的质谱数值向量;
12、在所述数值矩阵中,筛选与所述待确定化合物对应的质谱数值向量之间的向量距离符合预设阈值的质谱数值向量,将筛选得到的至少一个质谱数值向量设置为临近质谱数值向量;
13、确定每个临近质谱数值向量对应的临近质谱图;每个临近质谱图对应一临近化合物。
14、优选地,所述根据待确定化合物的质谱图确定所述待确定化合物的分子式包括:
15、根据待确定化合物的质谱图确定所述待确定化合物的相对分子质量;
16、根据所述待确定化合物的相对分子质量确定所述待确定化合物的分子式。
17、优选地,所述根据所述分子式确定出至少一个候选化合物,包括:
18、根据所述分子式,在待匹配化合物结构数据库中筛选得到与所述分子式相同的至少一个待匹配化合物;
19、将所述至少一个待匹配化合物确定为候选化合物。
20、优选地,在所述根据每个候选化合物在化学空间中与所述每个临近化合物的空间距离,确定所述待确定化合物的化学结构之前,所述化学结构确定方法还包括:
21、获取所述每个候选化合物和所述临近化合物的化学结构数据;
22、将所述每个候选化合物和所述临近化合物的化学结构数据转换为各自一一对应的结构数值向量;
23、将多个结构数值向量分别投射到化学空间,每个结构数值向量对应所述化学空间内的一个点。
24、优选地,所述根据每个候选化合物在化学空间中与所述每个临近化合物的空间距离,确定所述待确定化合物的化学结构,包括:
25、计算得到所述候选化合物对应的点与所述临近化合物对应的每一个点之间的平均距离;
26、重复上述计算过程,得到剩余候选化合物对应的点与所述临近化合物对应的每一个点之间的平均距离;
27、将计算得到的所有平均距离按照由小到大依次排序,选择位于首位的平均距离对应的候选化合物为所述待确定化合物,所述候选化合物对应的结构数据即为所述待确定化合物的结构数据。
28、本申请实施例的第二方面提供了一种化合物的化学结构确定装置,所述化学结构确定装置包括:
29、第一确定模块,用于根据待确定化合物的质谱图确定所述待确定化合物的分子式和至少一个临近质谱图,每个临近质谱图对应一临近化合物;
30、第二确定模块,用于根据所述分子式确定出至少一个候选化合物;
31、第三确定模块,用于根据每个候选化合物在化学空间中与所述每个临近化合物的空间距离,确定所述待确定化合物的化学结构。
32、本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法。
33、本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的方法。
34、本申请实施例的第五方面提供了一种计算机程序产品,当所述计算机程序产品在终端设备上运行时,使得所述终端设备执行上述第一方面所述的方法。
35、本申请有益效果
36、本申请采用的技术方案中,除了根据待确定化合物的质谱图确定待确定化合物的分子式和临近化合物,还进一步根据待确定化合物的分子式确定出至少一个候选化合物,通过每个候选化合物在化学空间中与临近化合物的空间距离确定待确定化合物的化学结构,与现有技术相比,本申请方法的突破在于不仅仅只是依赖于事先建立的质谱数据库,而是在化学空间中更全面地探索可能的结构,这种创新不仅拓宽了化合物分析的覆盖范围,而且解决了现有技术在处理未知化合物时无法进行结构解析的问题,为未知化合物的鉴定提供了更全面的解决方案。
本文档来自技高网...【技术保护点】
1.一种化合物的化学结构确定方法,其特征在于,所述化学结构确定方法包括:
2.根据权利要求1所述的化学结构确定方法,其特征在于,在所述根据待确定化合物的质谱图确定所述待确定化合物的分子式和临近质谱图之前,所述化学结构确定方法还包括:
3.根据权利要求2所述的化学结构确定方法,其特征在于,所述根据待确定化合物的质谱图确定所述待确定化合物的至少一个临近质谱图包括:
4.根据权利要求1所述的化学结构确定方法,其特征在于,所述根据待确定化合物的质谱图确定所述待确定化合物的分子式包括:
5.根据权利要求1所述的化学结构确定方法,其特征在于,所述根据所述分子式确定出至少一个候选化合物,包括:
6.根据权利要求1所述的化学结构确定方法,其特征在于,在所述根据每个候选化合物在化学空间中与所述每个临近化合物的空间距离,确定所述待确定化合物的化学结构之前,所述化学结构确定方法还包括:
7.根据权利要求1所述的化学结构确定方法,其特征在于,所述根据每个候选化合物在化学空间中与所述每个临近化合物的空间距离,确定所述待确定化合物的化学
8.一种化合物的化学结构确定装置,其特征在于,所述化学结构确定装置包括:
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
...【技术特征摘要】
1.一种化合物的化学结构确定方法,其特征在于,所述化学结构确定方法包括:
2.根据权利要求1所述的化学结构确定方法,其特征在于,在所述根据待确定化合物的质谱图确定所述待确定化合物的分子式和临近质谱图之前,所述化学结构确定方法还包括:
3.根据权利要求2所述的化学结构确定方法,其特征在于,所述根据待确定化合物的质谱图确定所述待确定化合物的至少一个临近质谱图包括:
4.根据权利要求1所述的化学结构确定方法,其特征在于,所述根据待确定化合物的质谱图确定所述待确定化合物的分子式包括:
5.根据权利要求1所述的化学结构确定方法,其特征在于,所述根据所述分子式确定出至少一个候选化合物,包括:
6.根据权利要求1所述的化学结构确定方法,其特征在于,在所述根据每个候选化...
【专利技术属性】
技术研发人员:纪宏超,
申请(专利权)人:中国农业科学院深圳农业基因组研究所岭南现代农业科学与技术广东省实验室深圳分中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。