【技术实现步骤摘要】
基于分子指纹预测的代谢物识别系统及其应用方法
本专利技术涉及生物信息和代谢组学领域,特别涉及基于分子指纹预测的代谢物识别方法及系统。
技术介绍
代谢物是细胞代谢过程的中间产物或最终产物。有别于核酸、蛋白质和脂质等生物大分子,代谢物通常是相对分子质量不高于1500Da的小分子化合物。作为基因和蛋白质的表达的下游产物,代谢物的活性可作为生理病理状态的标志。同时,相比于种类繁多、结构复杂的生物大分子,小分子代谢物的分析难度也相对较低。代谢组学是系统生物学的重要组成部分,着重于对生物系统中的代谢物进行全面分析,或对某组代谢物进行定向分析。代谢组学的研究方法能够通过分析在不同环境下样品的代谢物活性,并与基因组学、转录组学等组学的知识建立联系,从而推理得出由遗传因素或环境因素对生物系统所施加的影响的反映水平,在生物医学、微生物学等领域有广泛的应用场景。质谱技术(MassSpectrometry)在代谢组学研究中有着大量的应用。其中,串联质谱技术(TandemMassSpectrometry)通过串联至少两个质谱仪器,并令 ...
【技术保护点】
1.基于分子指纹预测的代谢物识别系统,其特征在于,所述基于分子指纹预测的代谢物识别系统包括:/n数据预处理模块,所述数据预处理模块用于代谢物表征数据进行采集分析,并提取特征参数;/n分子指纹模块,所述分子指纹模块用于采集数据预处理模块提取的特征参数,并进行分子指纹预测,以确定代谢物的可能化学结构;/n候选化合物筛选模块,所述候选化合物筛选模块用于对代谢物的可能化学结构进行初步筛选;/n候选化合物计算模块,所述候选化合物计算模块用于将代谢物的可能化学结构与代谢物的特征参数进行匹配计算,确定代谢物的预测结果。/n
【技术特征摘要】
20201015 CN 20201110252961.基于分子指纹预测的代谢物识别系统,其特征在于,所述基于分子指纹预测的代谢物识别系统包括:
数据预处理模块,所述数据预处理模块用于代谢物表征数据进行采集分析,并提取特征参数;
分子指纹模块,所述分子指纹模块用于采集数据预处理模块提取的特征参数,并进行分子指纹预测,以确定代谢物的可能化学结构;
候选化合物筛选模块,所述候选化合物筛选模块用于对代谢物的可能化学结构进行初步筛选;
候选化合物计算模块,所述候选化合物计算模块用于将代谢物的可能化学结构与代谢物的特征参数进行匹配计算,确定代谢物的预测结果。
2.根据权利要求1所述基于分子指纹预测的代谢物识别系统,其特征在于,所述代谢物表征数据为代谢物的质谱数据、紫外数据、红外数据、核磁数据、液相数据、气相数据中的一种或多种。
3.根据权利要求2所述基于分子指纹预测的代谢物识别系统,其特征在于,所述代谢物表征数据为代谢物二级质谱峰表,所述数据预处理模块的预处理过程包括步骤如下:
步骤S101,异常峰过滤:输入峰表的每一项Pi由二元组<Mi,Ii>组成,其中Mi为质谱峰的m/z值,Ii为质谱峰的信号强度;设前级离子m/z值为Mp,若某个质谱峰符合条件Mi>Mp,则该质谱峰属于异常峰,应被过滤,具体输出方程式为:
P(1)={Pi∈P|Mi≤Mp};
步骤S102,噪声峰过滤:以最大-最小值方式对峰表进行归一化,并以阈值0.001过滤强度过小的质谱峰数据,具体输出方程式为:
步骤S103,输入稀疏向量构造;以经过归一化和过滤后的峰表以及前级离子信息为输入,计算出输入分子指纹预测模型的稀疏向量数据,获得代谢物的特征参数。
4.根据权利要求3所述基于分子指纹预测的代谢物识别系统,其特征在于,所述步骤S103具体过程如下:
步骤S103.1,预处理峰表,对峰表的m/z值按照进行缩放;
步骤S103.2,计算产生n维的质谱峰直方图向量V(1),该向量的第i个分量Vi(1)表示缩放后m/z值为i与i-1分界值间的离子碎片信号强度,采用该直方图向量的维度n与最大m/z值的设定值作为实验测得的最优值;
步骤S103.3,计算中性损失:设前级离子的m/z值为Mp,利用峰表P可计算出中性损失表,计算过程如下:
N={Ni∈P|<Li,Ii>}
Li=Mp-Mi;
步骤S103.4,预处理中性损失表,对中性损失表的中性损失Li按照进行缩放;
步骤S103.5,计算产生中性损失直方图向量V(2),以该向量的第i个分量Vi(1)表示缩放后中性损失值为i与i-1分界值间的离子碎片信号强度,该直方图向量的维度n与最大中性损失值作为实验测得的最优值。
5.根据权利要求4所述基于分子指纹预测的代谢物识别系统,其特征在于,所述分子指纹模块的工作过程具体如下:
步骤S201,将质谱峰直方图向量V(1)和中性损失直方图向量V(2)合并为能够输入模型进行计算的输入张量V;
步骤S202,将输入张量输入至深度神经网络模型中进行计算,得到预测分子指纹结果f(V)。
6.根据权利要求1所述基于分子指纹预测的代谢物识别系统,其特征在于,所述候选化合物筛选模块工作过程如下:
步骤S301,化合物数...
【专利技术属性】
技术研发人员:汤德佑,谭达强,余文涛,胡寓旻,姚瑶,张晖,曾康,
申请(专利权)人:华南理工大学,中山大学肿瘤防治中心中山大学附属肿瘤医院,中山大学肿瘤研究所,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。