【技术实现步骤摘要】
本专利技术涉及代谢质谱筛查领域,尤其涉及一种基于深度学习的代谢质谱筛查方法及系统。
技术介绍
代谢物是生物体内完成代谢过程的小分子有机化合物总称,包含了丰富的生理状态信息。代谢组学基于对代谢物的整体系统性研究,可有效揭示生理现象背后的真实机理,并更为全面地展示生命体的动态状态。因此获得了越来越多的重视,被广泛应用于诸多科研与实用领域中。质谱分析(MassSpectrometry,MS)是代谢组学最为重要的研究工具之一,可有效鉴别不同的代谢物质,并准确衡量其相对浓度,数据形式如图1和图2所示。疾病检测是代谢质谱主要的应用范畴之一。通过定量测定目标代谢物的存在与丰度变化,可获得较传统方法更为丰富、完整的生理数据,对疾病的存在与发展状态进行有效判定,并协助医生拟定针对性的治疗方案。现有基于代谢质谱的检测算法(例如应用于疾病检测或预测),其流程包含三个主要步骤:1).峰值检测,将原始质谱经预处理消除噪声干扰,获取有效峰值。常用的预处理算法包括正规化(Standardization)、PCA白化、ZCA白化等;2).峰值注释(Annotation),判定目标峰值(群)所对应的具体代谢物质种类。这一过程往往由实验人员人工完成,但近年来也出现了基于机器学习与人工神经网络的自动注释算法,获得了较好的效果;3).疾病判定,以生物标志物数据库为基础,通过分析特定代谢物的出现、消失或浓度变化,预测可能发生的疾病类型与发 ...
【技术保护点】
一种基于深度学习的代谢质谱筛查方法,其特征在于,包括步骤:A、获得训练样本数据集S={S1,S2,…Sn,…,SN},其中任意质谱Sn=[(m1,i1),(m2,i2),…(md,id),…],md和id分别为第d条谱线的质核比与强度值;所述训练样本数据集S对应的类标矢量为c={c1,c2,…,cN};B、对S中的每个质谱进行预处理得到代谢质谱特征数据集T={T1,T2,…,TN};C、构造类标集合为C=[C1,C2,…,CN],设若原类标矢量c中的任意样本类标cn=k,则对应的Cn构造为除第k维数值为1外,其余数值均为0的K维矢量;D、将预处理后的代谢质谱特征数据集T={T1,T2,…,TN}与类标集合C用于深度学习网络的训练;E、构造包含1个输入层,1个输出层,以及L个隐含层的深度学习网络结构,其中输入层具有2D个节点,输出层具有K个节点,对于任意第l∈L个隐含层,设其节点数为Pl,且具有递减关系Pl‑1>Pl,D为从Sn中选择强度值最高的谱线数量;F、使用栈式自编码器分别训练各隐含层;G、使用逻辑回归作为输出层节点的激活函数,逐一训练输出层的节点;H、在对各层分别进行训练后 ...
【技术特征摘要】
1.一种基于深度学习的代谢质谱筛查方法,其特征在于,包括步骤:...
【专利技术属性】
技术研发人员:纪震,周家锐,殷夫,朱泽轩,
申请(专利权)人:深圳大学,纪震,周家锐,殷夫,朱泽轩,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。