质谱数据质量程度或概率的控制系统、评估系统及方法技术方案

技术编号:37557432 阅读:15 留言:0更新日期:2023-05-15 07:40
本发明专利技术主要关于质谱数据质量程度或概率的控制系统、评估系统及方法,评估系统包括:输入模块,输入质谱文件的机器标签、液相色谱系统特征和质谱系统特征;预处理模块,对所述液相色谱系统特征和质谱系统特征进行预处理并获得LC特征和MS特征;分析模块,将预处理后的各特征输入完成训练的分类模型并进行预测分类;输出模块,输出分类结果和总体结果,表征原始文件质谱数据的LC质量和MS质量。可以快速的提升质谱生成数据的质量和精度,实现相同仪器或相同项目在不同时间段进行不同数据采集的原始文件评估,全面解决人为标记的原始文件评估的不确定性和时间成本高企的缺陷,为用户提供对应的仪器故障问题的排查思路,实质性解决问题。问题。问题。

【技术实现步骤摘要】
质谱数据质量程度或概率的控制系统、评估系统及方法


[0001]本专利技术主要关于质谱数据质量控制
,特别是关于质谱数据质量程度或概率的控制系统、评估系统及方法。

技术介绍

[0002]DIA(Data independent acquisition)数据非依赖性采集模式,是在传统的DDA(DataDependent acquisition)数据依赖性采集模式基础上发展起来的一种全新的、全景式的质谱数据采集方式,它利用高分辨率的静电场轨道阱Orbitrap质谱仪,将质谱整个全扫描范围根据质荷比分布密度划分为若干个可变窗口,并将窗口内所有肽段母离子进行超高速、循环的破碎和检测,最大限度的扫描采集所有肽段离子的碎片信息,是一种高通量蛋白质鉴定技术。
[0003]蛋白质组学DIA技术摆脱了传统的DDA数据依赖性采集技术偏向性采集和碎裂高丰度肽段的特点,可以无遗漏地采集样本中所有离子的全部碎片信息,包括低丰度的肽段离子,大大减少了数据缺失值,提高了数据的利用度,是研究大样本量以及复杂体系蛋白质样品的首选技术。
[0004]基于质谱的定量蛋白质组学研究,通过表征蛋白质组丰度的动态变化规律,对生命科学及人类许多疾病的发生、发展的诊断有重大意义。非标记定量蛋白质组学技术,因实验操作简单等优势广泛应用。虽然基于质谱的非标记定量蛋白质组学技术日新月异,但是在大队列的实验分析中,质谱运行异常也会带来原始文件重复性低的问题,因此建立自动化的仪器质量控制流程来保证仪器稳定性在大队列分析过程中也显得尤为重要。基于非数据依赖模式的非标记定量蛋白质组学技术,因技术较好的定量准确性近几年逐渐流行。但因数据非依赖模式产生的数据分析的困难性,结合前人文献报道,目前多数实验室使用数据依赖模式方法产生的原始文件的分析结果,例如肽段和蛋白鉴定数目,评估正在进行非数据依赖模式采集的质谱仪器状态。这个过程中,缺少详细的色谱分离(LC,liquid chromatography)和质谱(MS,mass spectrometer)的定量层面的评估指标,例如色谱峰宽分布,保留时间分布,色谱峰容量,肽段丰度等定量结果。
[0005]目前前人文献报道基于数据依赖模式方法产生的原始文件的评价方案包含以上参数的部分内容,但是存在输入参数过多导致用户使用不易上手现象,此外这些方法没有利用实际产出的结果形成一个定量结果,而这一定量结果是仪器性能状态变化的直接体现。同时前人文献报道所使用的肽段主要是高丰度蛋白,可能存在一定的表达不全面性。
[0006]此外,是在大队列的实验分析中,质谱运行异常也会带来原始文件重复性低的问题,因此建立自动化的仪器质量控制流程来保证仪器稳定性在大队列分析过程中也显得尤为重要。截止到目前,在发表文献中提到的质量控制主要以手动方式为主。专利技术人的前期研究成果如公开号为CN114858958A、授权公告号为CN114858958B的中国专利技术专利,详细介绍了使用16个特征结合机器学习使用自动化方式完成原始文件的评估,然而其存在以下局限性:1、输入参数过多限制了自身应用的推广,并且在每个特征的信息提取上都需要花费更
多的时间,此模型需要从多个方面:原始文件格式解析,原始文件的搜库分析等;2、专利技术人仅提起此模型适用于DIA采集的过程中的仪器评估,而对于相同仪器的不同时期或者相同项目的不同采集方法存在缺失,还无法实现仪器的连续监测评估和单个项目中不同采集状态的仪器质量监测;3、上述中国专利技术专利与前人报道的多数质量监控方法类似,未给用户提供对应的仪器故障问题的排查思路,因此无法实质性的解决相关问题;4、专利技术人的前述专利技术专利中并未包含离子淌度维度信息,对于近期具有高影响力的离子淌度质谱的评估存在缺失。
[0007]前述
技术介绍
知识的记载旨在帮助本领域普通技术人员理解与本专利技术较为接近的现有技术,同时便于对本申请专利技术构思及技术方案的理解,应当明确的是,在没有明确的证据表明上述内容在本专利申请的申请日前已公开的情况下,上述
技术介绍
不应当用于评价本申请技术方案的新创性。

技术实现思路

[0008]为解决上述记载中提及的至少一种技术问题,本专利技术提出一种筛选的代表性肽段母离子质谱数据结合机器学习的多种类型、非标记定量的原始文件采集过程中的仪器质量监测系统,可以快速的提升质谱生成数据的质量和精度,实现相同仪器或相同项目在不同时间段进行不同数据采集的原始文件评估,进一步全面解决人为标记的原始文件评估的不确定性和时间成本高企的缺陷。
[0009]质谱数据质量程度或概率的控制系统,包括:输入模块,其被配置为输入质谱文件的机器标签、液相色谱系统特征和质谱系统特征;预处理模块,其被配置为对所述液相色谱系统特征和质谱系统特征进行预处理并获得LC特征和MS特征;分析模块,其被配置为将预处理后的各特征输入完成训练的分类模型并进行预测分类;输出模块,其被配置为输出分类结果和总体结果,依据所述分类结果和总体结果即可表征原始文件质谱数据的LC质量和MS质量;控制模块,其被配置为依据所述分类结果和总体结果的反馈信息反向调整生成质谱文件的仪器参数,实现对质谱仪器、质谱方法、质谱数据质量的控制。
[0010]质谱数据质量程度或概率的评估系统,包括:输入模块,其被配置为输入质谱文件的机器标签、液相色谱系统特征和质谱系统特征;预处理模块,其被配置为对所述液相色谱系统特征和质谱系统特征进行预处理并获得LC特征和MS特征;分析模块,其被配置为将预处理后的各特征输入完成训练的分类模型并进行预测分类;输出模块,其被配置为输出分类结果和总体结果,依据所述分类结果和总体结果即可表征原始文件质谱数据的LC质量和MS质量。
[0011]部分具体实施方案中,所述质谱文件是通过DIA方式采集的文件,即DIA模式的文
件。
[0012]部分具体实施方案中,所述液相色谱系统特征包括目标肽段离子色谱峰不对称因子、目标肽段离子色谱峰峰宽、目标肽段离子色谱峰保留时间或一级离子流图中的至少一种。
[0013]部分具体实施方案中,所述质谱系统特征包括鉴定到的离子电荷分布、离子源喷雾稳定性、肽段母离子质谱鉴定准确度、一级质谱信号值、目标肽段离子色谱峰采集点数、肽段碎片离子质谱鉴定准确度、二级质谱信号值、一级质谱和二级质谱信号差异度、肽段鉴定数目、蛋白鉴定数目、目标肽段离子色谱峰一级质谱峰面积、目标肽段离子色谱峰二级质谱峰面积或目标肽段的离子淌度准确度中的至少一种。
[0014]部分具体实施方案中,所述预处理模块还包括对液相色谱系统特征和质谱系统特征进行人工标注,为每个原始文件的每个特征标注赋予Qualified标签或Unqualified标签。
[0015]部分具体实施方案中,所述LC特征、MS特征分别是在预处理模块中由标记人员结合F1~F16特征对每个文件的液相色谱系统、质谱系统进行评价得出的。
[0016]部分具体实施方案中,所述分类模型以机器标签和经过预处理的各特征标签进行训练。
[0017]前述质谱数据质量程度或概率的评估系统的应用,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.质谱数据质量程度或概率的控制系统,其特征在于包括:输入模块,其被配置为输入质谱文件的机器标签、液相色谱系统特征和质谱系统特征;预处理模块,其被配置为对所述液相色谱系统特征和质谱系统特征进行预处理并获得LC特征和MS特征;分析模块,其被配置为将预处理后的各特征输入完成训练的分类模型并进行预测分类;输出模块,其被配置为输出分类结果和总体结果,依据所述分类结果和总体结果即可表征原始文件质谱数据的LC质量和MS质量;控制模块,其被配置为依据所述分类结果和总体结果的反馈信息反向调整生成质谱文件的仪器参数,实现对质谱仪器、质谱方法、质谱数据质量的控制。2.质谱数据质量程度或概率的评估系统,其特征在于包括:输入模块,其被配置为输入质谱文件的机器标签、液相色谱系统特征和质谱系统特征;预处理模块,其被配置为对所述液相色谱系统特征和质谱系统特征进行预处理并获得LC特征和MS特征;分析模块,其被配置为将预处理后的各特征输入完成训练的分类模型并进行预测分类;输出模块,其被配置为输出分类结果和总体结果,依据所述分类结果和总体结果即可表征原始文件质谱数据的LC质量和MS质量。3.根据权利要求2所述的系统,其特征在于:所述液相色谱系统特征包括目标肽段离子色谱峰不对称因子、目标肽段离子色谱峰峰宽、目标肽段离子色谱峰保留时间或一级离子流图中的至少一种。4.根据权利要求2所述的系统,其特征在于:所述质谱系统特征包括鉴定到的离子电荷分布、离子源喷雾稳定性、肽段母离子质谱鉴定准确度、一级质谱信号值、目标肽段离子色谱峰采集点数、肽段碎片离子质谱鉴定准确度、二级质谱信号值、一级质谱和二级质谱信号差...

【专利技术属性】
技术研发人员:郭天南朱怡高欢欢李艳涛聂忠祥
申请(专利权)人:西湖欧米杭州生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1