【技术实现步骤摘要】
一种TMT项目图谱解析和数据分析的方法及系统
[0001]本专利技术属于生物医药
,涉及一种串联质谱标签TMT项目图谱解析和数据分析方法及系统。
技术介绍
[0002]目前,在企业生产中,存在大量TMT项目谱图解析和数据分析需求,以往这些工作都是通过人工手动的方式进行处理的,步骤很多,操作繁琐。首先,分析人员要筛选出需要进行谱图解析的项目,找到该项目的原始数据路径和蛋白数据库路径,需要和实验人员确定项目的标记定量方法,然后手动将这些谱图解析所需的文件添加到谱图解析软件中,接着手动设置软件的相关参数并开始谱图解析,由于谱图解析过程耗时较久,且不同项目耗时不同,需要分析人员人工查看解析过程是否完成,以便开启下一步数据分析工作。在数据分析时,需要分析人员手动输入相关信息到数据分析软件中。最后,在项目完成数据分析后,需要手动整理分析结果。整个过程,极其耗费时间和精力,需要较多的分析人员协同合作来完成该项工作,人力成本很高。
技术实现思路
[0003]本专利技术的目的是提供一种TMT项目谱图解析和数据分析方法,可 ...
【技术保护点】
【技术特征摘要】
1.一种TMT项目图谱解析和数据分析的方法,其特征在于,所述方法包括:步骤一、项目列表文件解析:读取并遍历TMT项目列表文件,将文件中每一行包含“上机”或“搜库结题”字段,且同时包含“TMT”字段的记录放入python列表中;步骤二、项目解析文件准备:根据合同号获取项目的标记信息文件和蛋白数据库文件的绝对路径、获取预设的项目原始数据文件的绝对路径和谱图解析结果输出目录的绝对路径,根据标记信息文件和定量模板文件,生成项目的定量方法文件;步骤三、谱图自动解析:自动启动谱图解析软件,导入项目对应的蛋白数据库文件、定量方法文件、项目原始数据,选择项目的工作流程、定量方法,对参数进行设定,开始谱图自动解析;步骤四、数据自动分析:每隔2
‑
10分钟,对谱图解析结果输出目录中所有文件进行一次扫描,谱图解析完成后,获得蛋白表格、肽段表格、肽段匹配表格、蛋白信息统计表格,对每一个蛋白按组别进行费歇尔精确检验,求出不同组别之间每个蛋白的差异倍数FC和Pvalue,并根据蛋白表达丰度的信息,按组别对样本进行主成分分析;步骤五、结果导出保存:按照不同的差异标准,从3个水平进行组别间差异蛋白筛选,统计不同组别之间的差异蛋白数目并导出保存,根据主成分分析结果,绘制主成分图并保存。2.如权利要求1所述的方法,其特征在于,步骤一中,所述项目列表文件中的每一行记录了一个项目的一种谱图解析和数据分析任务,且每一行包含项目合同号、项目类型和样本类型信息;所述“TMT”是指项目的类型,所述“上机”和“搜库结题”用来区分样本类型,“上机”说明项目需要对质控样本进行谱图解析和数据分析,“搜库结题”说明需要对正式样本进行谱图解析和数据分析。3.如权利要求1所述的方法,其特征在于,步骤二中,所述项目的标记信息文件和蛋白数据库文件的绝对路径通过get_pro_db_bjsx方法获得,根据项目的合同号判断项目的标记信息文件、蛋白数据库文件是否存在,准确提供项目标记信息文件和蛋白数据库文件的绝对路径;所述项目标记信息文件是一个excel表格,第一行为表头信息,第二行的第一列为项目使用的标记试剂批号,其余列为项目使用的标记信息;所述的蛋白数据库文件是一个以“fasta”为后缀的文件,文件中包含了蛋白序列号、注释信息和蛋白序列;所述预设的项目原始数据文件的绝对路径和谱图解析结果输出目录的绝对路径通过get_rawdata_path方法获得,根据项目合同号判断项目原始数据文件是否存在,并过滤干扰信息,严格区分质控样本的原始数据文件和正式样本的原始数据文件,准确提供项目原始数据文件的绝对路径;提供质控样本谱图解析结果和正式样本谱图解析结果存放的绝对路径;所述原始数据文件是以“raw”为后缀的文件,是质谱下机数据;所述输出目录是指谱图解析产生结果文件存放的位置,不同项目的谱图解析结果需要存放在不同的位置;所述项目的定量方法文件通过mk_qm_method方法获得,根据标记信息文件生成谱图解析所需的标记定量文件,并将其移动到正确的位置;不同的所述定量模板文件与不同批号的标记试剂对应,不同批号的定量模板文件内容格式相同,模板中的校正因子不同,不同定量模板的校正因子在制作模板时已正确设定;模板中的校正因子用于校正不同标记试剂定量系数;不同的定量模板文件中均包含了包括126、127N、127C、128N、128C、129N、129C、130N、130C、131N、131C、132N、132C、133N、133C、
134N在内的标记。4.如权利要求1所述的方法,其特征在于,步骤三具体包括如下步骤:步骤3.1、使用pd_start方法,启动谱图解析软件,并进入管理界面;步骤3.2、使用add_db方法,删除谱图解析软件中已有的...
【专利技术属性】
技术研发人员:杨兵,黄齐天,冯利兴,封一统,韩继臣,
申请(专利权)人:上海美吉生物医药科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。