一种基于质谱法检测HCP的数据分析方法及系统技术方案

技术编号:38238801 阅读:9 留言:0更新日期:2023-07-25 18:02
本发明专利技术公开了一种基于质谱法检测HCP的数据分析方法及系统,包括以下步骤:根据分析需求输入指定信息,根据指定信息判断样品中是否存在高风险的HCP,若是,则确定HCP的高风险类型并进行标注;通过指定信息找到内标蛋白,利用内标蛋白得到HCP相关信息;在HCP相关信息中删除缺失值过多的蛋白,生成HCP表格;将HCP表格中的数据按照不同的肽段预设条件进行筛选,生成对应的肽段子表格;整合肽段子表格得到所有计算结果表格,根据所有计算结果表格中的数据生成不同类型的子表格,同时通过作图将所有计算结果表格中的数据进行展示。本发明专利技术使得HCP含量的计算、统计分析效率有所提升并降低了出错风险。了出错风险。了出错风险。

【技术实现步骤摘要】
一种基于质谱法检测HCP的数据分析方法及系统


[0001]本专利技术涉及生物检测
,具体涉及一种基于质谱法检测HCP的数据分析方法及系统。

技术介绍

[0002]在生物制药的过程当中,需要去除来源于构成复杂的宿主细胞的宿主细胞蛋白(host cell proteins,HCP),因为一些HCP可能引起患者严重的免疫反应,另外还有一些HCP会使药物中的成分降解或者聚集,进而影响药物的稳定性、安全性以及药效。因此药物中残留HCP的种类和含量的检测成为生物制药关注的重点。
[0003]常见的HCP检测方法为酶联免疫吸附试验(enzyme

linked immunesorbent assays,ELISAs),此方法需要针对检测宿主细胞开发特定的检测试剂盒,但是ELISAs法存在无法覆盖宿主的全部蛋白、无法准确定量以及无法获知具体的HCP蛋白信息等的劣势,因此急需开发新的检测方法。基于LC

MS/MS的蛋白质组学平台测量HCP含量的方法,具有高通量、无偏检测以及定量准确等的优点,逐渐成为HCP检测不可或缺的技术手段。质谱法依赖于稳定的质谱平台以及专业的数据分析,才能得到可靠的定量结果。而LC

MS/MS的蛋白质组学方法使用数据依赖性采集(Data

dependent acquisition,DDA)的模式进行数据采集,流程相对比较固定。通过质谱数据结果数据库匹配和色谱峰提取,得到HCP蛋白的鉴定信息以及强度信息,并根据加入的标准蛋白(standard protein,STD)的含量计算出HCP的绝对含量。HCP的含量一般使用ppm表示,1ppm的含义为1mg的生物制品中含有总量1ng的HCP。
[0004]目前对HCP含量的计算主要采用人工的方式,由于HCP含量计算过程工作重复,文件数量繁多,耗时极长,因此存在计算效率低下以及容易造成人为错误的问题,另外后续对多个样品的HCP含量进行统计分析时,过程同样繁琐,从而进一步降低计算效率以及提高出错风险。

技术实现思路

[0005]为了克服现有技术的不足,本专利技术提供一种基于质谱法检测HCP的数据分析方法及系统,用于解决现有采用人工的方式对HCP含量进行计算和统计分析,导致计算效率低下以及存在较高出错风险的技术问题,从而使得HCP含量的计算、统计分析效率有所提升并降低了出错风险。
[0006]为解决上述问题,本专利技术所采用的技术方案如下:
[0007]一种基于质谱法检测HCP的数据分析方法,包括以下步骤:
[0008]根据分析需求输入指定信息,根据所述指定信息判断样品中是否存在高风险的HCP,若是,则确定所述HCP的高风险类型并进行标注;
[0009]通过所述指定信息找到内标蛋白,利用所述内标蛋白得到HCP相关信息;
[0010]在所述HCP相关信息中删除缺失值过多的蛋白,生成HCP表格;
[0011]将所述HCP表格中的数据按照不同的肽段预设条件进行筛选,生成对应的肽段子
表格;
[0012]整合所述肽段子表格得到所有计算结果表格,根据所述所有计算结果表格中的数据生成不同类型的子表格,同时通过作图将所述所有计算结果表格中的数据进行展示。
[0013]作为本专利技术优选的实施方式,在根据分析需求输入指定信息时,包括:
[0014]通过输入分析指令约束分析得出的结果;
[0015]通过输入单个样品搜库原始文件提供样品的HCP鉴定结果和HCP定量结果;
[0016]通过输入高风险HCP数据库提供高风险蛋白信息,并根据所述高风险蛋白信息对高风险的HCP进行标注;
[0017]通过输入样本信息Excel文件提供样品名、样品是否需要添加合并搜库信息以及样品分组信息;
[0018]其中,所述得出的结果包括样品中HCP蛋白摩尔量理论值、STD内标的蛋白名称以及每剂次药物含量,所述高风险蛋白信息包括蛋白名称、蛋白描述以及蛋白的高风险影响类型信息。
[0019]作为本专利技术优选的实施方式,在根据分析需求输入指定信息时,还包括:
[0020]通过输入高风险HCP数据库提供额外补充信息;
[0021]通过输入样品合并搜库结果原始文件提供多个样品采集到的数据;
[0022]其中,所述额外补充信息包括基因名和信息来源。
[0023]作为本专利技术优选的实施方式,在将所述HCP表格中的数据按照不同的肽段预设条件进行筛选时,包括:
[0024]筛选并生成不重复肽段大于等于1的HCP的第一肽段子表格;
[0025]筛选并生成不重复肽段大于等于2的STD内标的第二肽段子表格;
[0026]筛选并生成不重复肽段大于等于2的HCP的第三肽段子表格。
[0027]作为本专利技术优选的实施方式,在根据所述所有计算结果表格中的数据生成不同类型的子表格时,包括:
[0028]根据所述所有计算结果表格中的数据生成所有STD结果整合表格;
[0029]根据所述所有计算结果表格中的数据生成所有高风险种类总表;
[0030]根据所述所有计算结果表格中的数据生成所有检测到的HCP和所有样品整合表格;
[0031]根据所述所有计算结果表格中的数据生成每种高风险详情表。
[0032]作为本专利技术优选的实施方式,在通过作图将所述所有计算结果表格中的数据进行展示时,包括:
[0033]根据所述所有计算结果表格中的数据,生成每种高风险类型下所有样品高风险个数和数值柱状图;
[0034]根据所述所有计算结果表格中的数据,生成每个样品高风险HCP个数堆积图;
[0035]根据所述所有计算结果表格中的数据,并将每个样品作为一个点,生成所有样品HCP数量和HCP数值散点图。
[0036]作为本专利技术优选的实施方式,在通过作图将所述所有计算结果表格中的数据进行展示时,包括:
[0037]根据所述所有计算结果表格中的数据,将每个样品中的每个HCP作为一个点,生成
组内所有样品相对丰度的散点图;
[0038]根据所述所有计算结果表格中的数据,生成基于相对丰度排序的散点图;
[0039]根据所述所有计算结果表格中的数据,生成Upset图。
[0040]作为本专利技术优选的实施方式,在利用所述内标蛋白得到HCP相关信息时,包括:
[0041]利用所述内标蛋白得到HCP蛋白摩尔量,再根据所述HCP蛋白摩尔量得到HCP蛋白摩尔量平均值、第一HCP含量以及第二HCP含量;
[0042]根据所述第一HCP含量和所述第二HCP含量得到第一HCP含量平均值和第二HCP含量平均值;
[0043]通过对HCP蛋白摩尔量、第一HCP含量以及第二HCP含量进行相对标准偏差分析,得到HCP蛋白摩尔量RSD值、第一HCP含量RSD值以及第二HCP含量RSD值;
[0044]其中,所述第一HCP含量和所述第一HC本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于质谱法检测HCP的数据分析方法,其特征在于,包括以下步骤:根据分析需求输入指定信息,根据所述指定信息判断样品中是否存在高风险的HCP,若是,则确定所述HCP的高风险类型并进行标注;通过所述指定信息找到内标蛋白,利用所述内标蛋白得到HCP相关信息;在所述HCP相关信息中删除缺失值过多的蛋白,生成HCP表格;将所述HCP表格中的数据按照不同的肽段预设条件进行筛选,生成对应的肽段子表格;整合所述肽段子表格得到所有计算结果表格,根据所述所有计算结果表格中的数据生成不同类型的子表格,同时通过作图将所述所有计算结果表格中的数据进行展示。2.根据权利要求1所述的基于质谱法检测HCP的数据分析方法,其特征在于,在根据分析需求输入指定信息时,包括:通过输入分析指令约束分析得出的结果;通过输入单个样品搜库原始文件提供样品的HCP鉴定结果和HCP定量结果;通过输入高风险HCP数据库提供高风险蛋白信息,并根据所述高风险蛋白信息对高风险的HCP进行标注;通过输入样本信息Excel文件提供样品名、样品是否需要添加合并搜库信息以及样品分组信息;其中,所述得出的结果包括样品中HCP蛋白摩尔量理论值、STD内标的蛋白名称以及每剂次药物含量,所述高风险蛋白信息包括蛋白名称、蛋白描述以及蛋白的高风险影响类型信息。3.根据权利要求2所述的基于质谱法检测HCP的数据分析方法,其特征在于,在根据分析需求输入指定信息时,还包括:通过输入高风险HCP数据库提供额外补充信息;通过输入样品合并搜库结果原始文件提供多个样品采集到的数据;其中,所述额外补充信息包括基因名和信息来源。4.根据权利要求1所述的基于质谱法检测HCP的数据分析方法,其特征在于,在将所述HCP表格中的数据按照不同的肽段预设条件进行筛选时,包括:筛选并生成不重复肽段大于等于1的HCP的第一肽段子表格;筛选并生成不重复肽段大于等于2的STD内标的第二肽段子表格;筛选并生成不重复肽段大于等于2的HCP的第三肽段子表格。5.根据权利要求1所述的基于质谱法检测HCP的数据分析方法,其特征在于,在根据所述所有计算结果表格中的数据生成不同类型的子表格时,包括:根据所述所有计算结果表格中的数据生成所有STD结果整合表格;根据所述所有计算结果表格中的数据生成所有高风险种类总表;根据所述所有计算结果表格中的数据生成所有检测到的HCP和所有样品整合表格;根据所述所有计算结果表格中的数据生成每种高风险详情表。6.根据权利要求1所述的基于质谱法检测HCP的数据分析方法,其特征在于,在通过作图将所述所有计算结果表格中的数据进行展示时,包括:根据所述所有计算结果表格中的数据,生成每种高风险类型下所有样品高风险个数和数值柱状图;
根据所述所有计算结果表格中的数...

【专利技术属性】
技术研发人员:李妍张伟周岳成晓亮
申请(专利权)人:上海氨探生物科技有限公司南京品生医学检验实验室有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1