【技术实现步骤摘要】
胃黏膜病变蛋白质分子分型、病变进展及胃癌相关蛋白标志物、预测病变进展风险的方法
本专利技术涉及肿瘤临床医学领域,具体涉及一种胃黏膜病变蛋白质分子分型、病变进展及胃癌相关蛋白标志物、预测病变进展风险的方法。
技术介绍
胃癌(GC)位于全球肿瘤发病谱第五位,死亡谱第三位,中国是全球胃癌发病率和死亡率最高的国家之一,全世界胃癌发病和致死的近半数发生在中国,胃癌的预防和控制仍是重大的公共卫生挑战。既往证据表明,胃癌尤其是肠型胃癌的发生经历了多阶段复杂的动态演变过程,包括浅表性胃炎(SG),慢性萎缩性胃炎(CAG),肠上皮化生(IM)和异型增生(DYS),最终发展为胃癌。大多数患者在胃癌晚期才被诊断,预后较差。除幽门螺杆菌感染外,胃癌的病因和危险因素,尤其是重度胃黏膜病变进展为胃癌过程中的病因学因素尚不明确。重度胃黏膜病变存在自然逆转或干预后逆转的可能,仅少部分人最终进展为胃癌。在胃黏膜病变人群中早期识别具有高度胃癌发生风险的人群亚组,促进胃癌的早发现、早诊断和早治疗(二级预防),是降低胃癌疾病负担的关键突破口。同时,蛋白质异 ...
【技术保护点】
1.一种胃黏膜病变蛋白质组学分子分型分类器的构建的方法,其特征在于,包括如下步骤:/n1)蛋白表达谱预处理和实验过滤:获得胃黏膜组织样本的蛋白质表达谱数据,然后进行如下处理:/na)高置信蛋白筛选;/n优选要求定量的蛋白含有至少一条专属肽段(unique peptide)且Mascot离子分值(ion score)大于等于20,且至少二条离子分值大于等于20的肽段,或者三条离子分值大于等于20的肽段;/nb)基于总和的定量数据标准化;/n优选采用基于峰面积的非标记定量iBAQ法计算出所述高置信蛋白的iBAQ值,并对计算出的所述iBAQ数据进行归一化处理,再计算鉴定的每个蛋白 ...
【技术特征摘要】
20200721 CN 202010707820X1.一种胃黏膜病变蛋白质组学分子分型分类器的构建的方法,其特征在于,包括如下步骤:
1)蛋白表达谱预处理和实验过滤:获得胃黏膜组织样本的蛋白质表达谱数据,然后进行如下处理:
a)高置信蛋白筛选;
优选要求定量的蛋白含有至少一条专属肽段(uniquepeptide)且Mascot离子分值(ionscore)大于等于20,且至少二条离子分值大于等于20的肽段,或者三条离子分值大于等于20的肽段;
b)基于总和的定量数据标准化;
优选采用基于峰面积的非标记定量iBAQ法计算出所述高置信蛋白的iBAQ值,并对计算出的所述iBAQ数据进行归一化处理,再计算鉴定的每个蛋白与鉴定的所有蛋白定量值的比值得到iFOT值;
优选某个蛋白的iBAQ值即为该蛋白所有对应肽段峰面积之和/理论肽段数;
c)实验过滤:剔除蛋白鉴定总数低于第一阈值的样本,并筛选蛋白最低鉴定频次,即占总样本数的第二阈值以上的蛋白;
优选第一阈值为1500,第二阈值为3/4;
2)分型特征蛋白的选择
选择在样本间存在较大差异,按变异系数(CV)由高到低排列,选择变异系数最大的前第三阈值个蛋白及其定量值构成分型特征蛋白矩阵;
优选第三阈值为100;
3)NMF分型
a)非负矩阵分解(NMF)一致性聚类方法分型:根据轮廓系数(averagesilhouettewidth)及共表型相关系数(copheneticcoefficient)选择最佳聚类数K并运用非负矩阵分解(NMF)对步骤2)得到的分型特征蛋白进行一致性聚类方法分型,得到NMF分型标签;
b)根据所述一致性聚类方法分型的结果,对第三阈值进行调整确定第三阈值最佳参数:根据NMF聚类得到的热图及轮廓系数调高或调低CV值重新筛选特征蛋白进行NMF聚类,直到得到理想的热图及轮廓系数;
4)分子分型分类器构建:选择所述分型特征蛋白以及所述最佳聚类数K作为分类器特征,然后选择分类器,经过数据输入和中间过程,进而输出分子分型结果数据;
优选所述分型特征蛋白为变异系数最大的100个特征蛋白,NMF最佳聚类数K为4;
优选分类器为已知机器学习分类算法或者人工智能模型;输入数据为特征蛋白矩阵和NMF分型标签;所述中间过程包括胃黏膜病变样本表达谱数据预处理,分类器特征匹配。
2.一种胃黏膜病变蛋白质组学分子分型的方法,其特征在于,应用权利要求1的方法构建的分子分型分类器对病变样本进行分子分型,包括如下步骤:
1)按照权利要求1中步骤1)方法对待测样本预处理得到表达谱数据;
2)分类器数据输入:输入样本的表达谱数据;
3)中间过程:胃黏膜病变样本表达谱数据预处理,分类器特征匹配;
4)输出分子分型结果数据。
3.一种分析不同胃黏膜病变蛋白质组学分子亚型与胃黏膜病变进展的关联的方法,其特征在于,结合临床组织病理诊断对疾病进展结局判定:将临床变量纳入分子亚型与疾病进展的关联分析,并对分子亚型与临床因素如何影响胃粘膜病变进展进行多因素非条件Logistic回归以分析不同亚型与胃黏膜病变进展的关联,所述分子亚型是根据权利要求2的方法得到的分子亚型;
优选所述疾病进展结局判定方法为:根据基线及随访终点临床组织病理诊断,按SG,CAG,IM,DYS,GC序列等级进行病理评分,随访终点与基线比较,评分上升者判定为疾病进展,评分下降者判定为疾病逆转,评分不变者判定为疾病稳定;
优选纳入关联分析的临床变量为:性别、年龄、幽门螺杆菌感染状态、基线组织病理诊断;
优选进行多因素非条件Logistic回归所校正的临床变量是:性别、年龄、幽门螺杆菌感染状态、基线组织病理诊断。
4.一种胃癌以及胃黏膜病变进展相关的蛋白标志物筛选方法,其特征在于,分别计算蛋白表达与组织病理胃黏膜病变状态、蛋白质组分子分型、胃黏膜病变进展的关系,从而建立胃癌以及胃黏膜病变进展相关的蛋白标志物数据库:
1)分析蛋白表达与组织病理胃黏膜病变状态关系,筛选与胃癌显著相关蛋白
a)胃黏膜病变状态根据组织病理诊断分为SG,CAG,IM,DYS,GC,以轻度胃黏膜病变(SG/CAG)为参照,探索重度胃黏膜病变(IM/DYS)及胃癌(GC)蛋白表达差异;
b)纳入关联分析的临床变量:性别、年龄;
c)关联分析方法:多因素非条件Logistic回归;
优选进行多因素非条件Logistic回归所校正的临床变量是:性别、年龄;选择经多重检验校正后FDRq<0.05的蛋白;
优选多重检验校正方法为Benjamini-Hochberg方法或Bonferroni方法;
2)分析蛋白表达与蛋白质组分子分型关系,筛选与蛋白质组定义的重度胃黏膜病变和胃癌显著相关的蛋白
a)采用权利要求2的方法进行胃黏膜病...
【专利技术属性】
技术研发人员:秦钧,李雪,郑乃仁,汪宜,吴红星,
申请(专利权)人:北京谷海天目生物医学科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。