检测样本中40种生物标志物的表达水平的试剂在制备用于评估结直肠癌风险的试剂盒应用制造技术

技术编号:34986286 阅读:20 留言:0更新日期:2022-09-21 14:31
本发明专利技术为检测样本中40种生物标志物的表达水平的试剂在制备用于评估结直肠癌风险的试剂盒应用。利用多变量建模分析和机器学习,首先分析筛选出1,146个与衰老相关的差异表达基因(DEG),再通过整合代谢通路与聚类分析,确定了与两种聚集的衰老相关通路中关系密切的40个重要基因。以此构建的基因表达的衰老代谢模型(DEG

【技术实现步骤摘要】
GFOD1 + 2.755828 * EDA2R + 2.607809 * EYA4 + 2.191429 * CDKN2A + 2.159529 * POLR2A + 2.141818 * PFAS
ꢀ‑ꢀ
2.130765 * HOXB4
ꢀ‑ꢀ
1.974833 * SMC4 + 1.561778 * SLC25A44
ꢀ‑ꢀ
1.330601 * ZNF469
ꢀ‑ꢀ
1.269772 * ZNF248
ꢀ‑ꢀ
1.251433 * PKDREJ
ꢀ‑ꢀ
1.230216 * DIRAS1 + 1.211511 * KBTBD3 + 1.195435 * IQCG
ꢀ‑ꢀ
1.179516 * CLIC6
ꢀ‑ꢀ
1.043441 * ZNF714
ꢀ‑ꢀ
0.961488 * TSNAXIP1
ꢀ‑ꢀ
0.902444 * ZNF177
ꢀ‑ꢀ
0.897912 * SOCS1 + 0.89264 * ZBTB42
ꢀ‑ꢀ
0.870189 * PITX1 + 0.849953 * HYDIN
ꢀ‑ꢀ
0.812131 * SSTR2
ꢀ‑ꢀ
0.770472 * CTSF
ꢀ‑ꢀ
0.720021 * HAS1 + 0.702006 * BEX5
ꢀ‑ꢀ
0.675801 * ABHD12B + 0.664531 * TRIB1 + 0.653026 * ABCB5
ꢀ‑ꢀ
0.609162 * GPR75 + 0.603402 * FABP3 + 0.569022 * RGS1
ꢀ‑ꢀ
0.565467 * PTX3
ꢀ‑ꢀ
0.563849 * CPXM1
ꢀ‑ꢀ
0.547544 * NAIP + 0.523819 * TMEM140 + 45.480218;C.将步骤A中统计的实际年龄与步骤B中得到的预测年龄进行对比分析,对其中延缓衰老组的样本给出结直肠癌阳性风险诊断。
[0006]步骤B通过弹性净多变量分析,对与衰老密切相关的 40个表达基因,进行衰老代谢模型建模。
[0007]本专利技术的有益效果是:本专利技术建立了一种基于40个相关衰老基因表达构建的衰老代谢模型,结合了与衰老密切相关的差异表达基因和代谢通路,创建了一个比较全面的高精度的差异表达基因的衰老时钟。通过本模型的构建,发现了1146个差异表达基因(DEG)与衰老相关,结合代谢通路,并从中筛选出40个重要性评分较高的衰老相关的差异表达基因。本专利技术从差异表达基因和代谢通路的2个角度阐明了在结直肠癌发生过程中衰老模式,存在显著延缓衰老的现象,并通过结直肠癌患者的组织差异表达基因(DEG)数据和相邻正常组织基因表达数据,验证了所述的延缓衰老现象用于结直肠癌诊断的可能性。该模型根据低衰老表型准确预测结直肠癌阳性诊断,通过引导入样本到结直肠癌的实际发生情况进行ROC分析,结直肠癌的预测阳性值(PPVs)为80%(图9,图10,图11)。该差异表达基因的衰老代谢模型,不仅可以用于预测结直肠癌的风险,也具有用于评估其他疾病(与衰老过程密切相关的疾病)的风险的潜力。
附图说明
[0008]构成本申请的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1.不同年龄组DEG的oPLS

DA分析;图2. 25~75岁年龄组的DEG火山分布图,|log2_fold50| > log2(1.5), p值<0.05;图3. 年龄相关的DEG按聚集的KEGG通路分组;图4. 差异表达基因对于DEG

age时钟的重要性评估;图5. 通过DEG

age时钟预测结直肠癌I、II、III、IV期以及正常组织的年龄,在所有分期中,大量结直肠癌患者都观察到衰老减速;图6. DEG

age时钟预测结直肠癌相邻正常组织和健康人群正常组织的衰老年龄;图7.正常和结直肠癌组织的DEG的PLS

DA分析;
图8. 根据DEG

age时钟与实际年龄比较对患者进行分类;图9. 用于结直肠癌风险预测的衰老代谢模型的ROC分析;图10. 使用DEG预测年龄cox分析衰老代谢模型区分潜在的结直肠癌阳性与正常人群;图11. 平均Δage、敏感性和特异性由ROC分析确定,其PPV为80%,NPV为100%;图12 .DEG预测年龄与训练和测试集的实际年龄的关系。
具体实施方式
[0009]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部试验结果。
[0010]本专利技术提供了一种基于40个相关衰老基因表达构建的衰老代谢模型的建模及训练的过程。实施例中对结直肠癌风险的评估过程。
[0011]为了实现上述目的,根据本专利技术技术路线如下:第一步,首先分析确定了来自GTEx(v7)(一种mRNA转录和表达的数据库,包含来自53种组织的11,688个样本中的21,518个蛋白编码基因)的正常组织的衰老相关基因表达变化和差异。潜在结构的正交投影判别分析显示,基因表达谱从20岁到60岁的缓慢但显著的转变,随后从60岁到80岁发生了相对于正常标准的急剧性转变(图1)。
[0012]与衰老相关的差异表达基因的分析筛选处理流程:(a)数据交叉消除没有蛋白编码的表达基因;(b)将数据集分为不同组织;(c) RNAseq数据通过TMM归一化和Voom(观测水平的均值方差建模)转换进一步归一化。
[0013]共分析出,有1146个差异表达基因(DEG)与衰老相关,即随年龄增加出现显著表达差异,调整后的p值<0.05(Benjamini

Hochberg方法)和|log2_fold50|>log2(1.5),log2_fc50是从25

75岁的倍数变化;图2。
[0014]第二步,通过GO

term富集分析和KEGG pathway富集分析进一步丰富和完善与衰老相关的差异表达基因。变换GTEx数据训练集与实际年龄范围相关,绝对相关系数|r|≥0.3被保留。以年龄、性别、死亡耐受性为自变量,对各基因进行线性构建衰老代谢模型单因素分析,以降低基因水平上的年龄和性别效应,通过调整后的p值<0.05(BH方法),从年龄25到75,用|log2_fc50|>log2(1.5),选择差异表达基因 (DEG),其中log2_fc本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.检测样本中40种生物标志物的表达水平的试剂在制备用于评估结直肠癌风险的试剂盒应用,其特征在于:40种生物标志物分别为ZNF264,CEBPZ,DNAJC14,GFOD1,EDA2R,EYA4,CDKN2A,POLR2A,PFAS,HOXB4,SMC4,SLC25A44,ZNF469,ZNF248,PKDREJ,DIRAS1,KBTBD3,IQCG,CLIC6,ZNF714,TSNAXIP1,ZNF177,SOCS1,ZBTB42,PITX1,HYDIN,SSTR2,CTSF,HAS1,BEX5,ABHD12B,TRIB1,ABCB5,GPR75,FABP3,RGS1,PTX3,CPXM1,NAIP,TMEM140。2.根据权利要求1所述应用,其特征在于,所述评估结直肠癌的风险包括如下步骤:A.采集健康人群和结直肠癌人群的40种生物标志物样本,并统计样本的实际年龄;B.通过衰老代谢模型对步骤A的样本进行分析,获得样本的预测年龄,所述预测年龄 =
‑ꢀ
5.190287 * ZNF264
ꢀ‑ꢀ
4.464243 * CEBPZ + 3.984903 * DNAJC14 + 2.766384 * GFOD1 + 2.755828 * EDA2R + 2.607809 * EYA4 + 2.191429 * CDKN2A + 2.159529 * POLR2A + 2.141818 * PFAS
ꢀ‑ꢀ
2.130765 * HOXB4
ꢀ‑ꢀ
1.974833 * SMC4 + 1.561778 * SLC25A44
ꢀ‑ꢀ
1.330601 * ZNF469
ꢀ‑ꢀ
1.269772 * ZNF248
ꢀ‑ꢀ
1.251433 * PKDREJ
...

【专利技术属性】
技术研发人员:陈利民李振钱玉凤李磊莫苑宁
申请(专利权)人:天津云检医学检验所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1