本发明专利技术提供一种基于多基因突变特征的VTE风险评估模型、构建方法及应用,该模型基于获得的与VTE是否患病显著相关的35个特征基因中的一个基因或多个基因组合,特征基因为:SERPINC1、F5、AQP9、LRRC6、KIF6、DHX34、REXO1、TPBGL、MFAP1、RTKN2、ASPN、MKI67、KIAA1522、FGFR4、PGLYRP4、CCBL2、ATP5S、ENDOG、DMBT1、DBR1、PNPLA7、TBC1D24、CSF1R、GSTA5、ERICH6、C7orf25、GALK1、TMEM143、OXR1、SETD5、AQP7、ERMAP、ZNF831、ENOSF1、GPR142。本发明专利技术解决了现有技术中已有的评估模型存在对某些致病相关联的罕见突变难以发现的技术问题。联的罕见突变难以发现的技术问题。联的罕见突变难以发现的技术问题。
【技术实现步骤摘要】
基于多基因突变的VTE风险评估模型、构建方法及应用
[0001]本专利技术属于基因检测领域,具体涉及一种基于多基因突变特征的VTE风险评估模型、其构建方法及其应用。
技术介绍
[0002]静脉血栓栓塞症(Venous thromboembolism,VTE)是指血液在静脉内不正常地凝结导致血管阻塞从而引起静脉回流障碍,是世界第三大循环系统致死性疾病,仅次于心肌梗死和卒中。VTE包括肺血栓栓塞症(Pulmonary thromboembolism,PTE)和下肢深静脉血栓形成(Deep venous thrombosis,DVT)两种,它们是VTE在不同部位、不同阶段的两种重要的临床表现形式。VTE在不同种族间的发病率有明显差异,VTE的发病率亚洲人群较西方人群低。近年来中国VTE发病率成上升趋势,VTE患者从2007年的3.2/10万人上升到2016年17.5/10万人。
[0003]VTE是一种多因素引起的复杂疾病,病因主要分为获得性因素及遗传性因素两方面。研究表明VTE的遗传学因素在不同种族间差异明显,西方国家人群静脉血栓的常见的突变风险因素主要是导致促凝因素增强的FV Leiden突变和凝血酶原G20210A突变。这两个位点的突变在亚洲人群中非常少见,几乎没有研究报道。在中国,常见的VTE易感基因主要是蛋白C、蛋白S、THBD以及SERPINC1等。最近的研究对全球VTE家系进行了系统地荟萃分析,汇总了287个有明确遗传致病因素的VTE家系,包含了225个高加索家系,39个中国家系,以及其他散在的家系。发现这5个基因的突变最高:F5,SERPINC1,PROC,F2,PROS1,但F2和F5的突变在高加索家系中常见,在中国家系中相对少见。
[0004]随着测序技术的发展,全基因组测序(WGS)和全外显子组测序(WES)提供了全基因水平的突变筛查,更容易发现新的突变位点。欧洲最大规模的家系研究是在2016年,分析了212个VTE核心家系的GWAS以及24对家系中兄弟姐妹的靶向测序数据,发现了SMAP1、B3GAT2和RIMS1三个潜在的致病基因。
[0005]目前,临床上已有多个VTE风险评估模型,并写在静脉血栓防治指南中。其中,Caprini和Padua风险评估量表经常用于住院患者中预测静脉血栓的风险,但只明确包含了两个突变位点的检测,即FV Leiden突变和凝血酶原G20210A突变。中国一些回顾性研究报道发现,Caprini和Padua风险评估模型在中国医院的预测效果不佳。VTE是复杂的多因素疾病,不仅获得性因素多,遗传相关的基因也非常多。2019年,Blood期刊发表的综述文献,提到了38个已知VTE相关的基因。之前的研究建立了诸多多基因风险评估(Polygenic risk score,PRS)模型,如5SNP和31SNP模型预测VTE首次发病风险、7SNP和8SNP模型预测VTE的复发、33SNP模型预测与VTE的关联、37SNP模型和297SNP模型预测VTE的发病风险。
[0006]但这些风险评估模型都是基于基因位点的,部分致病的罕见突变通常因为人群频率低,较难发现重复,以基因位点为单变量的权重较弱。
[0007]又如,公开号为CN112553327A的中国专利技术专利申请公开了一种基于单核苷酸多态性的肺血栓栓塞症风险预测模型的构建方法、SNP位点组合及应用,该预测模型的构建方法
包括如下具体步骤:S1、样本收集及基因检测;S2、数据质量控制及全基因组关联分析(GWAS);S3、结合外部人群的基因组数据进行荟萃分析(meta analysis);S4、筛选具有预测价值的SNP位点组合;S5、搭建回归模型,进行训练与测试。该预测模型获得48个SNP位点组合,虽然该申请表明其技术方案能够实现亚洲人群,特别是中国人群的肺血栓栓塞症风险预测,但该风险预测模型仍然是基于基因位点获得的,对于某些致病相关联的罕见突变仍然难以发现,风险预测的精准性和细致性仍有待提高。
技术实现思路
[0008]为此,本专利技术所要解决的技术问题在于提供一种基于多基因突变特征的VTE风险评估模型、构建方法及应用。解决现有技术中已有的评估模型存在对某些致病相关联的罕见突变难以发现的技术问题。
[0009]本专利技术提供的一个技术方案为基于多基因突变特征的VTE风险评估模型,该模型基于获得的与VTE是否患病显著相关的35个特征基因中的一个基因或多个基因组合,所述特征基因为:SERPINC1、F5、AQP9、LRRC6、KIF6、DHX34、REXO1、TPBGL、MFAP1、RTKN2、ASPN、MKI67、KIAA1522、FGFR4、PGLYRP4、CCBL2、ATP5S、ENDOG、DMBT1、DBR1、PNPLA7、TBC1D24、CSF1R、GSTA5、ERICH6、C7orf25、GALK1、TMEM143、OXR1、SETD5、AQP7、ERMAP、ZNF831、ENOSF1、GPR142。
[0010]优选的,采用统计算法对35个特征基因进行特征筛选降维,按特征基因排序选定一个基因或多个基因组合。
[0011]优选的,该模型以筛选的VTE遗传相关基因和收集的样本为单元,按突变类型对样本中外显子区和可变剪切区的罕见突变位点进行统计,得到各样本中每个基因在每种突变类型上的突变位点数量,按OR值、AUC、p
‑
value依次对全基因进行排序,然后按照OR>1,p
‑
value<0.05,AUC>0.5标准进行过滤,得到与VTE是否患病显著相关的特征基因。
[0012]优选的,突变类型包括可变剪切突变、移码插入/删除突变、无义突变、错义突变、非移码插入/删除突变。
[0013]优选的,该模型中叠加环境影响因素,环境影响因素包括年龄因素。
[0014]本专利技术提供的另一个技术方案为基于多基因突变特征的VTE风险评估模型的构建方法,包括如下步骤:
[0015]S1、收集研究样本及基因检测实验,所述研究样本包括VTE患病者样本和健康者样本,基因检测实验包括全基因组测序和全外显子组测序;
[0016]S2、突变位点分析、注释和过滤,选取外显子区和可变剪切区域的突变位点和人群频率小于0.05的罕见突变位点;
[0017]S3、VTE遗传风险基因突变筛查,包括筛选已知的遗传危险因素和筛查研究样本静脉血栓栓塞的风险变异;
[0018]S4、显著突变位点分析和基因负荷检验,包括变异与静脉血栓栓塞之间的关联分析和基因与静脉血栓栓塞之间关联的负荷分析;
[0019]构建得到VTE风险评估模型。
[0020]优选的,上述步骤S1中,研究样本包括家系研究队列和人群验证队列;所述家系研究队列选自中国汉族静脉血栓栓塞家系,包括静脉血栓栓塞患者和未患病成员;所述人群
验证队列选择中国汉族,包括无诱因的散发静脉血栓栓塞病例和健康对照。
[0021]优选的,本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.基于多基因突变的VTE风险评估模型的构建方法,其特征在于,以与VTE是否患病显著相关的特征基因作为特征参数,以收集的家系研究队列的所述与VTE是否患病显著相关的特征基因中罕见突变位点的数量为训练数据,进行逻辑回归建模,得到基于多基因突变特征的VTE风险评估模型;所述家系研究队列包括VTE患病者样本和未患病健康者样本;所述特征基因为AQP9、LRRC6、KIF6、DHX34、REXO1、TPBGL、MFAP1、RTKN2、ASPN、MKI67、KIAA1522、FGFR4、PGLYRP4、CCBL2、ATP5S、ENDOG、DMBT1、DBR1、PNPLA7、TBC1D24、CSF1R、GSTA5、ERICH6、C7orf25、GALK1、TMEM143、OXR1、SETD5、AQP7、ERMAP、ZNF831、ENOSF1、GPR142中的一个基因或多个基因组合。2.根据权利要求1所述的基于多基因突变的VTE风险评估模型的构建方法,其特征在于,所述特征基因还包括SERPINC1和/或F5。3.根据权利要求1或2所述的基于多基因突变的VTE风险评估模型的构建方法,其特征在于,所述与VTE是否患病显著相关的特征基因的获取步骤如下:以筛选的VTE遗传相关基因和所述家系研究队列的样本为单元,按突变类型对所述家系研究队列的样本中外显子区和可变剪切区的罕见突变位点的数量进行统计,得到所述家系研究队列的样本中每个所述VTE遗传相关基因在每种突变类型上的罕见突变位点的数量;针对每个所述VTE遗传相关基因在各所述家系研究队列的样本的罕见突变位点的数量与VTE是否患病进行显著性Fisher精确检验、逻辑回归关联分析、关联风险OR值比值计算、逻辑回归判别AUC的计算,按OR值、AUC、p
‑
value依次对全基因进行排序,然后按照OR>1,p
‑
value<0.05,AUC>0.5标准进行过滤,得到与VTE是否患病显著相关的特征基因。4.根据权利要求3所述的基于多基因突变的VTE风险评估模型的构建方法,其特征在于,所述突变类型包括可变剪切突变、移码插入/删除突变、无义突变、错义突变、非移码插入/删除突变。5.根据权利要求3所述的基于多基因突变的VTE风险评估模型的构建方法,其特征在于,所述构建方法在所述训练数据中叠加环境影响因素进行建模,所述环境影响因素包括年龄...
【专利技术属性】
技术研发人员:翟振国,张竹,苏明明,张鑫磊,李昊搏,万昭曼,谢万木,黄泽炽,张宇,
申请(专利权)人:北京携云启源科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。