一种基于单核苷酸多态性的肺血栓栓塞症风险预测模型的构建方法、SNP位点组合及应用技术

技术编号:27815576 阅读:18 留言:0更新日期:2021-03-30 10:09
本发明专利技术公开了一种基于单核苷酸多态性的肺血栓栓塞症风险预测模型的构建方法、SNP位点组合及应用,预测模型的构建方法包括如下具体步骤:S1、样本收集及基因检测;S2、数据质量控制及全基因组关联分析(GWAS);S3、结合外部人群的基因组数据进行荟萃分析(meta analysis);S4、筛选具有预测价值的SNP位点组合;S5、搭建回归模型,进行训练与测试;上述预测模型获得48个SNP位点组合,包括至少一种的SNP位点组合可以作为肺血栓栓塞症风险评估方面的应用或筛查产品中的应用,能够实现亚洲人群,特别是中国人群的肺血栓栓塞症风险预测,并且检测方法简便易行,方便临床使用。方便临床使用。方便临床使用。

【技术实现步骤摘要】
一种基于单核苷酸多态性的肺血栓栓塞症风险预测模型的构建方法、SNP位点组合及应用


[0001]本专利技术涉及一种基于单核苷酸多态性的肺血栓栓塞症风险预测模型的构建方法、SNP位点组合及应用,具体涉及肺血栓栓塞症相关的单核苷酸多态性位点及其在风险预测中的用途,属于疾病检测


技术介绍

[0002]肺血栓栓塞症(pulmonary thromboembolism,PTE)是一种由于产生静脉血栓,堵塞肺动脉或其分支,引起肺循环障碍的疾病,具有潜在的致死风险。PTE在住院病人中常见,且发病率及死亡率较高。导致PTE发生的危险因素主要包括感染、骨折/创伤、吸烟、恶性肿瘤、肥胖、妊娠等。PTE起病隐匿,大多数的PTE患者的临床表现(如胸闷、憋气、咳嗽、气促、下肢水肿等)缺乏特异性,常常由于原发病的缘故而忽略掉这些非特异性的表现,故在一些慢性病程者容易造成漏诊误诊,进而造成严重后果。临床研究显示,合理预防措施可使DVT相对风险降低50%

60%,PTE相对风险降低近2/3。有效的风险预测对预防PTE的发生、降低患者死亡率至关重要,改善风险评估和预测工具是减少PTE疾病发生的重要措施。因此,急需一种可靠、便捷的方法进行风险预测,以筛选可能发生PTE的高危患者,从而进行必要的预防干预措施,比如抗凝,以便最大程度降低PTE的发生率和死亡率。
[0003]目前,临床上PTE的预测暂缺乏较好的血清学标志物,尽管已有研究证实:D二聚体、C反应蛋白、组织因子、凝血因子VIII及血小板、白细胞、血小板等可以在一定程度上反映患者的高凝状态,提示患者PTE的发生,但其预测价值有限,实际临床工作中应用并不多。并且,我国对这类疾病认识及研究起步晚,在PTE风险评估模型方面上也大多是借用引进国外研制的,如Caprini血栓评估模型、Padua预测评分模型、Autar血栓评估模型和Kucher量表。但是由于存在人种、体质、文化及生活习惯等方面的差异,在使用上也有一定的局限性,如凝血因子V Leiden突变、凝血酶原G20210A突变在高加索人种中的发生率较高,但几乎不存在于中国人群中。而亚洲人群中蛋白C、蛋白S的缺失或抗凝血酶的缺乏发生率高于高加索人种,但并未在Caprini量表中有所体现。并且上述量表大多条目复杂,如Caprini包含有将近40项评估条目,实施过程耗时耗力,不便于临床工作者使用。
[0004]另外,肺血栓栓塞症的发生是遗传易感性和获得性危险因素相互作用的结果。家族性研究发现PTE的遗传度大约为50%

60%。也就是说,个体在遭受VET相关危险因素后,后续临床发展将很大程度上取决于个体的遗传易感性。单核苷酸多态性(Single Nucleotide Polymorphisms,SNP)是指在基因组上单个核苷酸的变异,包括转换、颠换、缺失和插入而形成的遗传标记,其数量很多,多态性丰富,与很多人体表型、对药物或疾病的易感性等相关。因此,SNP是导致个体疾病发生发展差异的重要遗传基础。并且,一些基因多态性位点在不同种族中的分布不同,而之前的大部分相关研究是在高加索人群中完成的,因为两个种族的基因频率并不完全相同,其研究结果可能不适用于汉族患者。
[0005]综上,一个理想的PTE风险评估模型是经得起其他的临床实验进行验证的,可以准
确识别出PTE的高危人群,从而提高血栓预防率和降低PTE的发生率。但它不会包含太多的条目,以便可广泛应用于在日常的临床实践中。目前亟需开发一种适于亚种人群,特别是中国人群的SNP位点及位点组合模式用于VET的早期风险筛查,且基于这些SNP位点,可以实现对个体PTE患病风险的预测。

技术实现思路

[0006]针对上述现存的技术问题,本专利技术提供一种基于单核苷酸多态性的肺血栓栓塞症风险预测模型的构建方法、SNP位点组合及应用,开发有效科学、国人适用的PTE风险评估模型,将更加有效地降低PTE发生率和病死率,减少后遗症,提高PTE患者的生活质量,从而全面提升医疗质量与安全,减少卫生资源的消耗。
[0007]为实现上述目的,首先,本专利技术提供一种基于单核苷酸多态性的肺血栓栓塞症发生风险预测模型的构建方法,包括如下具体步骤:
[0008]S1、样本收集及基因检测:
[0009](1

1)招募肺血栓栓塞症患者,以及作为对照的健康个体。
[0010]上述技术方案中,要求两组招募对象的年龄,性别和血统等结构信息相匹配,以排除混杂因素。并且招募对象均来自于中国汉族人群,使得分析得到的SNP位点可以准确的反应中国人群的PTE患病风险。
[0011](1

2)收集招募对象的外周血液样本,使用高通量基因芯片技术进行基因检测,得到所有招募对象的基因组数据。
[0012]GWAS常用的高通量基因分型手段有基因芯片技术、全基因组重测序和全基因组外显子测序等。全基因组重测序对基因组遗传信息挖掘全面,但数据量大,成本较高。全基因组外显子测序极大降低了待测序列总量,但并未过多降低遗传信息。基因芯片可以实现对特定群体特定SNP位点的快速分型。较低的分型成本、时间成本、储存成本和分析成本是目前基因芯片技术的优势所在。上述技术方案中,基因检测使用的Illumina WeGene V2芯片是专门针对中国人群遗传背景设计,全面覆盖中国人群体中发现的常见变异,包含了策略性选择并优化的700,000多个标签SNP。
[0013]S2、数据质量控制及全基因组关联分析(GWAS):
[0014](2

1)对步骤S1得到的基因组数据进行样本的质量控制,得到合格样本的基因组数据。
[0015]进一步,所述的样本质量控制包括:删除性别错误的个体,因为通过X染色体杂合率计算性别,性别错误的个体可能存在DNA污染的问题;
[0016]删除SNP缺失率过高的个体,阈值为0.05。因为SNP缺失率过高说明DNA质量及分型质量不好;
[0017]删除有亲缘关系的样本,亲缘关系可以用identity by state(IBS)来衡量,设置阈值为0.2。
[0018](2

2)对步骤S1得到的合格样本的基因组数据进行位点的质量控制,得到合格的SNP位点。
[0019]进一步,所述的位点的质量控制:删除缺失率过高的SNP位点,剔除缺失率在20%以上的位点;
[0020]删除等位基因频率(MAF)较小的SNP位点,阈值为0.01;
[0021]删除偏离哈迪温伯格平衡的SNP位点(HWE)(P<1
×
10
‑5)。
[0022](2

3)对步骤S2

2得到的合格的SNP位点进行基因型填充(imputation),首先采用Eagle软件构建单倍型,然后采用Minimac4软件进行填补,以1000Genomes计划Phase3的基因型数据作为参照,再针对填补后的位点本文档来自技高网
...

【技术保护点】

【技术特征摘要】
state(IBS)来衡量,设置阈值为0.2。5.根据权利要求1所述的一种基于单核苷酸多态性的肺血栓栓塞症风险预测模型的构建方法,其特征在于,步骤S2

2中,位点的质量控制包括:删除缺失率过高的SNP位点,剔除缺失率在20%以上的位点;删除等位基因频率(MAF)较小的SNP位点,设置阈值为0.01;删除偏离哈迪温伯格平衡的SNP位点(HWE)(P<1
×
10
‑5)。6.根据权利要求1所述的一种基于单核苷酸多态性的肺血栓栓塞症风险预测模型的构建方法,其特征在于,步骤S2

3中,对填补后的位点进行质量控制包括:删除填充质量(imputation quality)较小的位点,阈值为0.3;删除等位基因频率(MAF)较小的SNP位点,阈值为0.01;删除缺失率过高的SNP位点,剔除缺失率在20%以上的位点。7.根据权利要求1所述的一种基于单核苷酸多态性的肺血栓栓塞症风险预测模型的构建方法,其特征在于,...

【专利技术属性】
技术研发人员:翟振国张竹翁昊艺王理中庞文翼唐森威张萌陈钢王辰
申请(专利权)人:深圳市早知道科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1