一种局灶性癫痫遗传风险评估模型的建立方法技术

技术编号:30410438 阅读:15 留言:0更新日期:2021-10-20 11:40
本发明专利技术公开了一种局灶性癫痫遗传风险评估模型的建立方法,包括以下步骤:(1)选择局灶性癫痫患者入组,采集癫痫患者样本并且对样本进行基因分型并且对分型结果进行质控,确定入组样本,建立研究队列,分为训练集和测试集;(2)构建局灶性癫痫遗传风险位点数据库;(3)基于步骤(2)中的局灶性癫痫遗传风险位点数据库,基于基因分型,选择模型的特征和统计所述特征的数量,生成所述训练集和所述测试集这两个队列数据集的特征矩阵;假设参数多基因遗传风险评分,构建局灶性癫痫遗传风险评估模型并且进行模型训练。提供适用于中国人群的局灶性癫痫患病遗传风险评分模型。癫痫患病遗传风险评分模型。癫痫患病遗传风险评分模型。

【技术实现步骤摘要】
一种局灶性癫痫遗传风险评估模型的建立方法


[0001]本专利技术遗传风险评估领域,具体涉及一种局灶性癫痫遗传风险评估模型的建立方法。

技术介绍

[0002]目前,在精准医学领域,癫痫的遗传分子学诊断主要依赖于二代测序(基因包、全外显子测序等)结合遗传变异解读,识别患病基因和变异。而该手段在局灶性癫痫患者中的诊断率有限。既往多项研究显示,仅极个别类型的局灶性癫痫可用单个基因/变异解释(参见文献PMID:30568546)。另一方面,多项GWAS研究显示,常见类型局灶性癫痫与多态性位点的低效应量风险等位基因相关(参见文献PMID:24014518)。
[0003]多基因风险评分(polygenic risk scores,PRS)是对受检者的低效应量风险等位基因进行加权累加获得,该加权累计值可用于个体的疾病遗传风险评估。其中,等位基因的权重依据既往相关疾病全基因组关联分析研究(GWAS)结果获取。目前PRS已被广泛应用于精神类疾病遗传风险评估。在癫痫领域,Marie等学者(参见PMID:33090489)试图应用PRS的思想评估局灶性癫痫的遗传异质性,以对局灶性癫痫的临床异质性进行解释。但目前并未有学者应用PRS进行局灶性癫痫的风险分层和辅助诊断。
[0004]基于多基因风险评分,仅对患病的遗传因素进行评估,因此该方法的评估效力受疾病的遗传力限制。另一方面,计算PRS时,风险位点的权重以既往GWAS研究结果为前提,因此评估效力亦受现有GWAS研究效力影响,如“赢者诅咒”和人群偏倚等。
[0005]有鉴于此,特提出本专利技术。

技术实现思路

[0006]本专利技术的目的是提供一种局灶性癫痫遗传风险评估模型的建立方法,解决了目前没有应用PRS进行局灶性癫痫的风险分层和辅助诊断的缺陷。
[0007]为了实现上述目的,本专利技术提供的一种局灶性癫痫遗传风险评估模型的建立方法,包括以下步骤:
[0008](1)选择局灶性癫痫患者及未患病对照人群入组,采集入组人群样本并且对样本进行基因分型,然后基于全部样本分型结果进行质控,确定最终入组样本,建立研究队列,分为训练集和测试集;
[0009](2)构建局灶性癫痫遗传风险位点数据库;
[0010](3)基于步骤(2)中的局灶性癫痫遗传风险位点数据库,构建包含多变量的局灶性癫痫遗传风险评估模型。
[0011]优选地,步骤(1)中,所述入组人群样本包括病例组和对照组,所述病例组的入组标准为:依据国际癫痫联盟(ILAE)制定的癫痫临床诊疗指南,经两名或以上神经内科医生诊断为局灶性癫痫;年龄大于2岁且小于90岁;无合并精神类并发症;无假性癫痫发作史;无烟酒滥用史;不存在精神性或全身性退行性病变;不与其他入组个体存在亲缘关系;
[0012]所述对照组的入组标准为:健康无精神类疾病;年龄大于2岁且小于90岁;种族与病例队列保持一致;无合并精神类并发症;无假性癫痫发作史;无烟酒滥用史;不存在精神性或全身性退行性病变;不与其他入组个体存在亲缘关系。
[0013]进一步地,步骤(1)中,对样本进行基因分型并且对分型结果进行质控,包括以下步骤:
[0014]A、对所述病例组和所述对照组全部的采集样本进行全基因测序,对原始测序数据质控,进行BWA软件序列比对、比对数据处理、GATK软件进行SNP/Indel变异检测分析,获取突变vcf文件,其中比对数据处理包括对基因进行排序和去除重复序列;
[0015]B、应用软件plink对步骤A vcf文件的结果进行数据质控,移除所述病例组和所述对照组中基因分型缺失率高于0.05的个体、高杂合度个体和存在亲缘关系的个体;
[0016]C、确定所述病例组和所述对照组中的入组样本,建立研究队列,将所有入组样本随机分为训练集和测试集,所述训练集和所述测试集中样本比例为7:3,将训练集和测试集样本基因分型分别合并为存储文件。
[0017]进一步地,步骤(2)中,使用国际抗癫痫联盟主导的癫痫大型GWAS meta分析的summary文件,构建包含多个遗传相关位点信息及效应值的局灶性癫痫遗传风险位点数据库。
[0018]进一步地,步骤(3)中,构建局灶性癫痫遗传风险评估模型,包括以下步骤:
[0019]a、基于基因分型,选择模型的特征和统计所述特征的数量,生成所述训练集和所述测试集这两个队列数据集的特征矩阵;
[0020]b、假设参数多基因遗传风险评分,构建局灶性癫痫遗传风险评估模型并且进行模型训练。
[0021]本专利技术提供的一种局灶性癫痫遗传风险评估模型的建立方法,具有如下有益效果:
[0022]适用于中国人群的局灶性癫痫患病遗传风险评分模型,癫痫是临床表型及病因异质性均较强的疾病,本专利聚焦在遗传诊断率较低且具有较高遗传度的局灶性癫痫,进行遗传风险评估,提供遗传诊断。
附图说明
[0023]图1为本具体实施方式中局灶性癫痫遗传风险评估模型的建立方法的步骤流程图。
[0024]图2为本具体实施方式中局灶性癫痫遗传风险评估模型的建立方法的步骤1(3)A中对病例组和对照组全部的采集样本进行全基因测序的分析流程图。
具体实施方式
[0025]为了使本
的人员更好地理解本专利技术方案,下面结合具体实施方式对本专利技术作进一步的详细说明。
[0026]如图1所示,一种局灶性癫痫遗传风险评估模型的建立方法,包括以下步骤:
[0027]1、选择局灶性癫痫患者入组,采集患者样本并且对样本进行基因分型。
[0028](1)选择局灶性癫痫患者入组,建立研究队列。
[0029]病例组,入组标准为a、依据国际癫痫联盟(ILAE)制定的癫痫临床诊疗指南,经两名或以上神经内科医生诊断为局灶性癫痫;b、年龄大于2岁且小于90岁。排除标准为a、合并精神类并发症;b、假性癫痫发作史;c、烟酒滥用史;d、存在精神性或全身性退行性病变;e、与其他入组个体存在亲缘关系。
[0030]对照组,入组标准为a、健康无精神类疾病;b、年龄大于2岁且小于90岁;c、种族与病例队列保持一致。排除标准与病例组相同。
[0031](2)整理入组对象的信息资料。
[0032]依据入组人员知情同意原则,对入组对象进行外周血样本采集和基本信息资料整理,选择入组病例组1300例,对照组1400例。
[0033](3)基因分型并且对分型结果进行质控,确定最终的入组样本。
[0034]A、对病例组和对照组全部的采集样本进行全基因测序,对原始测序数据质控,进行BWA(Burrow

Wheeler Aligner)软件序列比对、比对数据处理(排序和去除重复序列clean data等)、GATK软件进行SNP/Indel变异检测等分析,获取突变vcf文件。分析流程如图2所示。
[0035]B、应用软件plink 1.9对步骤A的vcf结果进行数据质控,移除基因分型缺失率高于0.05的个体、高杂合度个体本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种局灶性癫痫遗传风险评估模型的建立方法,其特征在于,包括以下步骤:(1)选择局灶性癫痫患者及未患病对照人群入组,采集入组人群样本并且对样本进行基因分型,然后基于全部样本分型结果进行质控,确定最终入组样本,建立研究队列,分为训练集和测试集;(2)构建局灶性癫痫遗传风险位点数据库;(3)基于步骤(2)中的局灶性癫痫遗传风险位点数据库,构建包含多变量的局灶性癫痫遗传风险评估模型。2.根据权利要求1所述的局灶性癫痫遗传风险评估模型的建立方法,其特征在于,步骤(1)中,所述入组人群样本包括病例组和对照组,所述病例组的入组标准为:依据国际癫痫联盟(ILAE)制定的癫痫临床诊疗指南,经两名或以上神经内科医生诊断为局灶性癫痫;年龄大于2岁且小于90岁;无合并精神类并发症;无假性癫痫发作史;无烟酒滥用史;不存在精神性或全身性退行性病变;不与其他入组个体存在亲缘关系;所述对照组的入组标准为:健康无精神类疾病;年龄大于2岁且小于90岁;种族与病例队列保持一致;无合并精神类并发症;无假性癫痫发作史;无烟酒滥用史;不存在精神性或全身性退行性病变;不与其他入组个体存在亲缘关系。3.根据权利要求2所述的局灶性癫痫遗传风险评估模型的建立方法,其特征在于,步骤(1)中,对样本进行基因分型并且对分型结果进行质控,包括以下步骤:A、对所述病例组...

【专利技术属性】
技术研发人员:张晓芳王佳王小冬梁萌萌
申请(专利权)人:赛福解码北京基因科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1