遗传性心血管疾病检测方法技术

技术编号:18075068 阅读:23 留言:0更新日期:2018-05-31 04:31
本发明专利技术公开的遗传性心血管疾病检测方法,包括:采集样本;检测所述样本中的遗传变异位点,所述遗传变异位点,位于选定的基因上,所述选定的基因包括:MYBPC3、MYH7、TNN13、LMNA、MYH6、MYH7、DSC2、DSG2、DSP、ACTC1、DES中的一个或多个,KCNE1、KCNE2、KCNH2、SCN5A、CACNA1C、KCNQ1、RYR2、CALM1、CASQ2、GJA5中的一个或多个,FBN1、TGFBR1、TGFBR2、SMAD3、ACTA2、COL3A1、EFEMP2、ELN、NOTCH1中的一个或多个,TBX5、JAG1、NKX2‑5中的一个或多个,LDLR、APOB、APOE中的一个或多个,FBN2、TBX3中的一个或多个;根据所述遗传变异位点,通过心血管疾病推断模型判断样本所携带的心血管疾病基因和潜在的心血管疾病风险。

【技术实现步骤摘要】
遗传性心血管疾病检测方法
本专利技术涉及生物
,特别涉及一种遗传性心血管疾病检测方法。
技术介绍
目前已有的基因检测产品中,涉及心血管疾病的panel仅有两三个位点或者只能检测心血管系统疾病中的其中一种病,且参考的已知相关位点仅仅只参考一两篇文献。其假阳性率极高,对于诊断而言几乎无法应用。
技术实现思路
为解决以上问题,本专利技术提供一种遗传性心血管疾病检测方法,包括步骤:采集样本;检测所述样本中的遗传变异位点,所述遗传变异位点,位于选定的基因上,所述选定的基因包括:MYBPC3、MYH7、TNN13、LMNA、MYH6、MYH7、DSC2、DSG2、DSP、ACTC1、DES中的一个或多个,KCNE1、KCNE2、KCNH2、SCN5A、CACNA1C、KCNQ1、RYR2、CALM1、CASQ2、GJA5中的一个或多个,FBN1、TGFBR1、TGFBR2、SMAD3、ACTA2、COL3A1、EFEMP2、ELN、NOTCH1中的一个或多个,TBX5、JAG1、NKX2-5中的一个或多个,LDLR、APOB、APOE中的一个或多个,FBN2、TBX3中的一个或多个;根据所述遗传变异位点,通过心血管疾病推断模型判断样本所携带的心血管疾病基因和潜在的心血管疾病风险。优选的,所述样本为唾液样本。优选的,所述心血管疾病推断模型,其构建方法为:构建训练数据集,所述训练数据集包括自变量数据和因变量数据;通过机器学习训练分类器,得到心血管疾病推断模型;其中,自变量数据包括以下的一种或多种:基于千人基因组数据库计算得到的第一低频突变位点发生率,基于ExAc数据库计算得到的第二低频突变位点发生率,基于本地数据库计算得到的第三低频突变位点的发生率,通过第一低频突变位点发生率和/或第二低频突变位点发生率和/或第三低频突变位点发生率过滤后的样本纯合突变位点数目,通过第一低频突变位点发生率和/或第二低频突变位点发生率和/或第三低频突变位点发生率过滤后的样本杂合突变位点数目,根据公共数据库判定为高危突变位点的纯合突变位点数目,所述公共数据库包括ClinVar数据库、在线人类孟德尔遗传数据库、人类基因突变数据库中的一个或多个,根据公共数据库判定为高危突变位点的杂合突变位点数目,所述公共数据库包括ClinVar数据库、在线人类孟德尔遗传数据库、人类基因突变数据库中的一个或多个,将根据公共数据库判定为高危突变位点的纯合突变位点和杂合突变位点所在的基因,构建突变关系矩阵,矩阵中的元素Ai,j标记为突变数目,未突变的基因标记为0,进行主成分分析对数据降维,并选出前预设数量的主成分,所述预设数量为预设的1~5之间的整数;因变量数据为采集的测试样本,所述测试样本包括阳性样本和阴性样本,所述阳性样本和阴性样本的数量均不低于预设的第一数量,所述样本包括性别,年龄层,吸烟史的记录数据。优选的,所述遗传变异位点,属于206个SNP位点中的多个,所述206个SNP位点为:BOT-rs104894363:AAATTCCTGGATTTGGGTCTGTTCGAACATGGAGAACACGTTGGAGTTGGBOT-seq-rs777518512:GGATGGGCATCCTCGGCCGTGGGCTGCAGGAGTACCAGCTGCCCTACCAGBOT-seq-rs794728218:CATCACCTGTGTATCCTTCCTTGCACAGACAGCGGTAAGATCCCATGGTTJHU_X.32408310:AAACTGATCTCATGACTTGTCAAATCAGATTGGATTTTCTGTTGGGAGGAKCNJ2-chr17-68171587:CAAAGCTTGTGTGTCCGAGGTCAACAGCTTCACGGCTGCCTTCCTCTTCTseq-rs104893869:CAGGCCACTTTCATGAAACTCCATACTATCACAGCCATTTGGTCCAATGAseq-rs199472697.1:CTGCAGGAGATCGTGCTGGTGGTGTTCTTCGGGACGGAGTACGTGGTCCTseq-rs199472698:CACAGGGCAGGCATGACTCACCGATGATGGAAATGGGCTTCCGGGCAAAGseq-rs199472709:AGGTGCCTCCCTGGCGGTCGACGTGTAGCATCCTCAGGATCTGCAGGAAGseq-rs199472712:CCTTCGCAGGGGCATCCGCTTCCTGCAGATCCTGAGGATGCTACACGTCAseq-rs199472712.1:CCTTCGCAGGGGCATCCGCTTCCTGCAGATCCTGAGGATGCTACACGTCTseq-rs199472716:GATCCTGAGGATGCTACACGTCGACCGCCAGGGAGGCACCTGGAGGCTCCseq-rs199472718:CGACCGCCAGGGAGGCACCTGGAGGCTCCTGGGCTCCGTGGTCTTCATCCseq-rs199472719:ACCGCCAGGGAGGCACCTGGAGGCTCCTGGGCTCCGTGGTCTTCATCCACseq-rs199472724:GTTCCTGGAGCCCGACACTGTGTGTTTTCTGGCCTAGGAGCTGATAACCAseq-rs199472725:TCTCAGCCAGGTACACAAAGTACGAGGAGAAGATGAGGCCCAGGAAGCCGseq-rs199472734:ACATCGGCTTCCTGGGCCTCATCTTCTCCTCGTACTTTGTGTACCTGGCTseq-rs199472735:CCTGGGCCTCATCTTCTCCTCGTACTTTGTGTACCTGGCTGAGAAGGACGseq-rs199472736:CTCCTCGTACTTTGTGTACCTGGCTGAGAAGGACGCGGTGAACGAGTCAGseq-rs199472751:GACCACTGTCCCTCTCCCTGCAGGTCACAGTCACCACCATCGGCTATGGGseq-rs199472752:TGTCCCTCTCCCTGCAGGTCACAGTCACCACCATCGGCTATGGGGACAACseq-rs199472753:CCCTCTCCCTGCAGGTCACAGTCACCACCATCGGCTATGGGGACAAGGTGseq-rs199472844:CTGCGCCGTCATCTACTGCAACGACGGCTTCTGCGAGCTGTGCGGCTACTseq-rs199472845:GCCGTCATCTACTGCAACGACGGCTTCTGCGAGCTGTGCGGCTACTCGCAseq-rs199472845.1:GCCGTCATCTACTGCAACGACGGCTTCTGCGAGCTGTGCGGCTACTCGCTseq-rs199472847:CATCTACTGCAACGACGGCTTCTGCGAGCTGTGCGGCTACTCGCGGGCCGseq-rs199472852:GGCCCCGCCCCGGCCCGC本文档来自技高网...
遗传性心血管疾病检测方法

【技术保护点】
一种遗传性心血管疾病检测方法,其特征在于,包括步骤:采集样本;检测所述样本中的遗传变异位点,所述遗传变异位点,位于选定的基因上,所述选定的基因包括:MYBPC3、MYH7、TNN13、LMNA、MYH6、MYH7、DSC2、DSG2、DSP、ACTC1、DES中的一个或多个,KCNE1、KCNE2、KCNH2、SCN5A、CACNA1C、KCNQ1、RYR2、CALM1、CASQ2、GJA5中的一个或多个,FBN1、TGFBR1、TGFBR2、SMAD3、ACTA2、COL3A1、EFEMP2、ELN、NOTCH1中的一个或多个,TBX5、JAG1、NKX2‑5中的一个或多个,LDLR、APOB、APOE中的一个或多个,FBN2、TBX3中的一个或多个;根据所述遗传变异位点,通过心血管疾病推断模型判断样本所携带的心血管疾病基因和潜在的心血管疾病风险。

【技术特征摘要】
1.一种遗传性心血管疾病检测方法,其特征在于,包括步骤:采集样本;检测所述样本中的遗传变异位点,所述遗传变异位点,位于选定的基因上,所述选定的基因包括:MYBPC3、MYH7、TNN13、LMNA、MYH6、MYH7、DSC2、DSG2、DSP、ACTC1、DES中的一个或多个,KCNE1、KCNE2、KCNH2、SCN5A、CACNA1C、KCNQ1、RYR2、CALM1、CASQ2、GJA5中的一个或多个,FBN1、TGFBR1、TGFBR2、SMAD3、ACTA2、COL3A1、EFEMP2、ELN、NOTCH1中的一个或多个,TBX5、JAG1、NKX2-5中的一个或多个,LDLR、APOB、APOE中的一个或多个,FBN2、TBX3中的一个或多个;根据所述遗传变异位点,通过心血管疾病推断模型判断样本所携带的心血管疾病基因和潜在的心血管疾病风险。2.根据权利要求1所述的方法,其特征在于,所述样本为唾液样本。3.根据权利要求1所述的方法,其特征在于,所述心血管疾病推断模型,其构建方法为:构建训练数据集,所述训练数据集包括自变量数据和因变量数据;通过机器学习训练分类器,得到心血管疾病推断模型;其中,自变量数据包括以下的一种或多种:基于千人基因组数据库计算得到的第一低频突变位点发生率,基于ExAc数据库计算得到的第二低频突变位点发生率,基于本地数据库计算得到的第三低频突变位点的发生率,通过第一低频突变位点发生率和/或第二低频突变位点发生率和/或第三低频突变位点发生率过滤后的样本纯合突变位点数目,通过第一低频突变位点发生率和/或第二低频突变位点发生率和/或第三低频突变位点发生率过滤后的样本杂合突变位点数目,根据公共数据库判定为高危突变位点的纯合突变位点数目,所述公共数据库包括ClinVar数据库、在线人类孟德尔遗传数据库、人类基因突变数据库中的一个或多个,根据公共数据库判定为高危突变位点的杂合突变位点数目,所述公共数据库包括ClinVar数据库、在线人类孟德尔遗传数据库、人类基因突变数据库中的一个或多个,将根据公共数据库判定为高危突变位点的纯合突变位点和杂合突变位点所在的基因,构建突变关系矩阵,矩阵中的元素Ai,j标记为突变数目,未突变的基因标记为0,进行主成分分析对数据降维,并选出前预设数量的主成分,所述预设数量为预设的1~5之间的整数;因变量数据为采集的测试样本,所述测试样本包括阳性样本和阴性样本,所述阳性样本和阴性样本的数量均不低于预设的第一数量,所述样本包括性别,年龄层,吸烟史的记录数据。4.根据权利要求1所述的方法,其特征在于,所述遗传变异位点,属于206个SNP位点中的多个,所述206个SNP位点为:BOT-rs104894363:AAATTCCTGGATTTGGGTCTGTTCGAACATGGAGAACACGTTGGAGTTGGBOT-seq-rs777518512:GGATGGGCATCCTCGGCCGTGGGCTGCAGGAGTACCAGCTGCCCTACCAGBOT-seq-rs794728218:CATCACCTGTGTATCCTTCCTTGCACAGACAGCGGTAAGATCCCATGGTTJHU_X.32408310:AAACTGATCTCATGACTTGTCAAATCAGATTGGATTTTCTGTTGGGAGGAKCNJ2-chr17-68171587:CAAAGCTTGTGTGTCCGAGGTCAACAGCTTCACGGCTGCCTTCCTCTTCTseq-rs104893869:CAGGCCACTTTCATGAAACTCCATACTATCACAGCCATTTGGTCCAATGAseq-rs199472697.1:CTGCAGGAGATCGTGCTGGTGGTGTTCTTCGGGACGGAGTACGTGGTCCTseq-rs199472698:CACAGGGCAGGCATGACTCACCGATGATGGAAATGGGCTTCCGGGCAAAGseq-rs199472709:AGGTGCCTCCCTGGCGGTCGACGTGTAGCATCCTCAGGATCTGCAGGAAGseq-rs199472712:CCTTCGCAGGGGCATCCGCTTCCTGCAGATCCTGAGGATGCTACACGTCAseq-rs199472712.1:CCTTCGCAGGGGCATCCGCTTCCTGCAGATCCTGAGGATGCTACACGTCTseq-rs199472716:GATCCTGAGGATGCTACACGTCGACCGCCAGGGAGGCACCTGGAGGCTCCseq-rs199472718:CGACCGCCAGGGAGGCACCTGGAGGCTCCTGGGCTCCGTGGTCTTCATCCseq-rs199472719:ACCGCCAGGGAGGCACCTGGAGGCTCCTGGGCTCCGTGGTCTTCATCCACseq-rs199472724:GTTCCTGGAGCCCGACACTGTGTGTTTTCTGGCCTAGGAGCTGATAACCAseq-rs199472725:TCTCAGCCAGGTACACAAAGTACGAGGAGAAGATGAGGCCCAGGAAGCCGseq-rs199472734:ACATCGGCTTCCTGGGCCTCATCTTCTCCTCGTACTTTGTGTACCTGGCTseq-rs199472735:CCTGGGCCTCATCTTCTCCTCGTACTTTGTGTACCTGGCTGAGAAGGACGseq-rs199472736:CTCCTCGTACTTTGTGTACCTGGCTGAGAAGGACGCGGTGAACGAGTCAGseq-rs199472751:GACCACTGTCCCTCTCCCTGCAGGTCACAGTCACCACCATCGGCTATGGGseq-rs199472752:TGTCCCTCTCCCTGCAGGTCACAGTCACCACCATCGGCTATGGGGACAACseq-rs199472753:CCCTCTCCCTGCAGGTCACAGTCACCACCATCGGCTATGGGGACAAGGTGseq-rs199472844:CTGCGCCGTCATCTACTGCAACGACGGCTTCTGCGAGCTGTGCGGCTACTseq-rs199472845:GCCGTCATCTACTGCAACGACGGCTTCTGCGAGCTGTGCGGCTACTCGCAseq-rs199472845.1:GCCGTCATCTACTGCAACGACGGCTTCTGCGAGCTGTGCGGCTACTCGCTseq-rs199472847:CATCTACTGCAACGACGGCTTCTGCGAGCTGTGCGGCTACTCGCGGGCCGseq-rs199472852:GGCCCCGCCCCGGCCCGCTCCTACCATCTTTCCGGTAGAAGGCGATTTCCseq-rs199473000:CTGAGCTCCCTGTCCTCTCCATGGCCTCCAGGGAAGAATGACATCTTTGAseq-rs199473000.1:CTGAGCTCCCTGTCCTCTCCATGGCCTCCAGGGAAGAATGACATCTTTGCseq-rs199473002:CCAGCACCTCCAGCAGGTCGTCCCGATGGATCTTGTGTAGGTCACAGTAGseq-rs199473004:GGATGTGCGGGCCCTCACCTACTGTGACCTACACAAGATCCATCGGGACGseq-rs199473005:GGGATGTGCGGGCCCTCACCTACTGTGACCTACACAAGATCCATCGGGACseq-rs199473011:GTCCAGTGGCCCCTCCAGCCCTGAGAGCAGTGAGGATGAGGGCCCAGGCCseq-rs199473014:CTTCTCGCAGTCCTCCATCAGGGGCTCCCCACCCGGCGGCTCTCCGGGGGseq-rs199473018:GAGCTCCTGGTACTGGCGGCCCCGACTGTCCCCCCAGAAGCTGAAAATGTseq-rs199473022:CTCACCTGTTGAGCTGGCGCTGGAGGGCATCCAGCCTGCTCTCCACGTCGseq-rs199473039:CGCAGATGGAGAAGATCTTCTCTGAGTTGGTGTTGGGAGAGACGTTGCCTseq-rs199473225.1:GAAGATGAGCCAGAAGATGAGGCAGACGAGGAGGACGTTCATGATGGACCseq-rs199473226:TCTGTCCACTTGAGGTGGTGGTCAATGCCCTGGTGGGCGCCATCCCGTCCseq-rs199473233:TCCCTCTGTCTGGTTGATGCACCTCCCAAACTTCCCCGCAAAGAGGTTCAseq-rs199473250:CCTTGCAGTATGAAGAGCAGCCTCAGTGGGAATACAACCTCTACATGTACseq-rs199473253:GGTTGAAGTTGTCAATGATGACACCAATAAAGAGGTTCAGGGTGAAGAAAseq-rs199473260:TGGGCTTCTGGGGCTTCTTGGAGCCCAGCTTCTTCATGGCATTGTAGTACseq-rs199473278:GGCTGCCCTGCGCCACTACTACTTCACCAACAGCTGGAATATCTTCGACTseq-rs199473410.1:GGGTTTGCCCTGAAGGTGCAGCAGAAGCAGAGGCAGAAGCACTTCAACCCseq-rs199473411:CGGGGTTTGCCCTGAAGGTGCAGCAGAAGCAGAGGCAGAAGCACTTCAACseq-rs199473417:TGTGCGGCTACTCGCGGGCCGAGGTGATGCAGCGACCCTGCACCTGCGACseq-rs199473419:CTACTCGCGGGCCGAGGTGATGCAGCGACCCTGCACCTGCGACTTCCTGCseq-rs199473420:CTCGCGGGCCGAGGTGATGCAGCGACCCTGCACCTGCGACTTCCTGCACCseq-rs201366610:GCTGATCTGCTGGCATCTTGCAGTTTTCTGAACTTCTCAGCTTTTTCTCAseq-rs201366610.1:GCTGATCTGCTGGCATCTTGCAGTTTTCTGAACTTCTCAGCTTTTTCTCCseq-rs201831933:GCAGGAGGTGGAACATAAGAAGAAGAAGCTGGAGGCGCAGGTGCAGGAGCSEQ-rs2229109:TTGATTAATCATTTATCACTGTACCTTAACTTCTTTTCGAGATGGGTAATseq-rs2229109.1:TTGATTAATCATTTATCACTGTACCTTAACTTCTTTTCGAGATGGGTAAAseq-rs267607155:GGTTATCTGGAAGTCAATGGAACTTTCGATTTGGTAGTCTTCCCTGTACCseq-rs28928902:AACTTTGGTGGGAACCGGTAAGTCAGCAAGGGATCATCTCCATTCTGGCGseq-rs28928902.1:AACTTTGGTGGGAACCGGTAAGTCAGCAAGGGATCATCTCCATTCTGGCAseq-rs28928904:TGTCCTTGATGGAGGGGCCGCCCAGGCCGCTGCTGTTGTAGGGTTTGCCTseq-rs28928905:CCACCTACGTCAATGCCAACGAGGAGGTGGTCAGCCACCCCGGCCGCATCseq-rs28933091:TGTAGATGTTCTTCTGGAAGTCCAGTTCCTCCTTCATGGTCTGCAGCCTGseq-rs28933396:TTCCCATCCTGCCCTGGCTCAGGGTCTCACATGCATCTCTGGTGCACAGTseq-rs28933396.1:GGACACGCCATCATGTCCTTCTATGCCGCCTTGATCGACCTGCTCGGACTseq-rs28937318:CGGCTACACCAGCTTCGATTCCTTTGCCTGGGCCTTTCTTGCACTCTTCCseq-rs36210423:GAGCCACCACACATCACTGCTGGTGCCCTGGCCCCTGCGCCGGACCAGTGseq-rs3730271:CTCCAGTCCCTCATCTGAAGGTTCCCTCTCCCAGAGGCAGAGGTCGACAAseq-rs386834236:TCCCATGGTTGGAGATGGCCTGGACAGCTCCTACAGGCCTGCGGGAGAAGseq-rs387906567:GCGCTTCTGCAGGTCATCGGCATCGCGGAGGAGCCGCTTACGCAGCTTGCseq-rs387906592:CCACAATGTCCCCATCTATGAGGGCTATGCCTTGCCCCATGCCATCATGCseq-rs387906606:ATTTCATTCCCCGCCTGGCCTCTCACTCACCACTGGACCAGGAAGCCCTCseq-rs387906613:CGCACAGTGTGCATGGCGTGGCCCATGTACACCAGAGAGGGCGTGGAGATseq-rs387906613.1:CGCACAGTGTGCATGGCGTGGCCCATGTACACCAGAGAGGGCGTGGAGAAseq-rs387906623:AAAAACCAGAAAGTTCTGACAATGCCGTCATGACTCACCAACGGGTAAACseq-rs387906660:CTGGAAAAGCAGCTTTCGACAAAAGTCACAAAATGCTAAGGTGAAAAACAseq-rs387906660.1:CTGGAAAAGCAGCTTTCGACAAAAGTCACAAAATGCTAAGGTGAAAAACGseq-rs387906660.2:CTGGAAAAGCAGCTTTCGACAAAAGTCACAAAATGCTAAGGTGAAAAACTseq-rs387906664:CATGAGGTGTCCACAGGGCTCAATCTTTACATCCTTATCATTTTCAGCACseq-rs387906665:GATCCGTACCTGCCAGGATGTAAGACAGGATGTGCACATGAGGTGTCCACseq-rs387906696:TTCTCTTTTTCCAGCGTTACAGTGTTTCTGCCACCTCTGTACAAAAGACAseq-rs387906782:TTTTCTCTCCTCCCCCTTTCATTTGCAGTGGGAAATTTGGACAGGTCTTTseq-rs387906850:GCCTAGGGCTGCTCTCCAATGTCAACAGGAATGCAGCAGTGGAGCTGACAseq-rs387906853:AGCCAGTTACCTACTGCGAGCCGGCCTTCTGGTGCTCCATCTCCTACTACseq-rs387906855:TCCTGTTGACATTGGAGAGCAGCCCTAGGCAGAAGCGCTCCGAATTGGAGseq-rs387906874:TTCTCCACTTTTTATTTCAGGAGACTCCATCCTCTGCCAATGGCCCTTCCseq-rs387907079:AGAGGAACAAAGGAAGAGAACGGAGGAGGAACGAAAACGCAGAATTGAGGseq-rs387907216:TCTGTGTAGGAGCCTGGATTGTCACTGGGGGTCTGCACACGGGCATCGGCseq-rs387907218:CTCCTCATCACTCTTGGCGGCCACCCCACAGAAAATCACTGTGCTGATCCseq-rs387907227:TTTTAAACTACCCTAATAGCACATCCCTCCAACCTTGGAATCTCTAACTCseq-rs387907267:ACACATCGATACTGGTGAAGGACCTGCCCACGGGGGCCCGGCTGCTTTTCseq-rs387907306:GCAGAAGACGCTGGAGCAGTTCCACCTGAGCTCCATGAGCTCGCTGGGCAseq-rs387907306.1:GCAGAAGACGCTGGAGCAGTTCCACCTGAGCTCCATGAGCTCGCTGGGCTseq-rs387907365:AAAATTCCCCCTTTTTAATGAACTTTTCCTCTGCTGTGCTACTTAGACTCseq-rs3918389:AGACCTGGGTTCTGAAGCAGATTTTGCAGATGATGAAAACAGCACAGCGAseq-rs3918389.1:AGACCTGGGTTCTGAAGCAGATTTTGCAGATGATGAAAACAGCACAGCGCseq-rs3918389.2:AGACCTGGGTTCTGAAGCAGATTTTGCAGATGATGAAAACAGCACAGCGTseq-rs397507465:GCGGAAACCC...

【专利技术属性】
技术研发人员:宁丽峰周越邱顺晨李鹏
申请(专利权)人:国家卫生计生委科学技术研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1