【技术实现步骤摘要】
一种单基因病遗传变异智能解读及报告的方法和系统
本专利技术涉及数字医疗
,尤其涉及一种单基因病遗传变异智能解读及报告的方法和系统。
技术介绍
新一代测序技术在单基因病的致病突变研究和医疗实践中的应用越来越广泛。近年来,大量的研究证实,全外显子测序是开展单基因病相关研究,对单基因病患者进行致病突变鉴定和分子诊断的理想方法之一。然而,在精准医学应用层面,基于新一代测序技术在数据分析和临床解读方面还存在着很多问题,例如,现有的基因检测服务仅能够提供基本的基础数据分析,由于这些检测服务仅停留在科学研究层面,不能够直接对遗传变异进行鉴定和解读,因此还需专业的医生依据经验对上述基础数据分析解读后才能给出致病突变的结果,可见,这样通过人工解读的基础数据分析得到遗传变异报告的方式费时费力,效率极低,制约了精准医学的发展,阻碍了基于新一代测序相关产品和技术的推广。
技术实现思路
本专利技术的目的在于提供一种单基因病遗传变异智能解读及报告的方法,能够基于患者的基因原始序列数据自动分析出遗传变异的结果,并给出专业的遗传变异分析报告,提高了遗传变异的诊疗效率。为了实现上述目的,本专利技 ...
【技术保护点】
1.一种单基因病遗传变异智能解读及报告的方法,其特征在于,包括:获取基因序列数据,并对基因序列数据进行属性标记;其中,基因检测模式为单样本检测模式时,基因序列数据为1组待测人员的基因序列数据,基因检测模式为家系检测模式时,基因序列数据为1组待测人员和至少1组待测人员直系亲属的基因序列数据;分别将每组基因序列数据与人类参考基因组进行序列比对,得到对应数量的比对数据;从每组比对数据中获取遗传变异的长度信息、位置信息和碱基改变信息,基于所述遗传变异的长度信息识别其变异类型,以及基于所述遗传变异的位置信息和碱基改变信息预测其变异功能,所述变异类型包括SNP变异和inDel变异,所述 ...
【技术特征摘要】
1.一种单基因病遗传变异智能解读及报告的方法,其特征在于,包括:获取基因序列数据,并对基因序列数据进行属性标记;其中,基因检测模式为单样本检测模式时,基因序列数据为1组待测人员的基因序列数据,基因检测模式为家系检测模式时,基因序列数据为1组待测人员和至少1组待测人员直系亲属的基因序列数据;分别将每组基因序列数据与人类参考基因组进行序列比对,得到对应数量的比对数据;从每组比对数据中获取遗传变异的长度信息、位置信息和碱基改变信息,基于所述遗传变异的长度信息识别其变异类型,以及基于所述遗传变异的位置信息和碱基改变信息预测其变异功能,所述变异类型包括SNP变异和inDel变异,所述变异功能的类型包括变异有害、变异低害或基本无害;针对每个遗传变异的变异类型识别结果,对遗传变异所在的基因和人群发生频率进行注释,并在家系检测模式时判断其家系遗传模式;基于每个遗传变异的长度信息、位置信息、人群发生频率、预测的变异功能或家系遗传模式对遗传变异进行临床显著性分级,所述临床显著性分级包括致病、可能致病、致病性不明、可能良性和良性五种类型;根据各遗传变异的变异类型、人群发生频率、预测的变异功能、临床显著性分级以及是否被数据库收录,获取各遗传变异的影响性评分;通过待测人员所患的单基因病名称获取与之相关的多个基因,基于所述基因中各遗传变异的影响性评分、遗传变异的遗传模式以及基因对疾病的关联性,计算每个基因的致病性评分;按照致病性评分值的大小降序输出所述基因,以及按照所述基因中影响性评分值的大小降序输出所述基因中的遗传变异,生成遗传分析解读报告。2.根据权利要求1所述的方法,其特征在于,分别将每组基因序列数据与人类参考基因组进行序列比对,得到对应数量的比对数据的方法包括:针对获取的基因序列数据进行质量检测,对质量检测不合格的基因序列数据进行标记;将质量检测合格的基因序列数据输入BWA软件,使其与人类参考基因hg19或人类参考基因hg38进行序列比对;依次对各组比对结果进行去重、indel区域校正、碱基质量校正操作后得到多组比对数据;所述比对数据的内容包括序列在染色体上的比对位置、比对质量、配对序列在染色体上的比对位置、插入片段长度、序列的碱基组成或序列质量。3.根据权利要求1所述的方法,其特征在于,从每组比对数据中获取遗传变异的长度信息、位置信息和碱基改变信息,基于所述遗传变异的长度信息识别其变异类型,以及基于所述遗传变异的位置信息和碱基改变信息预测其变异功能的方法包括:利用HaplotyperCaller算法基于每组比对数据中遗传变异的长度信息,识别出所述遗传变异为SNP变异或者inDel变异;当所述遗传变异为错义突变时,采用SIFT软件或者Polyphen2软件对所述遗传变异的变异功能进行预测;当所述遗传变异为剪接位点变异时,采用HSF软件对所述遗传变异的变异功能进行预测。4.根据权利要求1所述的方法,其特征在于,针对每个遗传变异的变异类型识别结果,对遗传变异所在的基因和人群发生频率进行注释,并在家系检测模式时判断其家系遗传模式的方法包括:基于每个所述遗传变异的变异类型识别结果,通过公共数据库对所述遗传变异所在的基因和人群发生频率进行注释;在基因检测模式为家系检测模式时,通过分析各组比对数据中遗传变异的位置信息判断其家系遗传模式,当各组比对数据中遗传变异的位置信息相关联时判断为家系遗传,否则判断为非家系遗传。5.根据权利要求1所述的方法,其特征在于,根据各遗传变异的变异类型、人群发生频率、预测的变异功能、临床显著性分级以及是否被数据库收录,获取各遗传变异的影响性评分的方法包括:通过对每个遗传变异的证据的进行赋值,所述证据包括遗传变异的变异类型、人群发生频率、预测的变异功能、临床显著性分级、是否被数据库收录;采用影响性评分公式分别计算每个遗传变异的影响性评分,其中,f为证据的数量,wi为第i各证据的权重,si为第i各证据的赋值。6.根据权利要求5所述的方法,其特征在于,基于所述基因中各遗传变异的影响性评分、遗传变异的遗传模式以及基因对疾病的关联性,计算每个...
【专利技术属性】
技术研发人员:马旭,曹宗富,喻浴飞,陈翠霞,蔡瑞琨,李乾,高华方,
申请(专利权)人:国家卫生计生委科学技术研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。