基于表型分析基因突变的方法、系统、装置和计算机可读存储介质制造方法及图纸

技术编号:43923450 阅读:16 留言:0更新日期:2025-01-03 13:27
本申请公开了一种基于表型分析基因突变的方法、系统、装置和计算机可读存储介质,方法包括以下步骤:数据获取,获取受检者的表型和基因突变的数据;表型描述,包括将受检者的表型描述为规范词条;基因赋分,包括根据遗传异质性、遗传模式和表型比较来对受检者基因突变的每个基因进行赋分,得到每个基因的分值;排序,基于分值对受检者的基因突变进行排序。根据本申请,通过分析受检者表型与其突变所在基因的表型相关性,根据相关性对基因突变进行赋分,再根据分值对突变进行排序,能够使医学解读人员能够优先关注到可能和受检者表型相关的致病基因突变,有利于提高医学解读人员的工作效率。

【技术实现步骤摘要】

本申请涉及遗传分析,特别是涉及一种基于表型分析基因突变的方法、系统、装置和计算机可读存储介质


技术介绍

1、遗传病是由遗传因素引起的疾病,通常涉及一个或多个基因的突变。基因检测是对个体基因组中特定基因或基因区域进行分析,以确定遗传信息、基因变异及其潜在影响的一种技术手段。基因检测在遗传病诊断中的应用非常广泛,可以帮助确诊已经表现出症状的患者,还可以用于携带者的检测,评估家庭成员的风险。

2、对受检者进行基因检测,通常会检测到较多基因突变,目前虽然有蛋白质功能预测软件(如sift、polyphen2、mutationtaster、dann、cadd、primateai等软件)、人群频率数据库(如1000genomes project、exome variant server、the exome aggregationconsortium等数据库)等功能预测工具对基因突变的致病性进行预测,但这些方法主要是从基因突变的功能性进行考虑,并未考虑患者表型与突变的关联,经功能预测后可能仍然有大量意义不明的突变,如何从这些大量的基因突变中查找可能与受检者所患疾病相关的突变,医生或医学解读人员需要花费大量时间去查阅文献和数据库,这对于解读人员的经验要求较高,且耗时较长。


技术实现思路

1、基于上述问题,本申请提供一种基于表型分析基因突变的方法、系统、装置和计算机可读存储介质。

2、本申请采用了以下技术方案:

3、本申请的第一方面公开了一种基于表型分析基因突变的方法,包括:数据获取,获取受检者的表型和基因突变的数据;表型描述,包括将所述受检者的表型描述为规范词条;基因赋分,包括根据遗传异质性、遗传模式和表型比较来对所述受检者基因突变的每个基因进行赋分,得到每个基因的分值;排序,基于所述分值对所述受检者的基因突变进行排序,分值越高的基因则为所述受检者的致病基因的可能性越高;其中,所述基因赋分包括以下情况:若所述基因突变的基因对应的疾病存在遗传异质性,则对该基因赋值0分;若所述基因对应的疾病不存在遗传异质性,且所述基因对应的疾病的遗传模式为显性遗传:所述受检者的表型的规范化词条全部包含在该基因对应表型规范词条中,则对该基因赋值2分;所述受检者的表型的规范化词条部分包含在该基因对应表型规范词条中,则对该基因赋值1分;所述受检者的表型的规范化词条和该基因对应表型规范词条不存在重合,则将所述受检者的表型和所述受检者的基因突变所在基因对应的表型规范词条进行相似度比较,相似度大于预定值,则对该基因赋值1分;若所述基因对应的疾病不存在遗传异质性,且所述基因对应的疾病的遗传模式为隐性遗传:所述受检者的表型的规范化词条全部包含在该基因对应表型规范词条中,则对该基因赋值1分;所述受检者的表型的规范化词条部分包含在该基因对应表型规范词条中,则对该基因赋值0.5分;所述受检者的表型的规范化词条和该基因对应表型规范词条不存在重合,则将所述受检者的表型和所述受检者的基因突变所在基因对应的表型规范词条进行相似度比较,相似度大于第一预定值,则对该基因赋值0.5分。

4、需要说明的是,本申请中,通过分析受检者表型与其突变所在基因的表型相关性,根据相关性对基因突变进行赋分,再根据分值对突变进行排序,能够使医学解读人员能够优先关注到可能和受检者表型相关的基因突变,且该突变极可能为导致受检者表型的致病突变,从而有利于提高医学解读人员的工作效率。本申请考虑了患者表型与突变所在基因的关联,能够节省人力与时间成本,且能够减少人为的主观性的解读的影响,使结果更规范。

5、本申请的一种实现方式中,所述规范词条为hpo词条。需要说明的是,hpo(humanphenotype ontology,人类表型术语集)是一个标准化的词汇表,用于描述人类表型特征,hpo词条(hpo terms)是指在hpo中定义的具体表型特征或症状,每个词条都有一个唯一的标识符(id),通常以“hp:”开头,后跟一系列数字。例如,“hp:0000010”指的是“recurrenturinary tract infections”这一词条。需要说明的是,hpo词条可以是从chpo下载的中文词条,chpo是指“chinese human phenotype ontology”(中文人类表型标准用语联盟),是一个类似于hpo的术语集,用于对国外已有的hpo词条进行翻译优化,chpo旨在为中国人群中的遗传病诊断、基因功能研究和临床数据分析提供标准化的术语体系。

6、本申请的一种实现方式中,还包括:在所述数据获取之前对所述基因突变进行过滤,或在排序之后再对所述基因突变进行过滤,所述过滤包括排除所述基因突变中的良性突变和疑似良性突变。需要说明的是,可以通过gnomad、clinvar、dbsnp、exac、1000genomesproject数据库等对基因突变进行过滤,去除良性和疑似良性的突变,以减少解读人员需关注的基因突变,提高解读效率。

7、本申请的一种实现方式中,所述基因突变为新发突变,所述新发突变是指为所述受检者首次出现的基因突变,非遗传自父母的基因突变。需要说明的是,孩子患有遗传病而父母健康的情况下,新发突变通常是孩子患病的原因,准确评估新发突变的致病性对于遗传病的诊断和治疗至关重要,因此,针对受检者的新发突变进行分析,有利于分析得到受检者的致病基因。

8、本申请的一种实现方式中,所述相似度通过python开源包pyhpo进行计算得到,且所述第一预定值为0.1。需要说明的是,pyhpo是一专为处理人类表型术语集(hpo)设计的python库,网址:https://pyhpo.readthedocs.io/en/latest/tutorial/basics.html,github地址:https://github.com/anergictcell/pyhpo,其支持计算表型相似度,在生物信息学中,计算表型相似度对于遗传病诊断、基因功能研究和临床数据分析非常重要,可使用pyhpo提供的calculate_similarity函数计算两个病例之间的表型相似度:similarity_score=calculate_similarity(phenotypes_case_1,phenotypes_case_2,ontology)print(f"similarity score between case 1and case 2:{similarity_score}")。

9、本申请的一种实现方式中,还包括:将多个过往分析的受检者的数据存入本地数据库,在所述基因赋分之后和排序之前,再在所述本地数据库中通过遍历计算当前受检者的表型的规范化词条和过往受检者的表型的规范化词条的相似性,将所述相似性大于第二预定值的过往受检者中的基因的分值加到所述当前受检者的相同基因的分值中,以得到所述当前受检者的每个基因的分值。需要说明的是,通过先对大量受检者的突变进行评分,将信息存储到数据库,对之后的患者(当前受检者)进行评分时,先搜索数本文档来自技高网...

【技术保护点】

1.一种基于表型分析基因突变的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述规范词条为HPO词条。

3.根据权利要求1所述的方法,其特征在于,还包括:在所述数据获取之前对所述基因突变进行过滤,或在排序之后再对所述基因突变进行过滤,所述过滤包括排除所述基因突变中的良性突变和疑似良性突变。

4.根据权利要求1所述的方法,其特征在于,所述基因突变为新发突变,所述新发突变是指为所述受检者首次出现的基因突变,非遗传自父母的基因突变。

5.根据权利要求1所述的方法,其特征在于,所述相似度通过python开源包pyhpo进行计算得到,且所述第一预定值为0.1。

6.根据权利要求1至5任一项所述的方法,其特征在于,还包括:将多个过往分析的受检者的数据存入本地数据库,在所述基因赋分之后和排序之前,再在所述本地数据库中通过遍历计算当前受检者的表型的规范化词条和过往受检者的表型的规范化词条的相似性,将所述相似性大于第二预定值的过往受检者中的基因的分值加到所述当前受检者的相同基因的分值中,以得到所述当前受检者的每个基因的分值。

7.根据权利要求6所述的方法,其特征在于,所述相似性=2*当前受检者的表型的规范化词条与该过往受检者的表型的规范化词条中相同的词条的数量/(当前受检者的表型的规范化词条的数量+该过往受检者的表型的规范化词条的数量),且所述第二预定值为0.5。

8.一种基于表型分析基因突变的系统,其特征在于,包括:

9.一种基于表型分析基因突变的装置,其特征在于,包括存储器和处理器,所述存储器用于存储程序,所述处理器通过执行所述存储器存储的程序以实现如权利要求1至7任一项所述的基于表型分析基因突变的方法。

10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有程序,所述程序能够被处理器执行以实现如权利要求1至7任一项所述的基于表型分析基因突变的方法。

...

【技术特征摘要】

1.一种基于表型分析基因突变的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述规范词条为hpo词条。

3.根据权利要求1所述的方法,其特征在于,还包括:在所述数据获取之前对所述基因突变进行过滤,或在排序之后再对所述基因突变进行过滤,所述过滤包括排除所述基因突变中的良性突变和疑似良性突变。

4.根据权利要求1所述的方法,其特征在于,所述基因突变为新发突变,所述新发突变是指为所述受检者首次出现的基因突变,非遗传自父母的基因突变。

5.根据权利要求1所述的方法,其特征在于,所述相似度通过python开源包pyhpo进行计算得到,且所述第一预定值为0.1。

6.根据权利要求1至5任一项所述的方法,其特征在于,还包括:将多个过往分析的受检者的数据存入本地数据库,在所述基因赋分之后和排序之前,再在所述本地数据库中通过遍历计算当前受检者的表型的规范化词条和过往受检者的表...

【专利技术属性】
技术研发人员:黄凯窦浩宇刘永初刘阳李阳
申请(专利权)人:深圳雅济科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1