The present invention discloses an accurate prediction method for pathogenic genetic variation, which divides the known pathogenic variation into two categories: database variation and training set positive variation, and the database variation gets some evidence in the ACMG guide, and the patient's training set is simulated by random extraction and the corresponding phenotypic data are simulated. The related features of the guide, using the ERIC based calculation method to calculate the phenotypic related characteristics, combined with the existing characteristics related to the pathogenicity judgment, use the machine learning algorithm to realize the variant pathogenicity prediction combined with genotype data and phenotypic data. The method solves the clinical phenotype in the actual scene. Incomplete data, noise and inaccurate description lead to the problem of accurate prediction of mutation pathogenicity.
【技术实现步骤摘要】
一种致病遗传变异的精确预测方法
本专利技术涉及一种预测方法,具体涉及一种致病遗传变异的精确预测方法。
技术介绍
罕见病遗传预测是指从患者基因组中找到能够解释患者临床表型的致病遗传变异的过程。能否精确快速地进行遗传预测关系着患者的后期治疗、护理甚至生命。但精确预测致病遗传变异的难点很大,实际场景中,存在临床表型数据不完整、带有噪音以及描述不准确的一系列问题导致无法进行变异致病性精确预测。
技术实现思路
针对现有技术中的上述不足,本专利技术提供的一种致病遗传变异的精确预测方法,解决了实际场景中存在临床表型数据不完整、带有噪音以及描述不准确导致无法进行变异致病性精确预测的问题。为了达到上述专利技术目的,本专利技术采用的技术方案为:一种致病遗传变异的精确预测方法,包括如下步骤:S1:收集已经报道和证实的致病变异,并根据发现时间的先后将已知致病变异分成两类:数据库变异和训练集阳性变异;S2:根据步骤S1中得到的数据库变异得到ACMG指南中的证据;S3:根据步骤S1中得到的训练集阳性变异,通过随机抽取方法模拟患者的遗传变异数据和相应的表型数据;S4:根据步骤S2得到的ACMG指南中的证据计算模拟遗传变异数据,得到ACMG指南相关的特征,实现指南相关的特征提炼;S5:利用基于ERIC的计算方法来计算模拟患者表型数据和每个基因的已知表型集合数据间的相似性,得到表型相关的特征,实现表型相关的特征提炼;S6:根据步骤S4得到的指南相关的特征和步骤S5得到的表型相关的特征,结合现有的跟致病性判断相关的特征,利用机器学习算法,实现综合考虑基因型数据和表型数据的变异致病性预测。本专利技 ...
【技术保护点】
1.一种致病遗传变异的精确预测方法,其特征在于,包括如下步骤:S1:收集已经报道和证实的致病变异,并根据发现时间的先后将已知致病变异分成两类:数据库变异和训练集阳性变异;S2:根据步骤S1中得到的数据库变异得到ACMG指南中的证据;S3:根据步骤S1中得到的训练集阳性变异,通过随机抽取方法模拟患者的遗传变异数据和相应的表型数据;S4:根据步骤S2得到的ACMG指南中的证据计算模拟遗传变异数据,得到ACMG指南相关的特征,实现指南相关的特征提炼;S5:利用基于ERIC的计算方法计算模拟患者表型数据和每个基因的已知表型集合数据间的相似性,得到表型相关的特征,实现表型相关的特征提炼;S6:根据步骤S4得到的指南相关的特征和步骤S5得到的表型相关的特征,结合现有的跟致病性判断相关的特征,利用机器学习算法,实现综合考虑基因型数据和表型数据的变异致病性预测。
【技术特征摘要】
1.一种致病遗传变异的精确预测方法,其特征在于,包括如下步骤:S1:收集已经报道和证实的致病变异,并根据发现时间的先后将已知致病变异分成两类:数据库变异和训练集阳性变异;S2:根据步骤S1中得到的数据库变异得到ACMG指南中的证据;S3:根据步骤S1中得到的训练集阳性变异,通过随机抽取方法模拟患者的遗传变异数据和相应的表型数据;S4:根据步骤S2得到的ACMG指南中的证据计算模拟遗传变异数据,得到ACMG指南相关的特征,实现指南相关的特征提炼;S5:利用基于ERIC的计算方法计算模拟患者表型数据和每个基因的已知表型集合数据间的相似性,得到表型相关的特征,实现表型相关的特征提炼;S6:根据步骤S4得到的指南相关的特征和步骤S5得到的表型相关的特征,结合现有的跟致病性判断相关的特征,利用机器学习算法,实现综合考虑基因型数据和表型数据的变异致病性预测。2.根据权利要求1所述的预测方法,其特征在于,所述步骤S3中模拟患者的遗传变异数据和相应的表型数据的随机抽取方法,包括如下步骤:S3-1:从来自非罕见病患者的群体变异中随机抽取W个阴性变异,插入来自训练集阳性变异中的1个已知致病变异,将W个阴性变异和1个阳性致病变异构成患者的模拟遗传变异数据;S3-2:从阳性致病变异所在基因的已知表型中随机抽取a个表型,然后随机抽取b个表型并进行...
【专利技术属性】
技术研发人员:李其刚,赵科研,马欣,
申请(专利权)人:成都奇恩生物科技有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。