基于自然选择及数据库的遗传性罕见病患病率贝叶斯计算模型及其构建方法和应用技术

技术编号:31489808 阅读:15 留言:0更新日期:2021-12-18 12:26
本发明专利技术公开了一种基于自然选择及数据库的遗传性罕见病患病率贝叶斯计算模型的构建方法,包括如下步骤:步骤一、利用云端与本地数据构建病人和正常人群数据库;步骤二、基于自然选择理论的压力趋势,比较正常人群数据库,筛选病人数据库中的高外显致病突变;步骤三、利用步骤二筛选的高外显致病突变去构建贝叶斯模型的先验,步骤四、预测目标遗传性罕见病的患病率。采用本发明专利技术的构建方法构建获得的遗传性罕见病患病率贝叶斯计算模型可以用于国内罕见病患病率的预测,其结果准确可靠,具有良好的应用前景。良好的应用前景。

【技术实现步骤摘要】
基于自然选择及数据库的遗传性罕见病患病率贝叶斯计算模型及其构建方法和应用


[0001]本专利技术属于罕见病患病率预测
,具体地说,是关于一种基于自然选择及数据库的遗传性罕见病患病率贝叶斯计算模型及其构建方法和应用,是利用公开数据库及本地收集病人遗传信息去预测某一遗传性罕见病在某一特定人种或国家的患病率。

技术介绍

[0002]近年来国内外不断公开的遗传数据库为计算遗传疾病的患病率提供了一种新的可能。特别是遗传性罕见病的患病率,十几年前仅能根据大规模人口普查或者登记数据库的形式去预估患病率,而遗传数据库的出现为预测遗传性疾病提供了新的可能。
[0003]现有的技术通常定位于某一个遗传数据库内进行计算,利用数据库中突变的美国医学遗传学和基因组协会(the American College of Medical Genetics and Genomics,ACMG)评分(SCHRODI S J,DEBARBER A,HE M,等.Prevalence Estimation for Monogenic Autosomal Recessive Diseases Using Population

Based Genetic Data[J].Human Genetics,2015,134(6):659

669.DOI:10.1007/s00439

015

1551

8.)或者计算机预测的严重程度评分(LIU W,PAJUSALU S,LAKE N J,等.Estimating Prevalence for Limb

Girdle Muscular Dystrophy Based on Public Sequencing Databases:11[J].Genetics in Medicine,2019,21(11):2512

2520.DOI:10.1038/s41436

019

0544

8.)去筛选高外显率(或者高致病性)的致病突变,以此为基础构建贝叶斯模型的先验(prior),再去重新计算致病突变的人群分布后验(posterior),以求得遗传性罕见病的患病率。但是,现有的遗传性罕见病的患病率的计算方法存在如下问题:(1)现有技术采用的计算方案多是限于单一数据库(或基于某一人种遗传数据库),故所得结果具有人群特异性(如高加索人种占据绝大多数),缺乏对其他民族(如汉族)的外推性;(2)现有技术的数据来源全部来自公开数据库,缺乏本地临床资源的验证,而且没有很好利用病人数据库与正常人群数据库的可比性;(3)现有技术的致病突变来自ACMG评分或者计算机预测的严重程度评分。前者因不同数据库的质量水平不齐,造成不同数据库ACMG评分的矛盾,同时低质量的数据管理带来了ACMG评分致病性的假阳性。后者基于计算机预测,被证明在基因的内含子区域预测结果的不可靠,同时并不能很好的反映现实,不被建议作为致病突变判定的绝对依据。同时因为外显率的问题,及同一致病突变不一定在每个人身上都会发病(即致病突变外在地显示于病人身上),不同致病突变的外显率是不一致的。因此筛选那些高度外显(高致病性的)突变成为了难点。(4)现有技术贝叶斯模型采用的先验来源是基于某一大类遗传疾病整体,没有很好体现现代医学所倡导的精准性与针对性,预测结果缺乏准确性。

技术实现思路

[0004]本专利技术针对现有的遗传性罕见病的患病率的预测技术的准确性低的不足,提供了基于自然选择及数据库的遗传性罕见病患病率贝叶斯计算模型。该模型通过自然选择理论
在病人数据库与正常人群数据库的比较中筛选出高外显(高致病性)的致病突变,可以解决目前遗传性疾病贝叶患病率致病突变判定不准确的问题。
[0005]因此,本专利技术的第一个目的是提供一种基于自然选择及数据库的遗传性罕见病患病率贝叶斯计算模型。本专利技术的第二个目的是提供一种基于自然选择及数据库的遗传性罕见病患病率贝叶斯计算模型的构建方法。本专利技术的第三个目的是提供一种基于自然选择及数据库的遗传性罕见病患病率贝叶斯计算模型在非疾病诊断中预测遗传性罕见病患病率中的应用。
[0006]为实现上述目的,本专利技术采用如下技术方案:
[0007]作为本专利技术的第一个方面,一种基于自然选择及数据库的遗传性罕见病患病率贝叶斯计算模型的构建方法,包括如下步骤:
[0008]步骤一、利用云端与本地数据构建病人和正常人群数据库;
[0009]步骤二、基于自然选择理论的压力趋势,比较正常人群数据库,筛选病人数据库中的高外显致病突变;
[0010]步骤三、利用步骤二筛选的高外显致病突变去构建贝叶斯模型的先验,
[0011]步骤四、预测目标遗传性罕见病的患病率,包括:
[0012]1)获得目标遗传性罕见病突变的人群携带率;
[0013]2)将人群携带率代入贝叶斯模型的先验;
[0014]3)依据中心极限定理,并用含有1自由度的非中心卡方分布模拟计算预测目标遗传性罕见病的患病率。
[0015]根据本专利技术,所述自然选择理论的压力趋势为:高外显致病突变>低外显致病突变>所有突变>正常突变。
[0016]根据本专利技术,步骤二的筛选病人数据库中的高外显致病突变,包括如下步骤:
[0017]A、先从病人数据库中筛选出具有从LGMDR2患者身上发现的突变;
[0018]B、设立高外显致病突变人群携带率的上限0.01;
[0019]C、以病人数据库中ACMG评分为明确致病性的突变报告次数的95%可信区间设立报告次数下限,高外显致病突变的报告次数大于低外显致病突变在病人数据库的报告次数;
[0020]D、依据病人数据库中的ACMG评分,排除已经明确为不致病或有矛盾的突变。
[0021]根据本专利技术,贝叶斯模型的先验公式如下:
[0022][0023]其中,P(q)是某一遗传性罕见病高外显致病突变的携带率分布——先验,P(θ|q)是目标人群gnomAD和ChinaMAP的高外显致病突变的携带率分布,P(q|θ)即为所求的目标人群高外显致病突变的携带率实际分布——后验,经计算机模拟获得α和β。
[0024]根据本专利技术,所述预测目标遗传性罕见病的患病率,包括如下步骤:
[0025]1)获得目标遗传性罕见病突变的人群携带率:
[0026][0027]其中,x
i,i∈E
为所述目标遗传性罕见病突变在人群E中被检测出突变的染色体数
量,E表示含有不同人群的数量;n表示检测人数;
[0028]2)x
i,i∈E
符合二项分布x
i,i∈E
~Binomial(2n
i,i∈E
,q
i,i∈E
)|,将公式2的q
i,i本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自然选择及数据库的遗传性罕见病患病率贝叶斯计算模型的构建方法,其特征在于,包括如下步骤:步骤一、利用云端与本地数据构建病人和正常人群数据库;步骤二、基于自然选择理论的压力趋势,比较正常人群数据库,筛选病人数据库中的高外显致病突变;步骤三、利用步骤二筛选的高外显致病突变去构建贝叶斯模型的先验,步骤四、预测目标遗传性罕见病的患病率,包括:1)获得目标遗传性罕见病突变的人群携带率;2)将人群携带率代入贝叶斯模型的先验;3)依据中心极限定理,并用含有1自由度的非中心卡方分布模拟计算预测目标遗传性罕见病的患病率。2.如权利要求1所述的构建方法,其特征在于,所述自然选择理论的压力趋势为:高外显致病突变>低外显致病突变>所有突变>正常突变。3.如权利要求1所述的构建方法,其特征在于,步骤二的筛选病人数据库中的高外显致病突变,包括如下步骤:A、先从病人数据库中筛选出具有从LGMDR2患者身上发现的突变;B、设立高外显致病突变人群携带率的上限0.01;C、以病人数据库中ACMG评分为明确致病性的突变报告次数的95%可信区间设立报告次数下限,高外显致病突变的报告次数大于低外显致病突变在病人数据库的报告次数;D、依据病人数据库中的ACMG评分,排除已经明确为不致病或有矛盾的突变。4.如权利要求1所述的构建方法,其特征在于,贝叶斯模型的先验如下:其中,P(q)是某一遗传性罕见病高外显致病突变的携带率分布——先验,P(θ|q)是目标人群gnomAD和ChinaMAP的高外显致病突变的携带率分布,P(q|θ)即为所求的目标人群高外显致病突变的携带率实际分布——后验,经计算机模拟获得α和β。5.如权利要求1所述的构建方法,其特征在于,所述预测目...

【专利技术属性】
技术研发人员:衷画画罗苏珊赵重波卢家红朱雯华奚剑英林洁窦同海
申请(专利权)人:上海昂朴生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1