【技术实现步骤摘要】
【国外来华专利技术】用于预测人类群体中的亲缘关系的系统和方法相关申请的交叉引用本申请要求2017年9月7日提交的美国临时专利申请No.62/555,597的利益;此申请的内容特此通过引用整体并入。另外,在2018年9月7日提交的标题为“SystemsandMethodsForLeveragingRelatednessInGenomicDataAnalysis”的共同待决申请也通过引用整体并入。
本公开大体上涉及人类群体中的亲缘关系的预测模型。更明确地说,本公开涉及用于制作人类群体中的亲缘关系模型以及识别用于从群体中选择个体子集以进行基因研究的模型的系统和方法。
技术介绍
人类疾病症状不仅由环境因素引起和受环境因素影响,而且还由基因因素引起和受基因因素影响。对人类群体中的基因变异的理解因此对于理解人类疾病的病因和进展以及对于识别用于治疗这些疾病的新颖药物标靶来说是重要的。由于大量健康护理数据的可用性,健康护理群体的基因研究在这方面尤其有用,所述健康护理数据简化了对基因变异如何促成人类身上的疾病症状的研究。在过去,此类研究通 ...
【技术保护点】
1.一种预测人类群体中的亲缘关系的方法,所述方法包括:/n建立第一群体数据集;/n针对指定年数执行预采样阶段以根据所述第一群体数据集建立第二群体数据集;以及/n对所述第二群体数据集执行模拟,包括以下一者或多者:/n(a)根据所述第二群体数据集中的个体的年龄将所述个体移至年龄池;/n(b)从所述第二群体数据集中的单身男性和单身女性中随机地选择亲缘关系比堂表亲要远的数对单身男性与单身女性并且按年龄参数让他们以指定婚姻结婚,其中选择数对直到结婚数目达到如由结婚率参数所指定的那样为止;/n(c)使已婚配偶按指定离婚率离婚,其中已婚配偶是从所述第二群体数据集中随机地选出并且一旦离婚之 ...
【技术特征摘要】
【国外来华专利技术】20170907 US 62/555,5971.一种预测人类群体中的亲缘关系的方法,所述方法包括:
建立第一群体数据集;
针对指定年数执行预采样阶段以根据所述第一群体数据集建立第二群体数据集;以及
对所述第二群体数据集执行模拟,包括以下一者或多者:
(a)根据所述第二群体数据集中的个体的年龄将所述个体移至年龄池;
(b)从所述第二群体数据集中的单身男性和单身女性中随机地选择亲缘关系比堂表亲要远的数对单身男性与单身女性并且按年龄参数让他们以指定婚姻结婚,其中选择数对直到结婚数目达到如由结婚率参数所指定的那样为止;
(c)使已婚配偶按指定离婚率离婚,其中已婚配偶是从所述第二群体数据集中随机地选出并且一旦离婚之后就标记为单身;
(d)按指定比率从所述第二群体数据集中随机地选择数对单身男性与单身女性或已婚配偶并且允许他们根据指定生育率来生育,直到达到成功怀孕的目标数目为止,其中双亲被限制为亲缘关系比堂表亲要远,并且其中所述第二群体数据集中的所有个体都被限制为每年生育一个孩子;
(e)允许所述第二群体数据集中的个体按照年龄参数按指定死亡率和按指定病死率去世;
(f)允许个体迁入和迁出所述第二群体数据集,由此维持所述第二群体数据集中的群体年龄和性别分布以及已婚育龄个体的比例;
(g)允许个体在所述第二群体数据集内移动,由此随机地选择来自子群体的个体并且如果存在另一个子群体则将所述个体随机地分配至另一个子群体,直到实现子群体之间的指定移动率为止;以及
(h)针对预定的年数以一年时间间隔来反复地重复(a)至(g)中的一者或多者,其中将(a)至(g)中的一者或多者应用于由先前反复产生的群体数据集以生成预测所述人类群体中的亲缘关系的最终群体数据集。
2.如权利要求1所述的方法,所述方法还包括基于所述最终群体数据集来选择所述人类群体以进行基因分析。
3.如权利要求2所述的方法,其中所述基因分析包括谱系重建、对复合杂合突变定相或检测新生突变。
4.如权利要求1所述的方法,其中所述人类群体包括多个人类群体,并且生成所述最终群体数据集包括针对所述多个人类群体中的每一者生成最终群体数据集,并且还包括基于所述最终群体数据集来选择所述多个人类群体中的一者以进行基因分析。
5.如权利要求1所述的方法,其中建立所述第一群体数据集还包括指定子群体的数目和大小。
6.如权利要求5所述的方法,其中建立所述第一群体数据集还包括将在零岁与最大生育年龄之间的年龄分配至所述第一群体数据集中的个体。
7.如权利要求5所述的方法,其中所述最大生育年龄是49岁。
8.如权利要求1至7中任一项所述的方法,其中执行所述预采样阶段还包括使所述第二群体数据集中的个体的出生数与死亡数保持相等并且使个体的净迁移率保持为零。
9.如权利要求8所述的方法,其中执行所述预采样阶段还包括:
在个体年龄超过最低生育年龄时,将所述第二群体数据集中的个体从少年池移至婚配池;
在个体年龄超过最大生育年龄时,将个体从所述婚配池移至老龄池;以及
如果来自所有年龄池的个体移民或去世,则移除所述个体。
10.如权利要求9所述的方法,其中所述最低生育年龄是15岁并且其中所述最大生育年龄是49岁。
11.使用如权利要求1至10中任一项所述的预测模型的方法,其中随机地执行对个体的确定。
12.使用如权利要求1至10中任一项所述的预测模型的方法,其中以集群方式执行对个体的确定。
13.如权利要求11或12所述的方法,其中对个体的确定还包括收集关于所确定的个体的亲缘关系数据和相关统计数据,所述亲缘关系数据和相关统计数据包括所确定的个体间的一级或二级关系或两者。
14.如权利要求1所述的方法,其中所述指定年数是120年。
15.一种用于预测人类群体中的亲缘关系的系统,所述系统包括:
数据处理器;存储器,所述存储器与所述数据处理器耦合;以及程序,所述程序存储在所述存储器中,所述程序包括能够由所述数据处理器执行的指令,其中所述程序:
建立第一群体数据集;
针对指定年数执行预采样阶段以根据所述第一群体数据集建立第二群体数据集;以及
对所述第二群体数据集执行模拟,包括以下一者或多者:
(a)根据所述第二群体数据集中的个体的年龄将所述个体移至年龄池;
(b)从所述第二群体数据集中的单身男性和单身女性中随机地选择亲缘关系比堂表亲要远的数对单身男性与单身女性并且按年龄参数让他们以指定婚姻结婚,其中选择数对直到结婚数目达到如由结婚率参数所指定的那样为止;
(c)使已婚配偶按指定离婚率离婚,其中已婚配偶是从所述第二群体数据集中随机地选出并且一旦离婚之后就标记为单身;
(d)按指定比率从所述第二群体数据集中随机地选择数对单身男性与单身女性或已婚配偶并且允许他们根据指定生育率来生育,直到达到成功怀孕的目标数目为止,其中双亲被限制为亲缘关系比堂表亲要远,并且其中所述第二群体数据集中的所有个体都被限制为每年生育一个孩子;
(e)允许所述第二群体数据集中的个体按照年龄参数按指定死亡率和按指定病死率去世;
(f)允许个体迁入和迁出所述第二群体数据集,由此维持所述第二群体数据集中的群体年龄和性别分布以及已婚育龄个体的比例;
(g)允许个体在所述第二群体数据集内移动,由此随机地选择来自子群体的个体并且如果存在另一个子群体则将所述个体随机地分配至另一个子群体,直到实现子群体之间的指定移动率为止;以及
(h)针对预定的年数以一年时间间隔来反复地重复(a)至(g)中的一者或多者,其中将(a)至(g)中的一者或多者应用于由先前反复产生的群体数据集以生成预测所述人类群体中的亲缘关系的最终群体数据集。
16.如权利要求15所述的系统,所述系统还包括基于所述最终群体数据集来选择所述人类群体以进行基因分析。
17.如权利要求16所述的系统,其中所述基因分析包括谱系重建、对复合杂合突变定相或检测新生突变。
18.如权利要求15所述的系统...
【专利技术属性】
技术研发人员:J·斯特普尔斯,L·哈贝格,J·里德,
申请(专利权)人:瑞泽恩制药公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。