用于推算靶变体的靶变体参考组制造技术

技术编号:43355176 阅读:27 留言:0更新日期:2024-11-19 17:41
本公开涉及用于生成包括具有靶变体指示的靶变体位置的靶变体参考组或者使用该靶变体参考组来推算该对应的靶变体的基因型检出的系统、非暂态计算机可读介质和方法。具体地,在一个或多个实施方案中,所公开的系统生成包括不同单倍型的多种定相基因组样本的初始参考组。所公开的系统还将靶变体位置添加到该初始参考组以指示靶变体的存在或不存在,从而创建包括具有靶变体指示的靶变体位置的靶变体参考组。附加地或另选地,所公开的系统可基于(i)在该靶变体参考组中表示的单倍型与(ii)对应于该靶基因组样本的核苷酸读段的比较,利用该靶变体参考组来推算指示靶基因组样本内靶变体的存在或不存在的基因型检出。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、近年来,生物技术公司和研究机构已改进用于对基因组样本进行核苷酸测序以及确定核碱基检出的硬件和软件。例如,一些现有的测序仪和测序数据分析软件(一起称为“现有的测序系统”)通过使用常规的桑格测序或边合成边测序(sbs)方法来预测序列内的各个核苷酸。当使用sbs时,现有的测序系统可监测从模板平行合成的数千个寡核苷酸,以基于掺入到寡核苷酸中的带荧光标签的核碱基的图像来预测培养的核苷酸读段的核碱基检出。在捕获此类图像之后,一些现有的测序系统确定对应于寡核苷酸的核苷酸读段的核碱基检出,并且将碱基检出数据发送到具有测序数据分析软件的计算设备。通过使用测序数据分析软件,现有的测序系统将核苷酸读段与参考基因组进行比对。基于比对的核苷酸读段与参考基因组之间的差异,现有的系统可进一步利用变体检出器来识别基因组样本的变体,诸如单核苷酸多态性(snp)、重复序列扩增变体或者插入或缺失(indel)。

2、尽管有这些进展,现有的测序系统经常针对难以检出的基因组区域确定不准确的变体检出,诸如具有可变数目串联重复序列(vntr)扩增、短串联重复序列(str)扩本文档来自技高网...

【技术保护点】

1.一种计算机实现的方法,所述计算机实现的方法包括:

2.根据权利要求1所述的计算机实现的方法,其中,所述至少一个靶变体位置包括双等位基因靶变体的靶变体指示的靶变体位置。

3.根据权利要求1所述的计算机实现的方法,其中,所述至少一个靶变体位置包括多等位基因靶变体的靶变体指示的多个靶变体位置。

4.根据权利要求1所述的计算机实现的方法,其中,对所述基因组样本的所述等位基因进行定相包括对所述基因组样本的子集的杂合等位基因进行定相。

5.根据权利要求1所述的计算机实现的方法,其中,所述标记变体包括单核苷酸多态性(SNP)。p>

6.根据权...

【技术特征摘要】
【国外来华专利技术】

1.一种计算机实现的方法,所述计算机实现的方法包括:

2.根据权利要求1所述的计算机实现的方法,其中,所述至少一个靶变体位置包括双等位基因靶变体的靶变体指示的靶变体位置。

3.根据权利要求1所述的计算机实现的方法,其中,所述至少一个靶变体位置包括多等位基因靶变体的靶变体指示的多个靶变体位置。

4.根据权利要求1所述的计算机实现的方法,其中,对所述基因组样本的所述等位基因进行定相包括对所述基因组样本的子集的杂合等位基因进行定相。

5.根据权利要求1所述的计算机实现的方法,其中,所述标记变体包括单核苷酸多态性(snp)。

6.根据权利要求1所述的计算机实现的方法,其中,生成所述参考组包括生成定相参考组,所述定相参考组包括根据所述基因组样本的所述母本单倍型和所述父本单倍型定相的标记变体的所述标记变体指示。

7.根据权利要求1所述的计算机实现的方法,其中,所述不同单倍型的基因组样本包括表现出遗传多样性的不同单倍型的基因组样本。

8.根据权利要求1所述的计算机实现的方法,其中,所述靶变体包括重复序列扩增。

9.根据权利要求1所述的计算机实现的方法,其中,所述靶变体包括在群体内传播的缺失、插入、重复、倒位、易位或拷贝数变异(cnv)。

10.根据权利要求1所述的计算机实现的方法,其中,所述靶变体包括复制因子c亚基1(rfc1)基因、细胞色素p450家族2亚家族d成员6(cyp2d6)基因、细胞色素p450家族2亚家族b成员6(cyp2b6)基因、细胞色素p450家族21亚家族a成员2(cyp21a2)基因、运动神经元存活1(smn1)基因、运动神经元存活2(smn2)基因、葡萄糖脑苷脂酶β(gba)基因、血型rh(ce)(rhce)基因、脂蛋白(a)(lpa)基因、脆性x智力障碍1(fmr1)基因、氨基己糖苷酶亚基α(hexa)基因、血红蛋白亚基α1(hba1)基因、血红蛋白亚基α2(hba2)基因或血红蛋白亚基β(hbb)基因的变体。

11.根据权利要求1所述的计算机实现的方法,其中,所述靶变体满足阈值携带率、关于特定标记变体的阈值连锁不平衡(ld)或阈值突变率中的一者或多者。

12.一种系统,所述系统包括:

13.根据权利要求12所述的系统,其中,所述靶变体指示指示在所述基因组样本的所述定相等位基因的所述至少一个靶变体位置中所述靶变体的存在或不存在。

14.根据权利要求12所述的系统,所述系统还包括指令,所述指令当由所述至少一个处理器执行时使得所述系统:

15.根据权利要求12所述的系统,所述系统还包括指令,所述指令当由所述至少一个处理器执行时使得所述系统通过生成所述靶基因组样本是...

【专利技术属性】
技术研发人员:D·安德鲁斯M·A·贝克里斯基M·A·埃贝勒J·G·马约尔
申请(专利权)人:因美纳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1