System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 预测遗传祖先的系统、方法和装置制造方法及图纸_技高网
当前位置: 首页 > 专利查询>玛氏公司专利>正文

预测遗传祖先的系统、方法和装置制造方法及图纸

技术编号:40924832 阅读:2 留言:0更新日期:2024-04-18 14:48
在一个实施例中,方法包括获取与第一动物相关联的遗传物质样本,其中该遗传物质样本包含原始基因型,基于原始基因型生成定相单倍型,基于定相单倍型与包含与参考种群相关联的参考单倍型的参考组之间的比较,通过机器学习算法为定向单倍型生成遗传种群的局部分配,并且向用户设备发送用于向用户呈现与第一动物相关联的输出的指令,其中该输出是基于遗传种群的局部分配而生成的。

【技术实现步骤摘要】
【国外来华专利技术】

本公开中描述的实施例涉及用于基于输入的dna序列预测动物的遗传祖先的系统和方法。


技术介绍

1、目前的动物遗传图谱绘制方法无法准确有效地评估混合基因组样本。现有方法无法有效处理大量的查询序列,也无法准确提供某些所提供样本的来源。因此,目前对宠物(和其他家养动物)基因组的分析,无论是单源样本还是混血样本,均无法达到令人满意的准确度,导致计算能力的浪费和不准确的结果。宠物基因组的复杂性还因品种混杂而可能产生的复杂遗传图谱而进一步复杂化。鉴于下游遗传图谱的复杂性不断增加,以及种群基因组数据集的规模和复杂性不断增加,需要既能够有效预测给定基因组样本的局部和全局遗传祖先、同时又保持极高的准确性且不产生大量计算成本的系统和方法。

2、关于疾病发展的遗传风险因素以及临床和兽医建议的信息有助于对动物进行最佳管理、监测和治疗。识别祖先贡献有助于确定这些风险因素。因此,需要准确有效地识别祖先贡献的方法和系统。


技术实现思路

1、所公开主题的目的和优点将在以下描述中阐明,并在以下描述中显而易见,也将从所公开主题的实践中了解到。所公开主题的附加优点将通过其书面说明书和权利要求中特别指出的方法和系统以及附图实现和获得。

2、为了实现这些和其他优点,并根据所公开主题的目的,如所具现和广泛描述的,所公开的主题呈现了可用于收集、接收和/或分析数据的系统、方法和装置。例如,某些非限制性实施例可用于预测动物的遗传祖先。

3、在某些非限制性实施例中,本公开描述了一种计算和统计方法的系统,用于仅根据伴侣动物的原始dna序列产生其遗传祖先和身体性状的预测。该预测系统可以利用来自具有已知遗传祖先和性状的动物的大型参考组的信息,为基因组中的小片段准确分配遗传祖先。然后,所得的片段分类可以按每只动物进行汇集,并用于预测个体动物是否属于数百个预定义的纯种或混血类别中的一个。此外,汇集的遗传祖先分类可用于准确预测身体性状,例如动物的成年体重。

4、在某些非限制性实施例中,一个或多个计算系统可以获取与第一动物相关联的遗传物质样本。遗传物质样本可以包含一种或多种原始基因型。然后,计算系统可以基于一种或多种原始基因型生成一种或多种定相单倍型。然后,计算系统可以通过一种或多种机器学习算法,基于一种或多种定相单倍型与参考组(包含与多个参考种群相关联的多种参考单倍型)之间的比较,为一种或多种定相单倍型生成一个或多个遗传种群的一个或多个局部分配。计算系统还可以向用户设备发送用于向用户呈现与第一动物相关联的输出的指令。在一些实施例中,可以基于一个或多个遗传种群的一个或多个局部分配生成输出。

5、在某些非限制性实施例中,包含软件的一个或多个计算机可读非暂时性存储介质在被执行时可操作以获取与第一动物相关联的遗传物质样本。遗传物质样本可以包含一种或多种原始基因型。该包含软件的计算机可读非暂时性存储介质在被执行时还可操作以基于一种或多种原始基因型生成一种或多种定相单倍型。该包含软件的计算机可读非暂时性存储介质在被执行时还可操作以通过一种或多种机器学习算法,基于一种或多种定相单倍型与参考组(包含与多个参考种群相关联的多种参考单倍型)之间的比较,为一种或多种定相单倍型生成一个或多个遗传种群的一个或多个局部分配。该包含软件的计算机可读非暂时性存储介质在被执行时还可操作以向用户设备发送用于向用户呈现与第一动物相关联的输出的指令。在一些实施例中,可以基于一个或多个遗传种群的一个或多个局部分配来生成输出。

6、在某些非限制性实施例中,系统可以包括一个或多个处理器以及耦合到处理器的非暂时性存储器,该非暂时性存储器包括可由处理器执行的指令。该处理器在执行指令时可操作以获取与第一动物相关联的遗传物质样本。遗传物质样本可以包含一种或多种原始基因型。该处理器在执行指令时还可操作以基于一种或多种原始基因型生成一种或多种定相单倍型。该处理器在执行指令时还可操作以通过一种或多种机器学习算法,基于一种或多种定相单倍型与参考组(包含与多个参考种群相关联的多种参考单倍型)之间的比较,为一种或多种定相单倍型生成一个或多个遗传种群的一个或多个局部分配。该处理器在执行指令时还可操作以向用户设备发送用于向用户呈现与第一动物相关联的输出的指令。在一些实施例中,可以基于一个或多个遗传种群的一个或多个局部分配来生成输出。

7、此外,所公开的方法、计算机可读非暂时性存储介质和系统的实施例可以具有如下所述的其他非限制性特征。

8、在某些非限制性实施例中,该计算系统还可以基于一种或多种原始基因型生成一种或多种共有基因型。然后,该计算系统可以基于一种或多种原始基因型和一种或多种共有基因型,生成一种或多种定相单倍型。在一些实施例中,该生成可以包括将一种或多种原始基因型和一种或多种共有基因型定相到母本染色体和父本染色体中。在一个特征中,一种或多种机器学习算法可以包括位置burrows-wheeler变换算法。

9、在某些非限制性实施例中,该计算系统可以基于一种或多种机器学习算法,去除与一个或多个遗传种群的一个或多个局部分配相关联的一个或多个错误。在一个特征中,一种或多种机器学习算法可以包括隐马尔可夫(markov)模型。

10、在某些非限制性实施例中,该计算系统可以基于一个或多个遗传种群的一个或多个局部分配进一步确定与第一动物相关联的一个或多个源种群。在一些实施例中,确定一个或多个源种群可以包括在母本染色体和父本染色体两者上汇集一个或多个遗传种群的一个或多个局部分配,基于汇集计算与一个或多个源种群相关联的比例,以及基于计算的比例确定一个或多个源种群。

11、在某些非限制性实施例中,该计算系统还可以将一个或多个遗传种群的一个或多个局部分配划分为母系遗传组或父系遗传组中的一个或多个。该划分可以基于一种或多种聚类算法。

12、在某些非限制性实施例中,该计算系统可以基于一个或多个遗传种群的一个或多个局部分配和一个或多个源种群,进一步确定与第一动物相关联的一个或多个遗传性状。在一些实施例中,确定一个或多个遗传性状可以进一步基于大效应变体的基因型、全基因组统计、基因组主成分分析(pca)投影、dna甲基化图谱或多基因风险评分中的一项或多项。在一些实施例中,一个或多个遗传性状包括以下一项或多项:成年体重范围、遗传疾病的风险预测或素因(predisposition)、营养建议、行为和性情类别预测、寿命估计、以年为单位的全因死亡率预测、预测的药理学反应、或者以小时为单位的可注射麻醉剂恢复时间范围。

13、在某些非限制性实施例中,该计算系统可以基于添加到参考组的一个或多个新参考样本,进一步更新一种或多种机器学习算法。在一些实施例中,该更新可以包括对参考组中的所有样本应用交叉验证,基于通过检测算法与交叉验证相关联的结果识别一个或多个异常值,以及从参考组中去除所识别的异常值。在一些实施例中,该更新还可以包括为参考组中的一个或多个未标记样本生成一个或多个标签,其中该更新基于生成的标签。可以反复迭代该更新,直至达到一本文档来自技高网...

【技术保护点】

1.一种方法,其包括,通过一个或多个计算系统:

2.根据权利要求1所述的方法,其还包括:

3.根据权利要求1或权利要求2所述的方法,其中,确定所述一个或多个源种群包括:

4.根据权利要求1至3中任一项所述的方法,其还包括:

5.根据权利要求4所述的方法,其中,所述划分基于一种或多种聚类算法。

6.根据权利要求1至5中任一项所述的方法,其还包括:

7.根据权利要求6所述的方法,其中,确定所述一个或多个遗传性状进一步基于大效应变体的基因型、全基因组统计、基因组主成分分析(PCA)投影、DNA甲基化图谱或多基因风险评分中的一项或多项。

8.根据权利要求6或权利要求7所述的方法,其中,所述一个或多个遗传性状包括以下一项或多项:

9.根据权利要求1至8中任一项所述的方法,其还包括:

10.根据权利要求9所述的方法,其中,所述更新包括:

11.根据权利要求9或权利要求10所述的方法,其中,重复迭代所述更新,直至达到所述一种或多种机器学习算法的预定准确度水平。

12.根据权利要求9至11中任一项所述的方法,其中,所述更新还包括:

13.根据权利要求1至12中任一项所述的方法,其还包括:

14.根据权利要求1至13中任一项所述的方法,其中,所述一种或多种机器学习算法包括位置Burrows-Wheeler变换算法。

15.根据权利要求1至14中任一项所述的方法,其还包括:

16.根据权利要求1至15中任一项所述的方法,其中,所述一种或多种机器学习算法包括隐马尔可夫模型。

17.一种用于使用权利要求1至16中任一项所述的方法确定动物的局部祖先和全局祖先的试剂盒,其中,所述试剂盒包括样本收集装置。

18.根据权利要求17所述的试剂盒,其中,所述样本收集装置包括载体和储存器。

19.根据权利要求18所述的试剂盒,其中,所述载体包括吸附部件并且其中所述储存器包括护罩。

20.根据权利要求17-19中任一项所述的试剂盒,其还包括关于如何使用所述样本收集装置和/或如何收集样本的书面说明书。

21.一个或多个包含软件的计算机可读非暂时性存储介质,所述软件在被执行时可操作用于:

22.根据权利要求21所述的介质,其中,所述软件在被执行时还可操作用于:

23.根据权利要求21或权利要求22所述的介质,其中,确定所述一个或多个源种群包括:

24.根据权利要求21至23中任一项所述的介质,其中,所述软件在被执行时还可操作用于:

25.根据权利要求24所述的介质,其中,所述划分基于一种或多种聚类算法。

26.根据权利要求21至25中任一项所述的介质,其中,所述软件在被执行时还可操作用于:

27.根据权利要求26所述的介质,其中,确定所述一个或多个遗传性状进一步基于大效应变体的基因型、全基因组统计、基因组主成分分析(PCA)投影、DNA甲基化图谱或多基因风险评分中的一项或多项。

28.根据权利要求26或权利要求27所述的介质,其中,所述一个或多个遗传性状包括以下一项或多项:

29.根据权利要求21至28中任一项所述的介质,其中,所述软件在被执行时还可操作用于:

30.根据权利要求29所述的方法,其中,所述更新包括:

31.根据权利要求29或权利要求30所述的介质,其中,重复迭代所述更新,直至达到所述一种或多种机器学习算法的预定准确度水平。

32.根据权利要求29至31中任一项所述的介质,其中所述更新还包括:

33.根据权利要求21至32中任一项所述的介质,其中,所述软件在被执行时还可操作用于:

34.根据权利要求21至33中任一项所述的介质,其中,所述一种或多种机器学习算法包括位置Burrows-Wheeler变换算法。

35.根据权利要求21至34中任一项所述的介质,其中,所述软件在被执行时还可操作用于:

36.根据权利要求21至35中任一项所述的介质,其中,所述一种或多种机器学习算法包括隐马尔可夫模型。

37.一种系统,其包括:一个或多个处理器;以及耦合到所述处理器的非暂时性存储器,所述非暂时性存储器包括能够由所述处理器执行的指令,所述处理器在执行所述指令时可操作用于:

38.根据权利要求37所述的系统,其中,所述处理器在执行所述指令时还可操作用于:

39.根据权利要求37或权利要求38所述的系统,其中,确定所述...

【技术特征摘要】
【国外来华专利技术】

1.一种方法,其包括,通过一个或多个计算系统:

2.根据权利要求1所述的方法,其还包括:

3.根据权利要求1或权利要求2所述的方法,其中,确定所述一个或多个源种群包括:

4.根据权利要求1至3中任一项所述的方法,其还包括:

5.根据权利要求4所述的方法,其中,所述划分基于一种或多种聚类算法。

6.根据权利要求1至5中任一项所述的方法,其还包括:

7.根据权利要求6所述的方法,其中,确定所述一个或多个遗传性状进一步基于大效应变体的基因型、全基因组统计、基因组主成分分析(pca)投影、dna甲基化图谱或多基因风险评分中的一项或多项。

8.根据权利要求6或权利要求7所述的方法,其中,所述一个或多个遗传性状包括以下一项或多项:

9.根据权利要求1至8中任一项所述的方法,其还包括:

10.根据权利要求9所述的方法,其中,所述更新包括:

11.根据权利要求9或权利要求10所述的方法,其中,重复迭代所述更新,直至达到所述一种或多种机器学习算法的预定准确度水平。

12.根据权利要求9至11中任一项所述的方法,其中,所述更新还包括:

13.根据权利要求1至12中任一项所述的方法,其还包括:

14.根据权利要求1至13中任一项所述的方法,其中,所述一种或多种机器学习算法包括位置burrows-wheeler变换算法。

15.根据权利要求1至14中任一项所述的方法,其还包括:

16.根据权利要求1至15中任一项所述的方法,其中,所述一种或多种机器学习算法包括隐马尔可夫模型。

17.一种用于使用权利要求1至16中任一项所述的方法确定动物的局部祖先和全局祖先的试剂盒,其中,所述试剂盒包括样本收集装置。

18.根据权利要求17所述的试剂盒,其中,所述样本收集装置包括载体和储存器。

19.根据权利要求18所述的试剂盒,其中,所述载体包括吸附部件并且其中所述储存器包括护罩。

20.根据权利要求17-19中任一项所述的试剂盒,其还包括关于如何使用所述样本收集装置和/或如何收集样本的书面说明书。

21.一个或多个包含软件的计算机可读非暂时性存储介质,所述软件在被执行时可操作用于:

22.根据权利要求21所述的介质,其中,所述软件在被执行时还可操作用于:

23.根据权利要求21或权利要求22所述的介质,其中,确定所述一个或多个源种群包括:

24.根据权利要求21至23中任一项所述的介质,其中,所述软件在被执行时还可操作用于:

25.根据权利要求24所述的介质,其中,所述划分基于一种或多种聚类算法。

26.根据权利要求21至25中任一项所述的介质,其中,所述软件在被执行时还可操作用于:

27.根据权利要求26所述的介质,其中,确定所述一个或多个遗传性状进一步基于大效应变体的基因型、全基因组统计、基因组主成分分析(pca)投影、dna甲基化图谱或多基因风险评分中的一项或多项。

28.根据权利要求26或权利要求27所述的...

【专利技术属性】
技术研发人员:D·加里根J·胡夫R·乔德罗夫·福兰
申请(专利权)人:玛氏公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1