用于检测染色体获得和丢失的系统和方法技术方案

技术编号:10781274 阅读:65 留言:0更新日期:2014-12-17 02:11
本发明专利技术描述了一种修改的主成分分析技术,其用于分析相对小的数据组以用于检测染色体非整倍性和/或微缺失。不同于用于微阵列研究的分析技术,本发明专利技术技术使用并不涉及执行协方差分析的修改的主成分分析。本文中所述的方法、系统和设备在用于检测染色体非整倍性和/或微缺失的测试中允许明显减少数据噪声,产生更少的非决定性结果。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】本专利技术描述了一种修改的主成分分析技术,其用于分析相对小的数据组以用于检测染色体非整倍性和/或微缺失。不同于用于微阵列研究的分析技术,本专利技术技术使用并不涉及执行协方差分析的修改的主成分分析。本文中所述的方法、系统和设备在用于检测染色体非整倍性和/或微缺失的测试中允许明显减少数据噪声,产生更少的非决定性结果。【专利说明】 相关申请案 本专利技术要求了题为"(Systems and Methods for Detection of Chromosomal Gains and Losses) " 且 2012 年 1 月 20 日提交 的美国临时专利61/589, 150的优先权,所述专利的内容以全文引用的方式并入。
技术介绍
检测基因异常(例如染色体非整倍性和微缺失)的能力具有广泛的医学应用,包 括产前测试和癌症诊断。在样品中确定遗传异常的存在需要分析所检测的信号,例如荧光 信号。所述信号通常受噪声影响。因此,当处理信号数据以确定患者样品中存在或不存在 遗传异常时,需要使用减少噪声的数据分析方法。现有统计方法用于分析从基因检测分析 获得的数据。然而,现有统计方法通常不能充分地减少数据组中的噪声,产生非决定性、假 阳性和/或假阴性结果。 微阵列实验目前用于基因测试。在微阵列实验中,在许多病况中测量数千基因的 表达。需要统计方法以在多维矩阵中确定基因与病况之间的关系,由此降低数据的复杂性 且允许区分指示遗传异常的样品和正常样品的能力。所用的一种这类统计方法是主成分分 析(PCA),其利用在因子之间执行协方差分析来减少数据维度。这完全适用于多维中的数据 组,如微阵列实验。 已发展了微阵列实验的替代方案,从而为最常见的染色体异常提供更简单、 更集中的基因测试。举例来说,组成性BoBs?为由马萨诸塞州沃尔瑟姆(Waltham, Massachusetts)的拍金埃尔默公司(PerkinElmer)提供的分析,其实施BACs-on-Beads?技 术。BACs为细菌人工染色体,其为通常约170, 000个碱基长的人类DNA的较大克隆序列。 这一特定分析被设计成在九个充分表征的产前DNA目标区域中检测五种最常见非整倍性 和获得和丢失。所述分析可在直接提取自羊膜水或绒毛膜绒毛样品的少到50ng基因组DNA 上执行。 这种更简单、更集中的基因测试中的数据组比微阵列实验中小的多。举例来说,组 成性BoBs?分析从每个患者样品孔少于100个小珠(一式两份运行)获得信号,以检测14 种不同的染色体异常以及性别。执行协方差分析的主成分分析(PCA)技术将由于小尺寸的 数据组而不合适。 可针对所述小数据组使用数据分析的"比率法"。然而,已发现所述方法并不充分 地减少噪声,产生更多的非决定性结果。因此,需要更精确和有效的方法来分析基因分析中 获得的数据。尤其,需要一种减少数据组中的噪声的方法,使得可精确地确定染色体异常的 存在。
技术实现思路
本文中描述了一种修改的主成分分析技术,其用于分析相对小的数据组以用于检 测染色体非整倍性和/或微缺失。举例来说,尽管组成性BoBs?分析从每个患者样品孔少 于100个小珠获得信号,但已发现通过针对并不涉及执行协方差分析的数据分析实施修改 的主成分分析技术,有可能在所述测试中显著减少噪声,产生更少的非决定性结果。 如本文中更详细地论述,认为这一改进部分归因于用于检测较大、充分表征的目 标DNA区域中的特定非整倍性和获得和丢失的测试的性质,其中所述目标区域的长度例如 在约20到300千碱基范围内,且每一个别连接的扩增子包含与模板DNA序列的随机部分相 同的DNA序列,其长度例如在约500到1200个核苷酸范围内(包括端值)。 在一个方面中,本专利技术是针对一种用于自动分析来自用于检测染色体非整倍性和 /或微缺失的编码小珠多重分析的数据的方法,所述方法包含以下步骤:(a)提供或接收一 组对应于多个并行运行的患者样品的编码小珠多重分析的扣除背景的数据,其中所述数据 代表从对应于第一到第η个患者样品中的每一者的多个染色体目标中的每一者的小珠检 测的信号,其中所述染色体目标针对染色体非整倍性和/或微缺失的所述检测加以选择; (b)在步骤(a)之后,使用从所述相应第一到第η个患者样品的小珠检测的信号的中位值归 一化来自步骤(a)的所述第一到第η个患者样品中的每一者的所述扣除背景的数据,由此 产生数据;(c)在步骤(b)之后,针对对应于每一染色体目标的所述归一化数据,确定主成 分,且针对每一主成分,使用来自步骤(b)的所述归一化数据确定相应平行成分和正交成 分;(d)在步骤(c)之后,针对第一到第η个患者样品中的每一者且针对每一染色体目标, 使用步骤(c)中确定的相应平行成分,鉴定与指示来自正常样品的信号的阈值的偏差;以 及(e)在步骤(d)之后,针对第一到第η个患者样品中的每一者且针对每一染色体目标,使 用步骤(c)中确定的相应正交成分,鉴定指示样品制备质量的至少一个质量参数。在某些 实施例中,所述方法进一步包含步骤(f):基于步骤(d)中确定的偏差和步骤(e)中确定的 质量参数,确定第一到第η个患者样品中的任何一或多者的一或多个染色体非整倍性和/ 或微缺失。所述方法可进一步包含从编码小珠多重分析获得数据的步骤。 在某些实施例中,步骤(a)中的扣除背景的数据代表从对应于染色体目标中的每 一者的2到10个编码小珠类型检测的信号。在某些实施例中,步骤(a)中的扣除背景的数 据代表从对应于染色体目标中的每一者的至少2个或至少4个编码小珠类型检测的信号。 在某些实施例中,步骤(a)中的扣除背景的数据代表从对应于染色体目标中的每一者的在 4与7个之间(包括端值)的编码小珠类型检测的信号。 在某些实施例中,步骤(a)中的扣除背景的数据代表从对应于用于检测染色体非 整倍性和/或微缺失的至少3个染色体目标中的每一者的编码小珠检测的信号。在某些实 施例中,步骤(a)中的扣除背景的数据代表从对应于用于检测染色体非整倍性和/或微缺 失的3到100个(例如3到50个或5到25个)染色体目标中的每一者的编码小珠检测的 信号。 在某些实施例中,步骤(a)中的扣除背景的数据代表从每一患者样品的总共10到 1000个编码小珠检测的信号,不包括任选的重复。在某些实施例中,针对每一小珠获得多个 信号,且针对小珠获得中位值信号。 在某些实施例中,步骤(a)中的扣除背景的数据代表从至少5个患者样品中的每 一者的小珠检测的信号。在某些实施例中,存在5到500个患者样品(例如5到300个,或 5至IJ 100个,或10到50个)。 在某些实施例中,并行运行的多个样品在单一微板上运行以用于信号检测。举例 来说,微板可为96孔微板。 在某些实施例中,染色体目标针对一或多个染色体非整倍性的检测加以选择,其 中所述一或多个染色体非整倍性包含至少一个三体性。在某些实施例中,染色体目标针对 一或多个微缺失的检测加以选择,所述微缺失各自具有在20到300千碱基范围内的长度。 在某些实施例中,步骤(b)包含使用从相应第一到第η个患者样品的小珠检测的 信号的中位值且使用来自多个并行运行本文档来自技高网
...

【技术保护点】
一种用于自动分析来自用于检测染色体非整倍性和/或微缺失的编码小珠多重分析的数据的方法,所述方法包含以下步骤:(a)提供或接收一组对应于多个并行运行的患者样品的编码小珠多重分析的扣除背景的数据,其中所述数据代表从对应于第一到第n个患者样品中的每一者的多个染色体目标中的每一者的小珠检测的信号,其中所述染色体目标经选择以用于染色体非整倍性和/或微缺失的所述检测;(b)在步骤(a)之后,通过计算装置的处理器,使用从所述相应第一到第n个患者样品的小珠检测的信号的中位值归一化来自步骤(a)的所述第一到第n个患者样品中的每一者的所述扣除背景的数据,由此产生归一化数据;(c)在步骤(b)之后,针对对应于每一染色体目标的所述归一化数据,通过所述处理器确定主成分,且针对每一主成分,通过所述处理器,使用来自步骤(b)的所述归一化数据确定相应平行成分和正交成分;(d)在步骤(c)之后,针对所述第一到第n个患者样品中的每一者且针对每一染色体目标,使用步骤(c)中确定的所述相应平行成分,鉴定与指示来自正常样品的信号的阈值的偏差;以及(e)在步骤(d)之后,针对所述第一到第n个患者样品中的每一者且针对每一染色体目标,使用步骤(c)中确定的所述相应正交成分,鉴定指示样品制备质量的至少一个质量参数。...

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:考珀·帕洛
申请(专利权)人:珀金埃尔默细胞科技德国公司
类型:发明
国别省市:爱沙尼亚;EE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1