异常微阵列特征的识别制造技术

技术编号:8131173 阅读:247 留言:0更新日期:2012-12-27 03:25
本发明专利技术涉及异常微阵列特征的识别。概括地,本发明专利技术公开了一种在核酸阵列中识别异常特征的方法,该方法包括:a)提供log变换的归一化值,所述log变换的归一化值表示测试样品对核酸阵列中的第一特征的杂交量;b)利用所述log变换的归一化值和表示对照样品对多个参比阵列中的相应特征的杂交量的参比log变换的归一化值的分布来计算所述第一特征的z得分;以及c)如果所述测试特征具有高于或低于规定的阈值的z得分,那么识别所述测试特征是异常的。

【技术实现步骤摘要】
异常微阵列特征的识别1U在阵列分析中,为了避免微阵列数据集合被不良品质的数据污染,识别和标记异常特征(即展现与众不同的统计学性质或形态性质的特征)是重要的。本公开涉及识别异常微阵列特征的方法。
技术实现思路
本文描述了一种识别核酸阵列中的异常特征的方法。概括地,本专利技术包括a)提供log变换的归一化值(log transformed normalized value),所述log变换的归一化值表示测试样品对核酸阵列中的第一特征的杂交量山)利用所述log变换的归一化值和表示对照样品对多个参比阵列中的同一特征的杂交量的参比log变换的归一化值的分布来计算所述第一特征的z得分;以及c)如果存在高于或低于规定的阈值的z得分,那么识别所述测试特征是异常的。 附图说明图I是表示本专利技术方法的一个实施方式的一些方面的流程图。图2是表示本专利技术方法的另一实施方式的一些方面的流程图。图3是高% CV载玻片(slide)上的八个阵列的z得分图。图4是载玻片252665211142的z得分图。图5是载玻片252665211142的二元标记图。图6表示在被标记为具有低z得分的各个阵列中各特征分数的柱图。定义本文中使用的术语“样品”是指,含有感兴趣的一个或多个核酸(DNA或RNA)分析物的原料或原料混合物,其通常是液体形式,但并非必然是液体形式。本文中使用的术语“以生物学方式衍生的样品”是指,由活细胞制成或衍生得到的核酸样品。由生物体的组织(例如活体解剖等)或细胞系(包括其冷冻或贮藏形式)制成的样品是以生物学方式衍生的样品的实例。本文中使用的术语“以非生物学方式衍生的样品”是指,由预定的合成方式制备的寡核苷酸组成的核酸样品。美国专利申请公开号US20060121491中描述了以非生物学方式衍生的样品的实例。本文中使用的术语“测试样品”是指,研究中的样品。本文中使用的术语“对照样品”是指,可与测试样品比较的样品。正如以下更详细描述地,相对于测试样品,对照样品可以是例如同一样品的不同等分试样;可以来自同一组织;或者来自同一细胞系。术语“核苷酸”意欲包括如下这些片段,这些片段不仅包含已知的嘌呤和嘧啶碱基,还包含已被修饰的其他杂环碱基的片段。所述修饰包括甲基化的嘌呤或嘧啶、酰基化的嘌呤或嘧啶、烷基化的核糖或其他杂环。另外,术语“核苷酸”还包括如下这些片段,这些片段包含半抗原或荧光标记,而且还可以包含常规核糖和脱氧核糖糖类,以及其他糖类。经修饰的核苷酸或核苷酸还包括,在糖片段上的修饰,例如在羟基基团中的一个或多个被卤原子或脂族基团替代时,被功能化成醚类、胺类等等。核苷酸可以包括,当被掺入核酸的伸展链中时能够继续伸展的那些(非链终止核苷酸)和抑制随后伸展的那些(例如链终止剂)。术语“核酸”和“聚核苷酸”在本文可互換使用,用于描述由诸如脱氧核糖核苷酸或核糖核苷酸的核苷酸构成的并且具有例如大于约2个碱基、大于约10个碱基、大于约100个碱基、大于约500个碱基、大于1000个碱基、直至约10000或更多个碱基的任意长度的聚合物,其可以通过酶促方式或合成方式(例如在美国专利号5,948,902以及其中引用的參考文献中所描述的PNA)生产,其可以序列特异性方式与天然核酸杂交(类似于两种天然核酸那样杂交),例如可以參与Watson-Crick碱基对相互作用。天然存在的核苷酸包括鸟嘌呤、胞核嘧啶、腺嘌呤、尿嘧啶和胸腺嘧啶(分别为G、C、A、U和T)。本文中使用的“寡核苷酸”表示,由约2至5000个核苷酸(例如2至200个核苷酸)构成的核苷酸的单链多聚体。寡核苷酸可以是合成的,或者可以以酶促方式制成,在一些实施方式中,其具有小于10至50个核苷酸的长度。寡核苷酸可以包含核糖核苷酸单体 (即可以是寡核糖核苷酸)或脱氧核糖核苷酸单体。寡核苷酸可以具有例如10至20个、11至30个、31至40个、41至50个、51至60个、61至70个、71至80个、80至100个、100至150个、或150至200个、直至500个或更多个核苷酸长度。本文中使用的术语“探针”是指,与感兴趣的核苷酸分析物互补的核酸。在某些情况中,目标分析物的探測需要探针对目标的杂交。在某些实施方式中,探针可以固定在底物的表面上,其中底物可以具有各种构造,例如片材结构、珠子结构或其他结构。在某些实施方式中,探针可以存在于平面底物的表面上,例如以阵列形式。“阵列”包括可设定地址的区域的任何ニ维或三维的排列,所述区域例如为带有核苷酸、特别带有寡核苷酸或其合成类似物等的可在空间上设定地址的区域或在可光学上设定地址的区域。在一些情况下,阵列的多个可设定地址的区域可以不是彼此物理相连的,例如多个彼此不同的珠子通过光学或其他装置可以构成阵列。在阵列是核酸阵列时,所述核酸可在沿着核酸链的任意一个或多个点上被吸附、被物理吸附、被化学吸附、或被共价连接到阵列上。阵列在原位制造的情况下可以利用液滴沉积由脉冲喷射前驱体单元(诸如核苷酸或氨基酸单体)制造,或者可以利用液滴沉积由脉冲喷射先前得到的核酸制造。例如在先前引用的參考文献(包括Caren等人的美国专利申请公开号20040203138和专利号US6, 242, 266,US 6,232,072、US6, 180, 35UUS 6, 171, 797,US 6,323,043,以及其中引用的參考文献)中详细描述了上述方法。正如已经提到过的,这些參考文献通过引用插入本文。也可以使用其他液滴沉积方法来进行制造,如本文先前所述。而且,可以使用照相平板印刷阵列制造方法替代液滴沉积方法。特征间区域不必存在,特别在阵列由那些专利中描述的照相平板印刷方法制成的时候。阵列还可以通过使与珠子(也被称为微球)连接的预先合成的核酸分布在固体支持物上来进行制造。在某些实施方式中,将独ー无ニ的光学信号(例如荧光染料)结合到珠子上,它们能用于识别在任意特定珠子上的化学官能性。因此,首先采用光学信号对珠子进行编码,所以阵列可以稍后进行解码,这样可以在阵列已经制成之后使单个位点在阵列中的位置与在特定位点的探针有相关性。例如在美国专利号6,355,431,7, 033,754和7,060, 431中详细描述了上述方法。阵列在具有多个不同片段(例如,不同的寡核苷酸序列)的区域时是“可设定地址的”,这样使得在阵列的特定预定位置(即“地址”)上的特征(即阵列的“单元”或“点”)包含特定序列。阵列特征通常通过居间间隔进行隔离,但这不是必要的。阵列还在阵列的每个特征具有能够识别存在于该特征上的片段的光学可探测信号的情况下是“可设定地址的”。阵列还在阵列的每个特征具有可通过非光学装置探测并且能够识别存在于该特征上的片段的信号的情况下是“可设定地址的”。本文中使用的术语“异常特征”是指,具有与众不同的统计学性质或形态性质的特征。异常特征可能由例如在例如阵列合成(例如不完善的偶联化学反应)、阵列储存、阵列处理、杂交或扫描期间发生的问题引起的。 正如以下更详细描述的,在某些案例中,不同阵列中的特征会被描述成彼此“相应”。例如,数据可由一个阵列的第一特征得到,也可由其他阵列的相应特征得到。在这些案例中,彼此相应的特征具有同一探针序列。同样地,如果一个阵列上的第一特征具有其他阵列上的相应特征,那么所述第一特征和所述相本文档来自技高网...
异常微阵列特征的识别

【技术保护点】
一种识别核酸阵列中的异常特征的方法,其包括:a)提供log变换的归一化值,所述log变换的归一化值表示测试样品对核酸阵列中的第一特征的杂交量;b)利用:i所述log变换的归一化值和ii表示对照样品对多个参比阵列中的相应特征的杂交量的参比log变换的归一化值的分布来计算所述第一特征的z得分;以及c)如果所述测试特征具有高于或低于规定的阈值的z得分,那么识别所述测试特征是异常的。

【技术特征摘要】
2011.06.03 US 13/152,6021.一种识别核酸阵列中的异常特征的方法,其包括 a)提供log变换的归ー化值,所述log变换的归ー化值表示测试样品对核酸阵列中的第一特征的杂交量; b)利用i所述log变换的归ー化值和ii表示对照样品对多个參比阵列中的相应特征的杂交量的參比log变换的归ー化值的分布来计算所述第一特征的z得分;以及 c)如果所述测试特征具有高于或低于规定的阈值的z得分,那么识别所述测试特征是异常的。2.权利要求I的方法,其中,所述z得分表示所述第一特征的所述log变换的归ー化值高于或低于所述參比log变换的归ー化值的均值或中值多少个标准偏差,其根据如下公式计算3.权利要求I的方法,其中,所述z得分表示所述第一特征的所述log变换的归ー化值高于或低于所述參比log变换的归ー化值的均值或中值多少个按比例缩放的四分间距(O. 74*IQR)。4.权利要求I的方法,其中,所述參比log变换的归ー化值通过...

【专利技术属性】
技术研发人员:保罗·肯尼斯·沃伯罗伯特·佩吉
申请(专利权)人:安捷伦科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1