设计寡核苷酸阵列的方法技术

技术编号:4966015 阅读:150 留言:0更新日期:2012-04-11 18:40
提供了一种方法,该方法允许酶的自动选择用于诸如甲基化概况分析、芯片上的芯片和比较基因组杂交实验的方案中。该方法也使给定实验的微阵列上的空间最大化。这意味着来自微阵列的结果得到了改进。该方法也改进了微阵列上的有意义图样的zero-in和焦距。这增强了区分两个分开的样品类,如肿瘤与正常、恶性与非恶性、男性与女性样品等的能力。此外,也提供了计算机可读介质和装置。

【技术实现步骤摘要】
【国外来华专利技术】专利
本专利技术一般涉及寡核苷酸阵列验证领域。更具体地,本专利技术涉及方法,更具体涉及 计算机可读介质。
技术介绍
寡核苷酸阵列是一种芯片,其中以特定模式固定了大量寡核苷酸序列如DNA序 列。根据希望研究何种机理,可以设计不同的寡核苷酸阵列。例如,可以用称作甲基化 寡核苷酸微阵列分析(MOMA)的一种特定类型的微阵列来研究的DNA甲基化是基因调节的 最充分研究的外遗传机理。已知存在于启动子区中的所谓富含CpG的区域的DNA甲基化可 以作为基因沉默的机理。CpG岛是基因组的富含核苷酸C和G的部分。本领域技术人员公知的用于实验发现差别甲基化的方法包括差别甲基化杂交、甲 基化特异性测序、HELP测定、亚硫酸氢盐测序、CpG岛阵列等。但是,存在更多的应用,它们可以用基因组表示法来查询基因组,以发现例如 DNA-蛋白相互作用、基因拷贝数多态性、差别甲基化基因座等等。当在阵列上进行分析时,总是存在选择哪些序列放置在阵列上的问题。优选尽可 能多,但即使采用高密度阵列,也没有最够的空间。现今的标准Agilent阵列含有M4,000 个探针,Nimblegen阵列涵盖395,000个探针。在Nimblegen上(其中探针长度是50个碱 基),存在20,000, 000个基因组序列。与人类基因组中的3,000, 000, 000个碱基相比,很明 显,必须选择哪些序列要优先放置于阵列上。选择要被阵列涵盖的序列的常规途径是通过 根据经验的猜测(educated guesses)或试验和误差。因此,用于设计阵列的改进的方法将是有利的,特别是,用于设计以下阵列的方法 将是有利的该阵列允许增加的灵活性、成本效益和/或验证设计的阵列的可能性。专利技术概述因此,本专利技术优选寻求通过提供所附专利权利要求的装置、方法、计算机可读介质 和数据库而单独或以任意组合减轻、缓解或消除一种或多种上文确定的本领域中的缺陷和 不利并且至少解决上文提到的问题。本专利技术的一个目的是提供设计和验证寡核苷酸阵列的方法。根据本专利技术的一个方面,提供了一种方法,根据该方法,将关于基因组注释和需要 的序列的信息存储在第一数据库中。然后,通过在存储于第一数据库中的信息上应用第二 数据库,构建查询序列(querysequence)的表示矩阵(representation matrix)。第二数据 库可以包含关于限制酶的信息。随后,从查询序列的表示矩阵构建限制酶列表和用于概况 分析的序列列表。最后,从序列列表设计寡核苷酸阵列。根据本专利技术的另一方面,公开了上述方法在设计用于验证寡核苷酸阵列的计算机 芯片上的方案中的用途,其中所述第二数据库进一步包含关于需要的限制酶和/或所述限 制酶要应用的顺序的信息。根据本专利技术的另一方面,公开了计算机可读介质。该计算机可读介质上编入了用于通过处理器进行处理的计算机程序。该计算机程序包含适于执行上述方法的代码段。此外,根据本专利技术的一个方面,公开了用于验证寡核苷酸阵列的装置。该装置包含 适于执行上述方法的部件。本专利技术相对于现有技术具有以下优点其允许酶的自动化选择用于甲基化概况分 析(methylation profiling)、芯片上的芯片(chip-on-chip)和比较基因组杂交实验的方 案中。本专利技术也使给定实验的微阵列上的空间最大化。这意味着来自微阵列的结果得到了 改进。本专利技术也改进了微阵列上的有意义图样的zero-in和焦距。这增强了区分两个分开 的样品类,如肿瘤与正常、恶性与非恶性、男性与女性样品等的能力。附图简述从本专利技术实施方案的以下描述,参照附图,能够明白和阐明本专利技术的这些和其它 方面、特征和能够达到的优点,在附图中,附图说明图1是根据一个实施方案的阵列设计过程的示意图;图2是计算机可读介质的示意图,在所述计算机可读介质上编入了用于通过处理 器进行处理的计算机程序;图3是用于设计和验证寡核苷酸阵列的装置的示意图;图4是图1所示阵列设计过程的进一步、更详细的示意图;图5是根据另一实施方案的过程的示意图;图6是作为图4和图5所示实施方案的整体方法的第三实施方案的示意图;图7是根据另一实施方案的过程的示意图;图8显示柱状图,其中显现根据一个实施方案的蛋白MseI的片段的分布。图8A显 示大小分布。y轴代表频率81,χ轴代表大小82。图8B显示覆盖分布。y轴代表频率81, χ轴代表覆盖83;并且图9显示柱状图,其中显现根据一个实施方案的蛋白MspI的片段的分布。图9A显 示大小分布。y轴代表频率91,χ轴代表大小92。图9B显示覆盖分布。y轴代表频率91, χ轴代表覆盖93。实施方案的描述根据一个实施方案,提供了方法,使得酶的自动选择能够用于方案中。这些方案可 以是甲基化概况分析、芯片上的芯片(chip-on-chip)和比较基因组杂交实验。根据一个实 施方案,该方法也可以使用于给定实验的微阵列上的空间最大化。这表示来自微阵列的结 果得到了改进。该方法也可以改进微阵列上的有意义图样的zero-in和焦距。这增强了区 分两个分开的样品类,如肿瘤与正常、恶性与非恶性、男性与女性样品等的能力。下文将参照附图,更详细描述本专利技术的几个实施方案,以便本领域技术人员能够 实施本专利技术。但是,本专利技术可以用很多不同的形式实施,并且不应解释为限于本文阐述的实 施方案。相反,提供这些实施方案是为了使本公开内容彻底和完整,并且将本专利技术的范围完 整地传达给本领域技术人员。这些实施方案不限制本专利技术,而本专利技术仅仅受到所附专利权 利要求的限制。此外,附图中举例说明的特定实施方案的详述中使用的术语不意欲成为本 专利技术的限制。以下说明集中于可用于方法,特别是可用于设计阵列的方法的本专利技术的一个实施 方案。但是,应该理解,本专利技术不限于该应用,而是可以应用于很多其它应用,包括例如用于5设计基于PCR的实验的、在计算机芯片上的方案。在这种情况下,需要额外的验证,从而确 保最终产物中可以获得靶DNA序列,并且选择正确的探针用于扩增。在根据图4的一个实施方案中,提供了用于验证寡核苷酸阵列的方法100。寡核苷 酸的实例可以是DNA、RNA、cDNA等。根据一个实施方案,寡核苷酸阵列是DNA阵列。根据另外的实施方案,DNA阵列是 DNA甲基化阵列。根据另一实施方案,DNA阵列是基因表达概况。根据另一实施方案,DNA阵列是基因组表达概况分析阵列。基因组表达概况分析 阵列17可以根据一些实施方案是单核苷酸多态性阵列或基因拷贝数目多态性阵列。根据一个实施方案,方法100包括将关于基因组注释10和需要的序列11的信息 存储在第一数据库12中,所述第一数据库12包含需要在计算机芯片上设计的方案中覆盖 的感兴趣的序列。根据一个实施方案,关于基因组注释10的信息是例如关于基因组和/或基因启动 子中的CpG岛的信息。根据另一实施方案,关于需要的序列11的信息是感兴趣的区域。感 兴趣的区域可以是例如癌基因、肿瘤抑制物、微RNA、端粒酶、着丝粒和/或重复序列。进一步,构建了查询序列的表示矩阵14。这可以通过应用第二数据库13实现。数 据库13可以包含所有已知的酶和它们各自的识别和切割位点(序列)。数据库13也可以 包含关于哪些酶适合使用和/或要以什么顺序应用所述酶的信息。然后可以从查询序列的表示矩阵14构建酶列表15本文档来自技高网...

【技术保护点】
用于设计和验证寡核苷酸阵列的方法(100),所述方法包括以下步骤:  将关于基因组注释(10)和需要的序列(11)的信息存储(101)在第一数据库(12)中;  通过在所述第一数据库(12)中存储的所述信息上应用包含关于限制酶的信息的第二数据库(13)而构建(102)查询序列的表示矩阵(14);  基于所述表示矩阵而构建(103)限制酶列表(15)和用于概况分析的序列列表(16);和  从用于概况分析的序列列表(16)设计(104)寡核苷酸阵列(17)。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:N迪米特罗瓦S卡马拉卡兰R卢西托
申请(专利权)人:皇家飞利浦电子股份有限公司冷泉港实验室
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1