预测影响表型性状的特定遗传基因座的系统和方法技术方案

技术编号:2586918 阅读:249 留言:0更新日期:2012-04-11 18:40
分析了一种遗传变异数据库以制备单一物种品系的基因组单元型图谱。计算机方法被用来将复杂表型迅速绘制成单元型图谱内的单元型模块。用这些系统和方法识别了调节小鼠三种不同生物重要表型性状的特定的遗传基因座。(*该技术在2024年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于预测影响表型性状的染色体区域的系统和方法。
技术介绍
对调节疾病易感性的遗传基因座进行识别有希望了解病理生理机制并研究出新的治疗常规人类疾病的方法。家族研究清楚地证实了许多常规人类疾病具有可遗传性因素,此哮喘、孤独症、精神分裂症、多发性硬化、系统性红斑狼疮以及I型和II型糖尿病。要了解这一点可参见Risch,Nature 405,847-856,2000。在过去20年中,已在人类群体中通过连锁分析和定位克隆识别了许多高通透性单基因(孟德尔式)疾病而囊性纤维化病、亨廷顿病和杜兴肌营养不良的致病性遗传突变。这些成功识别发生在相对较罕见的疾病中,在这些疾病中,某一物种基因组的遗传组合物(基因型)和该物种表现出的一种或多种物理特征(表型)之间有密切的关系。希望同样的方法可用于识别与普通人群中对常规疾病的易感性有关的遗传变体。为了解这一点可参见Lander和Schork,Science 265,2037-2048,1994。用这些方法已经识别了与对一些常规疾病亚类的易感性有关的遗传变体,所述疾病已乳腺癌(BRCA-1和-2)、结肠癌(FAP和HNPCC)、阿耳茨海默病(APP)和II型糖尿病(MODY-1、-2、-3),这使人们看到了希望。然而,这些遗传变体仅在非常有限的患病人群中有强大效果(Risch,Nature,405,847-856,2000)。尽管已经进行了很多工作,但是还未识别出造成普通人群中常规的非孟德尔式疾病易感性的遗传变体。由于涉及多个遗传基因座,且每个基因座对疾病整体易感性的贡献很小,因此通过对人类群体使用常规的连锁和定位克隆方法很难识别常规疾病易感性基因座。绘制人类群体疾病易感性基因的图谱也受到表型变化、群体间的遗传不均一性和不受控制的环境影响的妨碍。关于染色体lq42区域和系统性红斑狼疮之间连锁的各种报告证实了人类遗传研究中遭遇的困难。一个小组报道了lq42区域(Tsao,J.Clin.Invest,99,725-731,1997)以及该区域内基因(PARP)的微卫星等位基因之间存在强烈连锁(Tsao,J.Clin.Invest.103,1135-1140,1999)。相反,未提到与PARP微卫星标记有关的证据(Criswell等,J.Clin.Invest,Jun;105,1501-1502,2000;Delrieu等,Arthritis & Rheumatism 42,2194-2197,1999);并在一些被分析的其它SLE群体中发现了对lq42区域的最小连锁(Mucenski等,Molecular & Cellular Biology 6,4236-4243,1986)或无连锁(Lindqvist等,Journal of Autoimmunity,Mar;14,169-178,2000)。可能将需要其它工具和方法来识别与常规人类疾病有关的遗传因子。分析人类疾病生物学的实验性鼠遗传模型可大大简化对常规人类疾病遗传易感性基因座的识别。实验性鼠模型在遗传分析时有以下优点可提供自交(纯合的)亲本品系、可控制繁殖、环境常规、可控制实验干涉以及便于获得组织。已经描述了大量人类疾病生物学的鼠模型,其中许多在十年前甚至更长时间便可获得。然而,在利用鼠模型识别复杂疾病遗传易感性基因座方面的进展却相对有限。对鼠模型的遗传分析要求产生大量杂交后代、进行表型筛选并分析基因型。用常规的工具,这是一个艰苦、昂贵且费时的过程,这大大限制了在人类中进行确认之前可在小鼠内识别遗传基因座的速度。为了解这一点可参见Nadeau和Frankel,Nature Genetics Aug;25,381-384,2000。将表型差异,如对常规疾病的易感性与遗传变异进行关联中遇到的难度使本领域需要有其它工具来识别对质量性状或表型贡献最大的染色体区域。在这种情况下,迫切需要提供一种不使用杂交实验或艰巨的PCR后处理等费时技术而将表型与生物基因组内一个或多个特定遗传基因座相关联的技术。专利技术概述本专利技术提供了将表型与单一物种基因组中的一个或多个特定的遗传基因座相关联的计算机系统和方法。在所述方法中,单一物种多个有机体之间的表型差异与该有机体各个基因组内的差异和/或相似性相关联。本专利技术首先基于多个有机体的多态性用计算机绘制出单元型图谱。然后将与物种相关的表型分布与单元型图谱中等位基因在各个单元型模块(haplotype block)内的分布相比较,以在单元型图谱内识别有可能调节或影响表型的单元型模块。本专利技术的一个方面提供了将单一物种的多种不同有机体可能表现的表型与该单一物种基因组内一个或多个特定基因座相关联的方法。在该方法中,根据表型数据结构的差异和单元型模块的差异之间的一致性给单元型图谱内的单元型模块记分。在一些具体实施方案中,所述表型数据结构代表许多不同有机体所表现的表型差异,且所述单元型图谱包含多个单元型模块。单元型图谱内的各个单元型模块代表基因组的不同部分。对单元型图谱中多个单元型模块内的每个单元型模块进行记分。这样就可在多个单元型模块中识别出记分高于多个单元型模块中所有其它单元型模块的一个或多个单元型模块。在一些具体实施方案中,多个单元型模块中的一个单元型模块包含多个连续的单核苷多态性。在一些具体实施方案中,单元型模块内的各个单核苷多态性在该单元型模块其它单核苷多态性的阈距离(threshold distance)之内。在一些具体实施方案中,这种阈距离小于10兆碱基或小于1兆碱基。在一些具体实施方案中,对单元型模块内SNP之间的距离没有限制。在一些具体实施方案中,多个单元型模块中的一个单元型模块表示多个单元型,并小于在单元型模块中仅出现一次的单元型模块所代表的单元型的截断比例(cutoff percentage)。换句话说,任何给定的单元型模块中不超过截断比例的单元型仅由多个有机体中的单个有机体表现。在一些具体实施方案中,所述截断比例在5%和30%之间。本专利技术的一些具体实施方案还包括在记分之前生成单元型图谱的步骤。所述单元型图谱可通过各种不同方法生成。在一个这样的方法中,在遗传数据库中识别候选单元型模块。候选单元型模块含有多个连续的单核苷多态性。在一些具体实施方案中,该候选单元型模块内的每个单核苷多态性在该候选单元型模块内其它单核苷多态性的阈距离之内。在一些具体实施方案中,对候选单元型模块内的单核苷多态性之间的距离没有限制。对候选单元型模块进行记分。重复进行识别和记分直到该基因型数据库中所有可能的候选单元型模块都被识别,从而生成一组候选单元型模块。然后,选择在一组候选单元型模块中具有最高记分的候选单元型模块以绘制单元型图谱。然后,从这组候选模块中除去所选候选单元型模块和与所选候选单元型模块全部或部分重叠的各个候选单元型模块。重复为单元型图谱选择候选单元型模块并从保留的模块组中除去所选模块和所有与所选模块重叠的模块的过程,直到候选单元型模块组中不再保留候选单元型模块。用这种方法,包含各个候选单元型模块的单元型图谱被从候选模块组中选出。在一些具体实施方案中,记分是候选单元型模块中单核苷多态性的数目除以该模块所代表的单元型数目的平方的结果。本专利技术还提供了计算单元型模块本文档来自技高网...

【技术保护点】
一种将单一物种多个不同有机体所表现的表型与所述单一物种基因组内的一个或多个特定遗传基因座相关联的方法,所述方法包括:    对单元型图谱内的单元型模块进行记分,所述记分表示表型数据结构的差异和所述单元型模块的差异之间的一致性,其中,    所述表型数据结构代表所述多个不同有机体所表现的所述表型的差异;和    所述单元型图谱包括多个单元型模块,且所述单元型图谱内的每个单元型模块代表所述基因组的不同部分;以及    对所述单元型图谱中所述多个单元型模块内的每个单元型模块重复所述记分,从而识别出所述多个单元型模块中记分高于所述多个单元型模块中所有其它单元型模块的一个或多个单元型模块;其中所述一个或多个特定遗传基因座是由所述被识别的一个或多个单元型模块所代表的所述基因组的各个所述不同部分。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:乔纳森安德鲁尤索卡廖国春盖瑞艾伦佩尔茨
申请(专利权)人:弗哈夫曼拉罗切有限公司
类型:发明
国别省市:CH[瑞士]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1