基于基因拷贝数改变的模式的恶性黑色素瘤的基因组分类制造技术

技术编号:7155991 阅读:243 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及允许按照基因组概况分类恶性黑色素瘤细胞的方法和试剂盒,以及诊断、预测临床结果和使患者群体分层以使用所述方法进行临床试验和治疗的方法。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于限定与恶性黑色素瘤(MM)相关的肿瘤、癌细胞系和受试者样品的基因组亚组的方法。本专利技术还涉及按照基因组亚组装配(assembling)成小组(panels) 的肿瘤、癌细胞系和受试者样品以用于测试一种或多种用于给受试者施用的治疗性干预的功效的方法。相关领域的描述癌症是特征在于临床过程、结果和治疗反应性的相当大变异性的基因组的疾病。 该变异性背后的主要因素是癌症所固有的遗传异质性。相同组织病理学亚型的个别肿瘤在细胞DNA中具有不同的畸变。皮肤恶性黑色素瘤是在西方国家发病率日益升高的极具侵袭性的皮肤癌类型 (Tucker和Goldstein,200 。黑色素瘤是具有不可预测的临床过程和具有侵袭性生长及对现有化疗方案的抗性的潜能的异质性疾病(heterogeneous disease)。由于临床、形态学和细胞学改变的谱(spectrum)和缺乏分离病期(discrete stage),难以预测个别黑色素瘤患者的临床结果(Onken等人,2004 ;Weyers等人,1999)。癌症分类的改进对于抗癌药物的发现是至关重要的。目前,基于其可用性 (availability)、对小鼠中肿瘤形成的适应性以及培养中的生长和其他参数选择临床前模型,但它们不代表亲本肿瘤的遗传异质性。这导致临床试验中对在临床前模型中已显示卓越反应的试剂的差的反应。黑色素瘤肿瘤的表型多样性伴随相应的基因拷贝数反常模式的多样性。染色体畸变是与许多发育疾病和癌症关联的有害事件。体细胞中发生的染色体区域的扩增和缺失被认为是导致癌症的主要因素之一。因此恶性黑色素瘤中基因拷贝数模式的系统性检查可能用作恶性黑色素瘤的基于基因组学的分子分类学的基础。可通过经典细胞遗传学分析或荧光原位杂交(FISH)个别地检测具有预后意义的反复染色体畸变(Recurrent chromosomal aberration) (Levsky和Singer,2003)。然而,FISH分析不能检测整个遗传学异常谱,因为其只查询有限组的由应用的探针小组限定的染色体基因座。更有利的诊断工具将基于疾病的精确分类。其将使得能够进行合理的患者选择以进行基于受试者的MM的遗传状态的治疗。专利技术概述在第一方面,本专利技术涉及用于获得恶性黑色素瘤(MM)基因组亚组的数据库的方法,所述方法包括步骤(a)获得多个,m个,包含至少一个MM细胞的样品,其中所述样品包含细胞系或肿瘤;(b)获得包括步骤(a)中获得的每一个样品的每一条染色体的至少一个基因座的拷贝数改变信息的数据集;(c)鉴定数据集中被正常细胞污染的样品并且从数据集消除所述被污染的样品, 其中鉴定和消除包括(1)对数据应用与代表肿瘤和正常样品之间的差异的参数一致的机器学习算法(machine learning algorithm);(2)赋予每一个样品如通过机器学习算法测定的正常细胞污染的概率分数;(3)从数据集中消除每一个得分50%或更大的含正常细胞的概率的样品的数据;(d)通过对数据集应用利用Pearson线性相异性算法的无监督聚类算法 (unsupervised clustering algorithm)估计数据集中亚组的数巨 r ;(e)利用改进的基因组非负矩阵因子分解(modified genomic Non-negative Matrix Factorization) (gNMF)算法将数据集中的每一个样品分配至至少一个簇,其中所述改进的gNMF算法包括(1)利用如下公式计算每100步乘性更新(multiplicative updating)后算法的散度权利要求1.用于获得恶性黑色素瘤基因组亚组的数据库的方法,所述方法包括步骤(a)获得多个,m个,包含至少一个匪细胞的样品;(b)获得包括步骤(a)中获得的每一个样品的每一条染色体的至少一个基因座的拷贝数改变信息的数据集;(c)鉴定数据集中被正常细胞污染的样品并且从数据集消除所述被污染的样品,其中鉴定和消除包括(1)对数据应用与代表肿瘤和正常样品之间的差异的参数一致的机器学习算法;(2)赋予每一个样品如通过机器学习算法测定的正常细胞污染的概率分数;(3)从数据集中消除每一个得分50%或更大的含正常细胞的概率的样品的数据;(d)通过对数据集应用利用Pearson线性相异性算法的无监督聚类算法估计数据集中亚组的数目r;(e)利用改进的基因组非负矩阵因子分解(gNMF)算法将数据集中的每一个样品分配至至少一个簇,其中所述改进的gNMF算法包括(1)利用如下公式计算每100步乘性更新后算法的散度2.分类MM肿瘤或细胞系的方法,包括(a)提供通过方法开发的数据库,所述方法包括(i)获得多个,m个,包含至少一个MM肿瘤或细胞系的样品;( )获得第一数据集,所述数据集包括步骤(i)中获得的每一个样品的每一条染色体的至少一个基因座的拷贝数改变信息;(iii)鉴定第一数据集中被正常细胞污染的样品并且从第一数据集消除所述被污染的样品,其中鉴定和消除包括(1)对数据应用与代表肿瘤和正常样品之间的差异的参数一致的机器学习算法;(2)赋予每一个样品如通过机器学习算法测定的正常细胞污染的概率分数;(3)从第一数据集中消除每一个得分50%或更大的含正常细胞的概率的样品的数据;(iv)通过对数据集应用使用Pearson线性相异性算法的无监督聚类算法估计数据集中亚组的数目r;(ν)利用改进的基因组非负矩阵因子分解(gNMF)算法将数据集中的每一个样品分配至至少一个簇,其中所述改进的gNMF算法包括(1)利用如下公式计算每100步乘性更新后算法的散度3.权利要求1或2的方法,其中所述无监督聚类算法是等级聚类。4.权利要求1或2的方法,其中将同表象相关用于提供来自数据集的簇的终数目。5.权利要求1或2的方法,其中将贝叶斯信息准则用于提供来自数据集的簇的终数目。6.权利要求1或2的方法,其中将同表象相关和贝叶斯信息准则用于提供来自数据集的簇的终数目。7.权利要求1或2的方法,其中多个样品,m,包含第一、第二、第三、第四、第五和第六细胞系,其中所述第一细胞系选自SKMEL119、HS944、WM 1366和WM88 ;所述第二细胞系是WM3248 ;所述第三细胞系是1205LU ;所述第四细胞系选自 451LU、SKMEL19、SKMEL28、SKMEL30、SKMEL63、WM35, WM983 和 WM983C ;所述第五细胞系选自 WM3211、M14、MEffO, SKMEL2、SKMEL5、UACC257、UACC62、WM122、 WM13662, WM239A, WM32112, WM32482, WM793B 和 501MEL,及所述第六细胞系是MALME3M或WM882。8.权利要求1或2的方法,其中多个样品,m,由SKMEL119、HS944、WM1366、丽88; WM3248;1205LU ;451LU、SKMEL19, SKMEL28、SKMEL30、SKMEL63 ;WM35、WM983、WM983C、 WM3211、M14、MEffO, SKMEL2、SKMEL5、UACC257、UACC62、WM122、WM13662、WM239A、WM32112、 WM3248本文档来自技高网...

【技术保护点】
1.用于获得恶性黑色素瘤基因组亚组的数据库的方法,所述方法包括步骤:(a)获得多个,m个,包含至少一个MM细胞的样品;(b)获得包括步骤(a)中获得的每一个样品的每一条染色体的至少一个基因座的拷贝数改变信息的数据集;(c)鉴定数据集中被正常细胞污染的样品并且从数据集消除所述被污染的样品,其中鉴定和消除包括:(1)对数据应用与代表肿瘤和正常样品之间的差异的参数一致的机器学习算法;(2)赋予每一个样品如通过机器学习算法测定的正常细胞污染的概率分数;(3)从数据集中消除每一个得分50%或更大的含正常细胞的概率的样品的数据;(d)通过对数据集应用利用Pearson线性相异性算法的无监督聚类算法估计数据集中亚组的数目r;(e)利用改进的基因组非负矩阵因子分解(gNMF)算法将数据集中的每一个样品分配至至少一个簇,其中所述改进的gNMF算法包括:(1)利用如下公式计算每100步乘性更新后算法的散度:(math)??(mrow)?(mi)D(/mi)?(mrow)?(mo)((/mo)?(mi)V(/mi)?(mo)|(/mo)?(mo)|(/mo)?(mi)WH(/mi)?(mo))(/mo)?(/mrow)?(mo)=(/mo)?(munderover)?(mi)Σ(/mi)?(mrow)?(mi)i(/mi)?(mo)=(/mo)?(mn)1(/mn)?(/mrow)?(mi)n(/mi)?(/munderover)?(munderover)?(mi)Σ(/mi)?(mrow)?(mi)j(/mi)?(mo)=(/mo)?(mn)1(/mn)?(/mrow)?(mi)m(/mi)?(/munderover)?(mrow)?(mo)((/mo)?(msub)?(mi)V(/mi)?(mi)ij(/mi)?(/msub)?(mi)log(/mi)?(mfrac)?(msub)?(mi)V(/mi)?(mi)ij(/mi)?(/msub)?(msub)?(mrow)?(mo)((/mo)?(mi)WH(/mi)?(mo))(/mo)?(/mrow)?(mi)ij(/mi)?(/msub)?(/mfrac)?(mo)-(/mo)?(msub)?(mi)V(/mi)?(mi)ij(/mi)?(/msub)?(mo)+(/mo)?(msub)?(mrow)?(mo)((/mo)?(mi)WH(/mi)?(mo))(/mo)?(/mrow)?(mi)ij(/mi)?(/msub)?(mo))(/mo)?(/mrow)?(mo)-(/mo)?(mo)-(/mo)?(mo)-(/mo)?(mrow)?(mo)((/mo)?(mn)11(/mn)?(mo))(/mo)?(/mrow)?(/mrow)?(/math)其中Vij是矩阵V的第i行和第j列,(WH)ij是矩阵(W*H)的第i行和第j列,i从1运行至n,且n是数据集中区段的数目,并且j从1运行至m,且m是数据集中样品的数目;(2)如果步骤(e)(1)中计算的散度当与对于之前100步所述算法的乘性更新所计算的散度相比较时减小不超过约0.001%,那么终止算法;(3)随机重复算法,进行选择的运行数,并且使用如下公式计算每一次运行算法的H的Pearson相关系数矩阵:(math)??(mrow)?(msub)?(mi)C(/mi)?(mrow)?(mi)i(/mi)?(mo),(/mo)?(mi)j(/mi)?(/mrow)?(/msub)?(mo)=(/mo)?(mi)ρ(/mi)?(mrow)?(mo)((/mo)?(msub)?(mi)H(/mi)?(mrow)?(mo),(/mo)?(mi)i(/mi)?(/mrow)?(/msub)?(mo),(/mo)?(msub)?(mi)H(/mi)?(mrow)?(mo),(/mo)?(mi)j(/mi)?(/mrow)?(/msub)?(mo))(/mo)?(/mrow)?(mo)=(/mo)?(mfrac)?(mrow)?(mfrac)?(mn)1(/mn)?(mrow)?(mi)r(/mi)?(mo)-(/mo)?(mn)1(/mn)?(/mrow)?(/mfrac)?(munder)?(mi)Σ(/mi)?(mi)k(/mi)?(/munder)?(mrow)?(mo)((/mo)?(msub)?(mi)H(/mi)?(mrow)?(mi)k(/mi)?(mo),(/mo)?(mi)i(/mi)?(/mrow)?(/msub)?(mo)-(/mo)?(mover)?(msub)?(mi)H(/mi)?(mrow)?(mo),(/mo)?(mi)i(/mi)?(/mrow)?(/msub)?(mo)&O...

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:D·塞米扎罗夫
申请(专利权)人:雅培制药有限公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1