【技术实现步骤摘要】
【国外来华专利技术】鉴定可鉴别或指示癌症病状的甲基化模式
[0001]相关申请交叉引用
[0002]本申请要求于2020年2月28日提交美国临时专利申请案第62/983,443的美国专利申请的优先权,标题为“鉴定可鉴别或指示癌症病状的甲基化模式”,通过引用将其并入本文中。
[0003]本说明书一般涉及使用在生物样本中的甲基化模式来鉴定可鉴别或指示一癌症病状的甲基化模式。
技术介绍
[0004]癌症的早期检测是改善癌症结果的最人道的方式之一。现状治疗
‑
针对实体瘤的手术、化学疗法及放射疗法的组合,或针对液体肿瘤的化学及骨髓移植
‑
具有包括不令人满意的存活率的缺点。治疗往往使患者痛苦,同时提供不令人满意的生存时间。新的免疫疗法亦有缺点。患者必须在重症监护室接受治疗,且往往会产生致命的副作用。当早期发现癌症时,所有此等治疗皆会更有效。
[0005]为了开发更好的治疗方法及癌症诊断方法,已经投入资源来寻找癌症中的单一突变。此种做法已经演变成一种流行的医学努力,称为“精准肿瘤学(precision oncology)”,其中对肿瘤进行测序,以鉴定导致细胞不受控制生长的关键可药化突变(druggable mutation)。例如,由美国国家癌症研究所带头的一项名为“治疗选择的分子分析”(Molecular Analysis for Therapy Choice,MATCH)的临床试验计划于2015年开始。此试验有30多个分支。在此试验中所测试的更常见的肿瘤中,现有药物可解决的“可操作(ac ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种鉴定可鉴别或指示一癌症病状的多个限定甲基化模式的方法,其特征在于:所述方法包括步骤:(A)获得电子形式的一第一数据集,其中所述第一数据集包括在一第一多个片段中的各自片段的相应片段甲基化模式,其中(i)所述各自片段的相应片段甲基化模式是通过从一第一组受试者中的一相应受试者所获得的一各自生物样本的核酸的甲基化测序而测定,以及(ii)所述各自片段的相应片段甲基化模式包括在所述各自片段中的一相应多个CpG位点中的各个CpG位点的甲基化状态,及其中所述第一多个片段包括超过1000个片段;(B)获得电子形式的一第二数据集,其中所述第二数据集包括在一第二多个片段中的各自片段的相应片段甲基化模式,其中(i)所述各自片段的相应片段甲基化模式是通过从一第二组受试者中的一相应受试者所获得的一各自生物样本的核酸的甲基化测序而测定,以及(ii)所述各自片段的相应片段甲基化模式包括在所述各自片段中的一相应多个CpG位点中的各个CpG位点的甲基化状态,其中所述第一组受试者中的各个受试者具有所述癌症病状的一第一状态,及所述第二组受试者中的各个受试者具有所述癌症病状的一第二状态,以及其中所述第二多个片段包括超过1000个片段;(C)使用所述第一数据集为一或多个相应基因组区域产生一或多个第一状态区间图,其中:在所述一或多个第一状态区间图中的各个第一状态区间图包括一相应独立的多个节点,其中所述相应独立的多个节点包括超过50个节点,以及在所述一或多个第一状态区间图中的各个相应独立的多个节点中的各自节点的特征在于一相应起始甲基化位点、一相应结束甲基化位点,以及针对跨越在所述各自节点的相应起始甲基化位点与所述相应结束甲基化位点之间的所述第一数据集中的第一多个片段中所观察到的各个不同片段甲基化模式,(i)所述不同片段甲基化模式的表征,及(ii)在所述第一数据集中的多个片段的计数,所述多个片段的片段甲基化模式在所述相应起始甲基化位点开始,及在所述相应结束甲基化位点结束,且具有不同片段甲基化模式;(D)使用所述第二数据集为一或多个相应基因组区域产生一或多个第二状态区间图,其中:在所述一或多个第二状态区间图中的各个第二状态区间图包括一相应独立的多个节点,其中所述相应独立的多个节点包括超过50个节点,以及在所述一或多个第二状态区间图中的各个相应独立的多个节点中的各自节点的特征在于一相应起始甲基化位点、一相应结束甲基化位点,以及针对跨越在所述各自节点的相应起始甲基化位点与所述相应结束甲基化位点之间的所述第二数据集中的第二多个片段中所观察到的各个不同片段甲基化模式,(i)所述不同片段甲基化模式的表征,及(ii)在所述第二数据集中的多个片段的计数,所述多个片段的片段甲基化模式在所述相应起始甲基化位点开始,及在所述相应结束甲基化位点结束,且具有不同片段甲基化模式;以及(E)为多个限定甲基化模式扫描所述一或多个第一区间图及所述一或多个第二区间图,其中在所述多个限定甲基化模式中的各个限定甲基化模式:(i)具有一长度,所述长度是在所述一或多个第一区间图及所述一或多个第二区间图的片段甲基化模式内的一预定的CpG位点数量范围内,(ii)满足一或多个选择标准,以及
(iii)在一相应初始CpG位点与一相应最终CpG位点之间跨越一相应CpG区间l,从而鉴定可鉴别或指示一癌症病状的多个限定甲基化模式。2.根据权利要求1所述的方法,其特征在于:所述一或多个选择标准规定一甲基化模式:(i)是表示在具有一第一频率的所述一或多个第一区间图中,所述第一频率满足一第一频率阈值,(ii)是表示在具有一覆盖率的所述一或多个第一区间图中,所述覆盖率满足一第一状态深度阈值,以及(iii)是表示在具有一第二频率的所述一或多个第二区间图中,所述第二频率满足一第二频率阈值。3.根据权利要求2所述的方法,其特征在于:(i)当在所述一或多个第一区间图中的甲基化模式的频率超过所述第一频率阈值时,所述甲基化模式是表示在具有一第一频率的所述一或多个第一区间图中,所述第一频率满足一第一频率阈值,(ii)当在所述一或多个第一区间图中的甲基化模式的覆盖率超过所述第一状态深度阈值时,所述甲基化模式是表示在具有一覆盖率的所述一或多个第一区间图中,所述覆盖率满足所述第一状态深度阈值,及(iii)当在所述一或多个第二区间图中的甲基化模式的频率低于所述第二频率阈值时,所述甲基化模式是表示在具有一第二频率的所述一或多个第二区间图中,所述第二频率满足所述第二频率阈值。4.根据权利要求3所述的方法,其特征在于:所述第一频率阈值是0.2,所述第一状态深度阈值是10,以及所述第二频率阈值是0.001。5.根据权利要求1所述的方法,其特征在于:当表达时,一各自甲基化模式满足所述一或多个选择标准:针对甲基化模式超过3、4、5或6,其中:第二计数=在所述一或多个第二状态区间图中的各自甲基化模式的一计数,以及第二状态深度=所述第二数据集在所述一或多个第二状态区间图中由所述各自甲基化模式所表示的基因组的区域中的一覆盖率。6.根据权利要求1至5中任一项所述的方法,其特征在于:所述方法进一步包括步骤:(F)训练一分类器,以使用甲基化模式信息来鉴别所述癌症病状的一状态,所述甲基化模式信息与在所述第一数据集与所述第二数据集中的所述多个限定甲基化模式相关联。7.根据权利要求6所述的方法,其特征在于:所述分类器是逻辑回归。8.根据权利要求6所述的方法,其特征在于:所述分类器是一神经网络算法、一支持向量机算法、一朴素贝叶斯算法、一最近邻算法、一增强树算法、一随机森林算法、一决策树算法、一多项逻辑回归算法、一线性模型,或一线性回归算法。9.根据权利要求6至8中任一项所述的方法,其特征在于:所述方法进一步包括步骤:
(G)获得电子形式的一第三数据集,其中所述第三数据集包括在一第三多个片段中的各自片段的相应片段甲基化模式,其中(i)所述各自片段的相应片段甲基化模式是通过从一测试对象中所获得的一生物样本的核酸的甲基化测序而测定,以及(ii)所述各自片段的相应片段甲基化模式包括在所述各自片段中的一相应多个CpG位点中的各个CpG位点的甲基化状态;以及(H)将在所述第三数据集中的第三多个片段中的各个相应片段的片段甲基化模式应用于所述分类器,从而确定在所述测试对象中的癌症病状的状态,所述片段甲基化模式包含或相应于在所述多个限定甲基化模式中的一限定甲基化模式。10.根据权利要求6至9中任一项所述的方法,其特征在于:所述癌症病状的状态是一肿瘤分数,所述癌症病状的第一状态是一第一范围的肿瘤分数,以及所述癌症病状的第二状态是一第二范围的肿瘤分数。11.根据权利要求10所述的方法,其特征在于:所述第一范围是大于0.001,及所述第二范围是小于0.001。12.根据权利要求9所述的方法,其特征在于:所述癌症病状的状态是肿瘤分数;以及所述(G)的获得及(H)的应用随着时间的推移而不断重复。13.根据权利要求6至9中任一项所述的方法,其特征在于:所述癌症病状的状态是不存在或存在一癌症。14.根据权利要求6至9中任一项所述的方法,其特征在于:所述癌症病状的状态是癌症的一个阶段。15.根据权利要求13或14所述的方法,其特征在于:所述癌症是肾上腺癌、胆道癌、膀胱癌、骨癌/骨髓癌、脑癌、乳腺癌、宫颈癌、结肠直肠癌、食道癌、胃癌、头/颈癌、肝胆癌、肾脏癌、肝癌、肺癌、卵巢癌、胰腺癌、盆腔癌、胸膜癌、前列腺癌、肾癌、皮肤癌、胃癌、睾丸癌、胸腺癌、甲状腺癌、子宫癌、淋巴瘤、黑色素瘤、多发性骨髓瘤、白血病,或其组合。16.根据权利要求9所述的方法,其特征在于:从所述测试对象中所获得的生物样本是一液体生物样本。17.根据权利要求16所述的方法,其特征在于:所述第三多个片段是细胞游离核酸。18.根据权利要求1至17中任一项所述的方法,其特征在于:所述第一多个片段及所述第二多个片段是细胞游离核酸。19.根据权利要求1至18中任一项所述的方法,其特征在于:所述一或多个第一状态区间图是由一单个第一状态区间图所组成;以及所述一或多个第二状态区间图是由一单个第二状态区间图所组成。20.根据权利要求1至18中任一项所述的方法,其特征在于:所述一或多个第一状态区间图是多个第一状态区间图;所述一或多个第二状态区间图是多个第二状态区间图;所述一或多个相应基因组区域是多个基因组区域;以及在所述多个基因组区域中的各自相应基因组区域是由在所述第一多个区间图中的第一状态区间图及在所述第二多个区间图中的第二状态区间图表示。21.根据权利要求20所述的方法,其特征在于:所述多个基因组区域是介于10与30之间。22.根据权利要求20所述的方法,其特征在于:所述多个基因组区域中的各个基因组区
域是不同的人类染色体。23.根据权利要求20所述的方法,其特征在于:所述多个基因组区域是由介于2个与1000个之间的基因组区域、介于500个与5,000个之间的基因组区域、介于1,000个与20,000个之间的基因组区域,或介于5,000个与50,000个之间的基因组区域所组成。24.根据权利要求20所述的方法,其特征在于:所述(A)的获得及(B)的获得的甲基化测序是使用多个探针进行靶向测序,以及在所述多个基因组区域中的各个基因组区域与所述多个探针中的一个探针相关联。25.根据权利要求1至24中任一项所述的方法,其特征在于:在所述一或多个第一区间图中的各自区间图的相应独立的多个节点被设置为代表所述一或多个相应基因组区域中的一相应区域的一相应树,以及在所述各自区间图的相应独立的多个节点中的各自节点代表所述相应基因组区域的一子区域。26.根据权利要求25所述的方法,其特征在于:各个相应树将所述相应独立的多个节点排列成相应多个树叶,其中在所述相应多个树叶中的各个树叶的父节点引用一或多个子节点,所述(E)的扫描产生多个查询,在所述多个查询中的各自相应查询是针对长度为l的不同候选甲基化模式,以及在所述多个查询中的各自相应查询是用于(i)在一相应树的相应独立的多个节点中的各自节点处与所述各自查询执行一自动匹配,(ii)进一步将所述查询传播至所述各自节点的子节点,以进一步将所述各自查询与所述各自节点的子节点进行自动匹配,以及(iii)将各个自动匹配的结果传送至所述各自节点的父节点。27.根据权利要求26所述的方法,其特征在于:所述树是具有一随机表面积启发式的k维树的一维版本,其中k是2或更大的正整数。28.根据权利要求26所述的方法,其特征在于:长度l的各个可能的甲基化模式是由多个查询进行采样。29.根据权利要求28所述的方法,其特征在于:l是3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个CpG位点。30.根据权利要求1至29中任一项所述的方法,其特征在于:所述CpG位点数量范围是l个连续的CpG位点。31.根据权利要求30所述的方法,其特征在于:l是3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个连续的CpG位点。32.根据权利要求1所述的方法,其特征在于:所述预定的CpG数量范围是在一人类参考基因组中2至100个连续的CpG位点。33.根据权利要求1至32中任一项所述的方法,其特征在于:来自所述第一组受试者中的相应受试者的各自生物样本的甲基化测序会产生十亿或更多、二十亿或更多、三十亿或更多、四十亿或更多、五十亿或更多、六十亿或更多、七十亿或更多、八十亿或更多、九十亿或更多、或一百亿或更多片段,此等片段被评估为包含在所述第一数据集中的甲基化模式。34.根据权利要求1至32中任一项所述的方法,其特征在于:来自所述第一组受试者中的相应受试者的各自生物样本的甲基化测序会产生少于十亿个片段或少于10,000个片段,
此等片段被评估为包含在所述第一数据集中的甲基化模式。35.根据权利要求1至34中任一项所述的方法,其特征在于:跨越所述一或多个相应基因组区域存在超过10,000个CpG位点、超过25,000个CpG位点、超过50,000个CpG位点,或超过80,000个CpG位点。36.根据权利要求1至34中任一项所述的方法,其特征在于:跨越所述一或多个相应基因组区域存在少于10,000个CpG位点、少于25,000个CpG位点、少于50,000个CpG位点,或少于80,000个CpG位点。37.根据权利要求1至36中任一项所述的方法,其特征在于:通过一各自片段的甲基化测序所获得的一相应多个序列读数的平均序列读数长度是介于140与280个核苷酸之间。38.根据权利要求1至37中任一项所述的方法,其特征在于:在所述一或多个相应基因组区域中的各个基因组区域代表介于500个碱基对与10,000个碱基对之间的一人类基因组参考序列。39.根据权利要求1至37中任一项所述的方法,其特征在于:在所述一或多个相应基因组区域中的各个基因组区域代表一人类基因组参考序列的介于500个碱基对与2,000个碱基对之间的碱基对。40.根据权利要求1至37中任一项所述的方法,其特征在于:在所述一或多个相应基因组区域中的各个基因组区域代表一人类基因组参考序列的不同部分。41.根据权利要求1至40中任一项所述的方法,其特征在于:在所述相应多个CpG位点中的一个CpG位点的甲基化状态为:当所述CpG位点通过所述甲基化测序而被确定为甲基化时,所述甲...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。