【技术实现步骤摘要】
【国外来华专利技术】使用微生物核酸和体细胞突变的独立于分类学的癌症诊断和分类
[0001]交叉引用
[0002]本申请要求
2020
年
12
月
22
日提交的美国临时专利申请号
63/128,971
的权益,该申请通过引用完全并入
。
技术介绍
[0003]用于检测对象中癌症的理想诊断测试应具有以下特性:
(i)
其应高置信度地识别癌症的组织
/
身体部位位置;
(ii)
其应识别解释癌性状态或与癌性状态密切相关联的体细胞突变的存在;
(iii)
其应及早检测癌症的发生
(
例如,
I
‑
II
期
)
,以便进行早期医疗干预;
(iv)
其应是微创的;以及
(vi)
对于被诊断的癌症,其应具有高度的敏感性和特异性
(
即,当癌症存在时,测试将呈阳性的概率应该很高,而当癌症不存在时,测试将呈阴性的概率应该很
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.
一种生成预测癌症模型的方法,所述方法包括:
(a)
对一个或多个对象的生物样本的核酸组成进行测序,从而生成一个或多个测序读段;
(b)
用人类基因组数据库过滤所述一个或多个测序读段,从而产生一个或多个经过滤的测序读段;
(c)
从所述一个或多个经过滤的测序读段生成多个
k
‑
mer
;以及
(d)
通过用所述多个
k
‑
mer
和所述一个或多个对象的相应临床分类训练预测模型来生成预测癌症模型
。2.
根据权利要求1所述的方法,其还包括确定所述多个
k
‑
mer
的丰度,并用所述多个
k
‑
mer
的所述丰度训练所述预测模型
。3.
根据权利要求1所述的方法,其中通过所述一个或多个测序读段与所述人类参考基因组数据库之间的精确匹配来执行过滤
。4.
根据权利要求3所述的方法,其中精确匹配包括用软件程序
Kraken
或
Kraken 2
对所述一个或多个测序读段进行计算过滤
。5.
根据权利要求3所述的方法,其中精确匹配包括用软件程序
bowtie 2
或其任何等效物对所述一个或多个测序读段进行计算过滤
。6.
根据权利要求1所述的方法,其还包括对所述一个或多个经过滤的测序读段执行计算机内净化,从而产生一个或多个经净化的测序读段
。7.
根据权利要求6所述的方法,其还包括将所述一个或多个经净化的测序读段映射到人类参考基因组数据库的构建,以产生多个突变的人类序列比对
。8.
根据权利要求7所述的方法,其中通过
bowtie 2
序列比对工具或其任何等效物来执行映射
。9.
根据权利要求7所述的方法,其中映射包括端到端比对
、
局部比对或其任何组合
。10.
根据权利要求7所述的方法,其还包括通过查询癌症突变数据库来识别所述多个突变的人类序列比对中的癌症突变
。11.
根据权利要求
10
所述的方法,其还包括用所述癌症突变生成癌症突变丰度表
。12.
根据权利要求1所述的方法,其中所述多个
k
‑
mer
包括非人类
k
‑
mer、
人类突变的
k
‑
mer、
未分类的
DNA k
‑
mer
或其任何组合
。13.
根据权利要求1所述的方法,其中所述生物样本包括组织样本
、
液体活检样本或其任何组合
。14.
根据权利要求1所述的方法,其中所述一个或多个对象是人类或非人类哺乳动物
。15.
根据权利要求1所述的方法,其中所述核酸组成包含
DNA、RNA、
无细胞
DNA、
无细胞
RNA、
外泌体
DNA、
外泌体
RNA、
循环肿瘤细胞
DNA、
循环肿瘤细胞
RNA
或其任何组合
。16.
根据权利要求1所述的方法,其中所述人类参考基因组数据库是
GRCh38。17.
根据权利要求2所述的方法,其中所述预测癌症模型的输出提供与对象的癌症的存在或不存在相关联的对癌症的所述存在或所述不存在
、
癌症身体部位位置
、
癌症体细胞突变或其任何组合的诊断
。18.
根据权利要求
17
所述的方法,其中所述预测癌症模型的所述输出包括对所述癌症体细胞突变
、
所述多个
k
‑
mer
的所述丰度或其任何组合的分析
。
19.
根据权利要求1所述的方法,其中用一组癌症突变和
k
‑
mer
丰度训练经训练预测模型,所述组癌症突变和
k
‑
mer
丰度已知在感兴趣的癌症中以特性丰度存在或不存在
。20.
根据权利要求
12
所述的方法,其中所述非人类
k
‑
mer
来源于以下生命域:细菌
、
古菌
、
真菌
、
病毒或其任何组合生命域
。21.
根据权利要求1所述的方法,其中所述预测癌症模型被配置成确定对象的癌症的一种或多种类型的存在与否
。22.
根据权利要求
21
所述的方法,其中癌症的所述一种或多种类型处于早期
。23.
根据权利要求
22
所述的方法,其中所述早期包括癌症的
I
期
、II
期或其任何组合期
。24.
根据权利要求1所述的方法,其中所述预测癌症模型被配置成确定对象中癌症的一种或多种亚型的存在与否
。25.
根据权利要求1所述的方法,其中所述预测癌症模型被配置成预测对象的癌症分期
、
癌症预后或其任何组合
。26.
根据权利要求1所述的方法,其中所述预测癌症模型被配置成预测当施用治疗性化合物治疗癌症时对象的治疗性反应
。27.
根据权利要求1所述的方法,其中所述预测癌症模型被配置成确定对象的最佳疗法
。28.
根据权利要求1所述的方法,其中所述预测癌症模型被配置成对对象的一种或多种癌症对疗法的反应的过程进行纵向建模,从而产生所述对象的一种或多种癌症对所述疗法的反应的所述过程的纵向模型
。29.
根据权利要求
28
所述的方法,其中所述预测癌症模型被配置成至少部分基于所述纵向模型来确定对对象的一种或多种癌症的疗法的所述过程的调整
。30.
根据权利要求1所述的方法,其中所述预测癌症模型被配置成确定对象的以下癌症的存在与否:急性骨髓性白血病
、
肾上腺皮质癌
、
膀胱尿路上皮癌
、
低级别脑胶质瘤
、
浸润性乳腺癌
、
宫颈鳞状细胞癌和宫颈内腺癌
、
胆管癌
、
结肠腺癌
、
食管癌
、
多形性胶质母细胞瘤
、
头颈部鳞状细胞癌
、
肾嫌色细胞癌
、
肾透明细胞癌
、
肾乳头状细胞癌
、
肝细胞癌
、
肺腺癌
、
肺鳞状细胞癌
、
淋巴样肿瘤弥漫大
B
细胞淋巴瘤
、
间皮瘤
、
卵巢浆液性囊腺癌
、
胰腺癌
、
嗜铬细胞瘤和副神经节瘤
、
前列腺癌
、
直肠腺癌
、
肉瘤
、
皮肤黑色素瘤
、
胃腺癌
、
睾丸生殖细胞瘤
、
胸腺瘤
、
甲状腺癌
、
子宫癌肉瘤
、
子宫体子宫内膜癌
、
葡萄膜黑色素瘤或其任何组合
。31.
根据权利要求6所述的方法,其中所述计算机内净化识别并去除非人类污染物特征,同时保留其他非人类信号特征
。32.
根据权利要求
13
所述的方法,其中所述液体活检包括:血浆
、
血清
、
全血
、
尿液
、
脑脊髓液
、
唾液
、
汗液
、
眼泪
、
呼出的呼吸冷凝物或其任何组合
。33.
根据权利要求
10
所述的方法,其中所述癌症突变数据库源自癌症体细胞突变目录
(COSMIC)、
癌症基因组项目
(CGP)、
癌症基因组图谱
(TGCA)、
国际癌症基因组联盟
(ICGC)
或其任何组合
。34.
根据权利要求2所述的方法,其中通过
Jellyfish、UCLUST、GenomeTools(Tallymer)、KMC2、Gerbil、DSK
或其任何组合来确定所述多个
k
‑
mer
的所述丰度
。35.
根据权利要求1所述的方法,其中所述一个或多个对象的所述临床分类包括健康
、
癌性
、
非癌性疾病或其任何组合分类
。
36.
根据权利要求1所述的方法,其中所述一个或多个经过滤的测序读段包括与参考人类基因组的非精确匹配
、
非人类测序读段
、
非匹配的非人类测序读段或其任何组合
。37.
根据权利要求
36
所述的方法,其中所述非匹配的非人类测序读段包括与非人类参考基因组数据库不匹配的测序读段
。38.
一种诊断对象的癌症的方法,所述方法包括:
(a)
确定对象的样本的多个体细胞突变和非人类
k
‑
mer
序列;
(b)
将所述对象的所述多个体细胞突变和所述多个非人类
k
‑
mer
序列与给定癌症的多个体细胞突变和非人类
k
‑
mer
序列进行比较;以及
(c)
通过至少部分基于所述对象的多个体细胞突变和非人类
k
‑
mer
序列与所述给定癌症的所述多个体细胞突变和非人类
k
‑
mer
序列的比较提供癌症存在与否的概率来诊断所述对象的癌症
。39.
根据权利要求
38
所述的方法,其中确定所述多个体细胞突变还包括对所述对象的样本的体细胞突变进行计数
。40.
根据权利要求
38
所述的方法,其中确定所述多个非人类
k
‑
mer
序列包括对所述对象的样本的所述非人类
k
‑
mer
序列进行计数
。41.
根据权利要求
38
所述的方法,其中诊断所述对象的所述癌症还包括确定所述癌症的类别或位置
。42.
根据权利要求
38
所述的方法,其中诊断所述对象的所述癌症还包括确定所述对象的癌症的一种或多种类型
。43.
根据权利要求
38
所述的方法,其中诊断所述对象的所述癌症还包括确定所述对象的癌症的一种或多种亚型
。44.
根据权利要求
38
所述的方法,其中诊断所述对象的所述癌症还包括确定所述对象的癌症的分期
、
癌症预后或其任何组合
。45.
根据权利要求
38
所述的方法,其中诊断所述对象的所述癌症还包括确定处于早期的癌症的类型
。46.
根据权利要求
45
所述的方法,其中处于所述早期的癌症的所述类型包括
I
期或
II
期癌症
。47.
根据权利要求
38
所述的方法,其中诊断所述对象的所述癌症还包括确定所述对象的癌症的突变状态
。48.
根据权利要求
38
所述的方法,其中诊断所述对象的所述癌症还包括确定所述对象对治疗所述对象的癌症的疗法的反应
。49.
根据权利要求
38
所述的方法,其中所述癌症包括:急性骨髓性白血病
、
肾上腺皮质癌
、
膀胱尿路上皮癌
、
低级别脑胶质瘤
、
浸润性乳腺癌
、
宫颈鳞状细胞癌和宫颈内腺癌
、
胆管癌
、
结肠腺癌
、
食管癌
、
多形性胶质母细胞瘤
、
头颈部鳞状细胞癌
、
肾嫌色细胞癌
、
肾透明细胞癌
、
肾乳头状细胞癌
、
肝细胞癌
、
肺腺癌
、
肺鳞状细胞癌
、
淋巴样肿瘤弥漫大
B
细胞淋巴瘤
、
间皮瘤
、
卵巢浆液性囊腺癌
、
胰腺癌
、
嗜铬细胞瘤和副神经节瘤
、
前列腺癌
、
直肠腺癌
、
肉瘤
、
皮肤黑色素瘤
、
胃腺癌
、
睾丸生殖细胞瘤
、
胸腺瘤
、
甲状腺癌
、
子宫癌肉瘤
、
子宫体子宫内膜癌
、
葡萄膜黑色素瘤或其任何组合
。50.
根据权利要求
38
所述的方法,其中所述对象是非人类哺乳动物
。
51.
根据权利要求
38
所述的方法,其中所述对象是人类
。52.
根据权利要求
38
所述的方法,其中所述对象是哺乳动物
。53.
根据权利要求
38
所述的方法,其中所述多个非人类
k
‑
mer
序列来源于以下非哺乳动物生命域:病毒
、
细菌
、
古菌
、
真菌或其任何组合
。54.
一种生成预测癌症模型的方法,所述方法包括:
(a)
提供一个或多个对象的生物样本的一个或多个核酸测序读段;
(b)
用人类基因组数据库过滤所述一个或多个核酸测序读段,从而产生一个或多个经过滤的测序读段;
(c)
从所述一个或多个经过滤的测序读段生成多个
k
‑
mer
;以及
(d)
通过用所述多个
k
‑
mer
和所述一个或多个对象的相应临床分类训练预测模型来生成预测癌症模型
。55.
根据权利要求
54
所述的方法,其还包括确定所述多个
k
‑
mer
的丰度,并用所述多个
k
‑
mer
的所述丰度训练所述预测模型
。56.
根据权利要求
54
所述的方法,其中通过所述一个或多个核酸测序读段与所述人类参考基因组数据库之间的精确匹配来执行过滤
。57.
根据权利要求
56
所述的方法,其中精确匹配包括用软件程序
Kraken
或
Kraken 2
对所述一个或多个核酸测序读段进行计算过滤
。58.
根据权利要求
56
所述的方法,其中精确匹配包括用软件程序
bowtie 2
或其任何等效物对所述一个或多个核酸测序读段进行计算过滤
。59.
根据权利要求
54
所述的方法,其还包括对所述一个或多个经过滤的测序读段执行计算机内净化,从而产生一个或多个经净化的测序读段
。60.
根据权利要求
59
所述的方法,其还包括将所述一个或多个经净化的测序读段映射到人类参考基因组数据库的构建,以产生多个突变的人类序列比对
。61.
根据权利要求
60
所述的方法,其中通过
bowtie 2
序列比对工具或其任何等效物来执行映射
。62.
根据权利要求
60
所述的方法,其中映射包括端到端比对
、
局部比对或其任何组合
。63.
根据权利要求
60
所述的方法,其还包括通过查询癌症突变数据库来识别所述多个突变的人类序列比对中的癌症突变
。64.
根据权利要求
63
所述的方法,其还包括用所述癌症突变生成癌症突变丰度表
。65.
根据权利要求
54
所述的方法,其中所述多个
k
‑
mer
可以包括非人类
k
‑
mer、
人类突变的
k
‑
mer、
未分类的
DNA k
‑
mer
或其任何组合
。66.
根据权利要求
54
所述的方法,其中所述一个或多个生物样本包括组织样本
、
液体活检样本或其任何组合
。67.
根据权利要求
54
所述的方法,其中所述一个或多个对象是人类或非人类哺乳动物
。68.
根据...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。