从循环核酸中鉴定全基因组序列数据中的全局序列特征制造技术

技术编号:29501740 阅读:39 留言:0更新日期:2021-07-30 19:16
本公开提供用于在从无细胞DNA(cfDNA)样品获得的全基因组序列数据中鉴定全局癌症特异性序列特征的技术。一种示例性技术包括从cfDNA样品获得多个全基因组测序读段,以及从所述多个基因组测序读段中的至少大多数中确定两个或更多个度量,其中所述两个或更多个度量中的第一度量为:(i)所述无细胞DNA的片段大小,(ii)所述多个全基因组测序读段的相对读段深度,或(iii)种系等位基因失衡。所述技术进一步包括将所述两个或更多个度量输入分类器中以获得对第一类的第一预测和对第二类的第二预测,以及基于所述第一预测和所述第二预测将无细胞DNA样品分类为所述第一类或所述第二类。

【技术实现步骤摘要】
【国外来华专利技术】从循环核酸中鉴定全基因组序列数据中的全局序列特征
本公开总体上涉及癌症筛查,且更特别地涉及用于鉴定从无细胞DNA(cfDNA)样品获得的全基因组序列数据中的全局癌症特异性序列特征的技术。
技术介绍
血浆基因型分型测定法和其他液体活检测定法的发展已经扩大了无细胞DNA(cfDNA)作为用于癌症患者管理的非侵入性癌症生物标志物的临床实用性。例如,血浆基因型分型测定法可以在由非恶性细胞脱落的野生型DNA的高背景下,对循环肿瘤DNA(ctDNA)内临床相关的点突变、插入/缺失、扩增、重排和非整倍性进行无创地检测和定量。与传统的物理和生化方法相比,基于血液的ctDNA检测提供了一种非侵入性且易于使用的方式用于监测疾病状态、判断预后和指导治疗。然而,由于血浆基因型分型测定法和其他液体活检测定法已证明在无创ctDNA突变检测和微小残留病(MRD)监测方面的实用性,因此人们有兴趣扩展这项技术,以在做出临床诊断(即癌症筛查)之前确定其是否有能力来判别癌症的存在。当前,针对cfDNA的下一代测序(NGS)测定法旨在从覆盖已知癌基因和反复发生癌症突变位置的小本文档来自技高网...

【技术保护点】
1.一种方法,其包括:/n(a)通过数据处理系统从来自受试者的无细胞DNA样品获得全基因组序列数据,其中所述全基因组序列数据包括多个全基因组序列读段;/n(b)通过所述数据处理系统从所述多个基因组序列读段的至少大多数中计算两个或更多个度量,其中所述两个或更多个度量中的第一度量为:/n(i)所述无细胞DNA的片段大小,/n(ii)所述多个全基因组序列读段的相对读段深度,或/n(iii)种系等位基因失衡;/n(c)通过所述数据处理系统将所述两个或更多个度量输入分类器中以获得对第一类的第一预测和对第二类的第二预测,其中所述第一类为包括循环肿瘤DNA的所述无细胞DNA样品并且所述第二类为不包括所述循环...

【技术特征摘要】
【国外来华专利技术】20181221 US 62/7838011.一种方法,其包括:
(a)通过数据处理系统从来自受试者的无细胞DNA样品获得全基因组序列数据,其中所述全基因组序列数据包括多个全基因组序列读段;
(b)通过所述数据处理系统从所述多个基因组序列读段的至少大多数中计算两个或更多个度量,其中所述两个或更多个度量中的第一度量为:
(i)所述无细胞DNA的片段大小,
(ii)所述多个全基因组序列读段的相对读段深度,或
(iii)种系等位基因失衡;
(c)通过所述数据处理系统将所述两个或更多个度量输入分类器中以获得对第一类的第一预测和对第二类的第二预测,其中所述第一类为包括循环肿瘤DNA的所述无细胞DNA样品并且所述第二类为不包括所述循环肿瘤DNA的所述无细胞DNA样品;以及
(d)通过所述数据处理系统,基于所述第一预测和所述第二预测将所述无细胞DNA样品分类为所述第一类或所述第二类。


2.根据权利要求1所述的方法,其中所述两个或更多个度量中的第二度量为:
(i)所述无细胞DNA的片段大小,
(ii)所述多个全基因组序列读段的相对读段深度,或
(iii)种系等位基因失衡;并且
其中所述第二度量与所述第一度量不同。


3.根据权利要求1或2所述的方法,其中所述分类器为线性判别分析。


4.根据权利要求1、2或3所述的方法,其中计算第三度量并将其输入所述分类器中,所述第三度量为:
(i)所述无细胞DNA的片段大小,
(ii)所述多个全基因组序列读段的相对读段深度,或
(iii)种系等位基因失衡;并且
其中所述第一度量、所述第二度量和所述第三度量中的每一者都是不同的度量。


5.根据权利要求1至4中任一项所述的方法,其中通过将在所述样品中获得的无细胞DNA片段大小进行标准化,从而获得概率密度函数值,来计算所述无细胞DNA的所述片段大小。


6.根据权利要求1至4中任一项所述的方法,其中所述无细胞DNA的所述片段大小包括概率密度函数内的区域的比率。


7.根据权利要求6所述的方法,其中所述概率密度函数内的区域的比率包括:长度为介于约116个与约156个核苷酸之间的无细胞DNA片段大小的概率的比率,以及长度为介于约164个与约168个核苷酸之间的模式附近的无细胞DNA片段大小的概率的比率。


8.根据权利要求1至4中任一项所述的方法,其中所述无细胞DNA的所述片段大小是通过以下方式计算出的统计片段得分:
(i)将在所述样品中获得的无细胞DNA片段大小进行标准化,从而获得概率密度函数值;
(ii)确定所述无细胞DNA片段大小的值的对数及连续无细胞DNA片段大小之间的一阶差分;
(iii)除去至少20个最低的无细胞DNA片段大小,以获得剩余的无细胞DNA片段大小;以及
(iv)与包括所述循环肿瘤DNA的无细胞DNA以及不包括所述循环肿瘤DNA的无细胞DNA相比,确定所述剩余的无细胞DNA片段大小的第一主成分轴。


9.根据权利要求1至8中任一项所述的方法,其中所述多个全基因组序列读段的相对读段深度通过以下方...

【专利技术属性】
技术研发人员:蔡明阳F·卡西冯靓A·洛夫乔伊
申请(专利权)人:豪夫迈·罗氏有限公司
类型:发明
国别省市:瑞士;CH

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1