体细胞变异分类方法、装置、设备及可读存储介质制造方法及图纸

技术编号:24038428 阅读:94 留言:0更新日期:2020-05-07 02:36
本发明专利技术涉及一种有利于提高分类一致性的体细胞变异评估分类方法、装置、计算机设备和计算机可读存储介质。该体细胞变异分类方法根据所述待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对所述待分析差异位点作临床意义分类分析。本发明专利技术研究细化标准,对多项公共生物医学数据库进行数据抓取和数据整理,再结合中国人群数据库、肿瘤阳性位点数据库、变异解析报告注释库,搭建了一套体细胞变异分类方法及装置,适用于高通量测序结果体细胞变异的分析解读,其具有操作简便、高效、应用性强等优势,分类结果一致性高,可用于辅助临床应用,较人工分类可以节省大量的时间。

Methods, devices, devices and readable storage media of somatic variation classification

【技术实现步骤摘要】
体细胞变异分类方法、装置、设备及可读存储介质
本专利技术涉及生物信息学及分子生物学
,尤其是涉及一种体细胞变异分类方法、装置、计算机设备及可读存储介质。
技术介绍
在临床基因组实验室中,高通量测序是一项必备检测技术,从外周血、骨髓穿刺液、福尔马林固定石蜡包埋组织、新鲜组织、血浆等生物样本中分析测定基因序列,用于多种癌症的辅助诊断、预后评估和用药指导。参照2017年AMP、ASCO和CAP联合发布的癌症变异解读及报告标准,癌症体细胞变异可分为五大类临床意义:强临床意义、潜在临床意义、临床意义未明、疑似良性和良性。然而指南对于每一分类仅给出了提纲领性的判断标准,实际结果多通过人工解读数据。随着癌症研究的不断深入,癌症样本检测数和检测基因数不断增多,实验室检测得到的变异数也不断增多,同时新的临床试验及公共数据库不断翻新,人工解读数据消耗时间越来越长,而且不同解读人员对解读判定规则理解不同,使得变异的分类解读一致率不高。
技术实现思路
基于此,有必要提供一种有利于提高分类一致性的体细胞变异分类方法、装置、计算机设备和计算机可读存储介质。一种体细胞变异分类方法,包括如下步骤:获取待评估样本的高通量测序数据;将所述高通量测序数据与参考序列进行比对,得到关于所述高通量测序数据中相对于所述参考序列的待分析差异位点;根据所述待分析差异位点的测序质量值判断所述待分析差异位点质量是否在控;对于质量在控的所述待分析差异位点,获取所述待分析差异位点的发生率和纯合值;r>对于质量在控的所述待分析差异位点,对所述待分析差异位点的位置和变异类型分别作注释标签;对于质量在控的所述待分析差异位点,对所述待分析差异位点作基因功能注释标签;对于质量在控的所述待分析差异位点,获取所述待分析差异位点的变异位点收录病例值;根据所述待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对所述待分析差异位点作临床意义分类分析。一种体细胞变异分类装置,包括:测序数据获取模块,用于获取待评估样本的高通量测序数据;待分析差异位点获取模块,用于将所述高通量测序数据与参考序列进行比对,得到关于所述高通量测序数据中相对于所述参考序列的待分析差异位点;质量控制模块,用于根据所述待分析差异位点的测序质量值判断所述待分析差异位点质量是否在控;发生率和纯合值获取模块,用于对于质量在控的所述待分析差异位点,获取所述待分析差异位点的发生率和纯合值;位置和变异类型注释模块,用于对于质量在控的所述待分析差异位点,对所述待分析差异位点的位置和变异类型分别作注释标签;基因功能注释模块,用于对于质量在控的所述待分析差异位点,对所述待分析差异位点作基因功能注释标签;收录病例值获取模块,用于对于质量在控的所述待分析差异位点,获取所述待分析差异位点的变异位点收录病例值;以及临床意义分类模块,用于根据所述待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对所述待分析差异位点作临床意义分类分析。一种计算机设备,具有处理器和存储器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例所述的体细胞变异分类方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被执行时实现上述任一实施例所述的体细胞变异分类方法的步骤。传统的指南对于每一分类仅提纲领性的判断标准,使人工解读带有差异,为解决这一问题,本专利技术研究细化标准,对多项公共生物医学数据库进行数据抓取和数据整理,再结合中国人群数据库、肿瘤阳性位点数据库、变异解析报告注释库,搭建了一套体细胞变异分类方法及装置,适用于高通量测序结果体细胞变异的分析解读,其具有操作简便、高效、应用性强等优势,分类结果一致性高,可用于辅助临床应用,较人工分类可以节省大量的时间。附图说明图1为本专利技术一实施例的体细胞变异分类方法的基本流程示意图;图2为本专利技术一实施例的体细胞变异分类装置的基本结构框架图;图3为案例1中比对后变异位点的原始VCF文件示例图;图4为案例1中经评估分类后变异位点导出文件示例图。具体实施方式为了便于理解本专利技术,下面将参照相关附图对本专利技术进行更全面的描述。附图中给出了本专利技术的较佳实施例。但是,本专利技术可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本专利技术的公开内容的理解更加透彻全面。除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。本文所述的“差异位点”是指与参考序列比对不同的位点,例如与hg19参考序列中不同的位点;所述的“变异位点”是指根据文献等证据附上意义后的差异位点;所述的“测序质量”是指对于实验方法和仪器运行导致的测序错误与真实值之间比较后得出的可信值;所述的变异位点“发生率”是指为特定人群中,某等位基因携带者的在总群体中占比;所述的变异位点“纯合值”是指为特定人群中,等位基因为纯合的携带者个数;所述的“原癌基因”、“抑癌基因”、“功能未明”以及“遗传相关”分别是指存在于生物正常细胞基因组中的癌基因、一类存在于正常细胞内可抑制细胞生长并具有潜在抑癌作用的基因、功能尚未研究明确的基因、研究证实基因功能导致遗传性疾病的基因;所述的“变异位点收录病例值”是指变异位点在特定数据库中特定人群的病例数;所述的“强临床意义”是指根据药物说明书、指南、专家共识或权威文献中在诊断、预后和治疗中有意义的变异位点;“潜在临床意义”是指小标本的文献、非直接但相关病种或研究明确的功能域在诊断、预后和治疗中有意义的变异位点;“临床意义未明”是指无文献报道的变异位点;“疑似良性”是指在人群数据库有低比例发生率且无在诊断、预后和治疗中有意义报道的变异位点;“良性”即SNP位点,在人群发生率大于等于1%的变异位点。如图1所示,本专利技术一实施例提供了一种体细胞变异分类方法,其包括如下步骤:步骤S110:获取待评估样本的高通量测序数据;步骤S120:将高通量测序数据与参考序列进行比对,得到关于高通量测序数据中相对于所述参考序列的待分析差异位点;步骤S130:根据待分析差异位点的测序质量值判断待分析差异位点质量是否在控;步骤S140:对于质量在控的待分析差异位点,获取待分析差异位点的发生率和纯合值;步骤S150:对于质量在控的待分析差异位点,对待分析差异位点的位置和变异类型分别作注释标签;步骤S160:对于质量在控的待分析差异位点,对待分析差异位点作基因功能注释标签;步骤S170:对本文档来自技高网...

【技术保护点】
1.一种体细胞变异分类方法,其特征在于,包括如下步骤:/n获取待评估样本的高通量测序数据;/n将所述高通量测序数据与参考序列进行比对,得到关于所述高通量测序数据中相对于所述参考序列的待分析差异位点;/n根据所述待分析差异位点的测序质量值判断所述待分析差异位点质量是否在控;/n对于质量在控的所述待分析差异位点,获取所述待分析差异位点的发生率和纯合值;/n对于质量在控的所述待分析差异位点,对所述待分析差异位点的位置和变异类型分别作注释标签;/n对于质量在控的所述待分析差异位点,对所述待分析差异位点作基因功能注释标签;/n对于质量在控的所述待分析差异位点,获取所述待分析差异位点的变异位点收录病例值;/n根据所述待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对所述待分析差异位点作临床意义分类分析。/n

【技术特征摘要】
1.一种体细胞变异分类方法,其特征在于,包括如下步骤:
获取待评估样本的高通量测序数据;
将所述高通量测序数据与参考序列进行比对,得到关于所述高通量测序数据中相对于所述参考序列的待分析差异位点;
根据所述待分析差异位点的测序质量值判断所述待分析差异位点质量是否在控;
对于质量在控的所述待分析差异位点,获取所述待分析差异位点的发生率和纯合值;
对于质量在控的所述待分析差异位点,对所述待分析差异位点的位置和变异类型分别作注释标签;
对于质量在控的所述待分析差异位点,对所述待分析差异位点作基因功能注释标签;
对于质量在控的所述待分析差异位点,获取所述待分析差异位点的变异位点收录病例值;
根据所述待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对所述待分析差异位点作临床意义分类分析。


2.如权利要求1所述的体细胞变异分类方法,其特征在于,所述根据所述待分析差异位点的测序质量值判断所述待分析差异位点质量是否在控包括:
结合同批次多个样本的同位点的测序质量情况得到待分析差异位点的测序质量值;
根据所述测序质量值是否满足预设的质量阈值标准判断所述待分析差异位点质量是否在控,所述预设的质量阈值标准为同批次样本中所述待分析差异位点出现次数≥50%,且历史批次样本中所述待分析差异位点突变频率<10%且出现次数≥10%,且历史批次样本中所述待分析差异位点突变频率<5%且出现次数≥5%;
将不满足所述预设的质量阈值标准的质量不在控的所述待分析差异位点列入排除结果不进行后续分析处理。


3.如权利要求1或2所述的体细胞变异分类方法,其特征在于,所述对于质量在控的所述待分析差异位点,获取所述待分析差异位点的发生率和纯合值包括:
判断质量在控的所述待分析差异位点是否收录于目标数据库中,对于收录在所述目标数据库中的所述待分析差异位点,返回其发生率和纯合值;
所述目标数据库包括gnomAD数据库、EXAC数据库、1000g数据库、esp6500数据库以及根据历史数据预先构建的中国人群遗传数据库中的至少一种。


4.如权利要求3所述的体细胞变异分类方法,其特征在于,所述对于质量在控的所述待分析差异位点,对所述待分析差异位点的位置和变异类型分别作注释标签包括:
根据参考转录本信息对所述待分析差异位点的位置和变异类型分别作注释标签;
所述位置注释标签包括:外显子、内含子、UTR3和UTR5;所述变异类型注释标签包括:同义突变、剪接、移码删除、移码插入、非移码删除、非移码插入、错义突变、无义突变和终止子突变。


5.如权利要求4所述的体细胞变异分类方法,其特征在于,所述对于质量在控的所述待分析差异位点,对所述待分析差异位点作基因功能注释标签包括:
根据公共循证证据和/或根据历史结果预先构建的变异解析报告注释库对所述待分析差异位点作基因功能注释标签;
所述基因功能注释标签包括:原癌基因、抑癌基因、功能未明和遗传相关。


6.如权利要求5所述的体细胞变异分类方法,其特征在于,所述对于质量在控的所述待分析差异位点,获取所述待分析差异位点的变异位点收录病例值包括:
根据公共癌症数据库和/或根据历史结果预先构建的肿瘤阳性位点数据库,判断所述待分析差异位点是否收录于相应的数据库中,对于收录于相应数据库中的待分析差异位点,返回其变异位点收录病例值;
所述公共癌症数据库包括COSMIC数据库、OncoKB数据库、ClinVar数据库和OMIN数据库中的至少一种。


7.如权利要求6所述的体细胞变异分类方法,其特征在于,所述根据所述待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对所述待分析差异位点作临床意义分类分析包括:
将所述发生率不小于预设的SNP阈值的质量在控的所述待分析差异位点列入SNP分类结果;所述预设的SNP阈值为在gnomAD数据库、EXAC数据库、1000g数据库和/或esp6500数据库中发生率为1%,或在根据历史数据预先构建的中国人群遗传数据库中发生率为0.2%;
对于所述发生率小于预设的SNP阈值且纯合值>0的质量在控的所述待分析差异位点,或所述位置注释标签为内含子或UTR3或UTR5的质量在控的所述待分析差异位点,或所述变异类型注释标签为同义突变的质量在控的所述待分析差异位点,将其列入TierIV分类结果;
对所述基因功能注释标签为抑癌基因、且位置注释标签为外显子、且变异类型注释标签为剪接或移码删除或移码插入或无义突变或终止子突变、且所述变异位点收录病例值高于预设的第一LOF分类阈值的质量在控的所述待分析差异位点,将其列入TierI分类结果,此处所用的公共癌症数据库包括COSMIC数据库、...

【专利技术属性】
技术研发人员:冯菁华毛琳琳陈禹欣邓俊豪赵纤纤赵薇薇于世辉
申请(专利权)人:广州金域医学检验集团股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1