靶向基因二代测序数据体细胞突变检测方法、终端及介质技术

技术编号:38008471 阅读:11 留言:0更新日期:2023-06-30 10:26
本发明专利技术涉及基因检测的技术领域,尤其是涉及一种靶向基因二代测序数据体细胞突变检测方法、终端及介质,包括:获取待测序数据,对待测序数据进行预处理,从预处理结果中进行唯一分子标记,得到标准测序数据;获取参考基因组,根据唯一分子标记将标准测序数据与参考基因组进行比对,得到对应的比对结果;根据对唯一分子标记的比对结果,对标准测序数据进行去重处理,得到一致性序列;根据一致性序列进行变异检测,得到对应的检测结果;根据结果生成突变检测分析报告。本申请具有同时支持肿瘤单样本和肿瘤/对照配对样本的检测分析模式的效果。果。果。

【技术实现步骤摘要】
靶向基因二代测序数据体细胞突变检测方法、终端及介质


[0001]本专利技术涉及基因检测的
,尤其是涉及一种靶向基因二代测序数据体细胞突变检测方法、终端及介质。

技术介绍

[0002]随着二代测序技术的快速发展,靶向基因检测越来越多地被用于临床辅助诊断、用药指导以及预后评估。随着数据量和复杂性的增加,开发一套全面、准确、稳定、高效的数据分析方法及流程变得至关重要。目前已有的数据分析方法可归纳为:通常包含“测序数据质控”、“比对参考基因组”、“比对结果质控”、“变异检测”以及“结果报告”等分析步骤,样本类型包含肿瘤单样本或者肿瘤和对照配对样本,检测的变异类型包含“单核苷酸变异”、“插入缺失变异”、“拷贝数变异”、“基因融合”、“肿瘤突变负荷”以及“微卫星不稳定性”等变异类型中的一种或几种,多采用一些常用的开源的分析软件或工具。
[0003]上述中的现有技术方案存在以下缺陷:现有的分析方法大多只支持肿瘤/对照配对样本模式,然而很多时候仅有肿瘤样本而对照样本由于各种因素无法获得,因此需要开发同时支持肿瘤单样本的分析方法。

技术实现思路

[0004]为了提供一种同时支持肿瘤单样本和肿瘤/对照配对样本的检测分析模式,本申请提供一种靶向基因二代测序数据体细胞突变检测方法、终端及介质。
[0005]本申请的上述专利技术目的一是通过以下技术方案得以实现的:一种靶向基因二代测序数据体细胞突变检测方法,所述靶向基因二代测序数据体细胞突变检测方法包括:获取待测序数据,对所述待测序数据进行预处理,从预处理结果中进行唯一分子标记,得到标准测序数据;获取参考基因组,根据所述唯一分子标记将所述标准测序数据与所述参考基因组进行比对,得到对应的比对结果;根据对所述唯一分子标记的所述比对结果,对所述标准测序数据进行去重处理,得到一致性序列;根据所述一致性序列进行变异检测,得到对应的检测结果,其中,所述变异检测包括单核苷酸变异和短插入缺失变异检测、拷贝数变异检测、基因融合检测、肿瘤突变负荷检测以及微卫星不稳定性检测;根据所述结果生成突变检测分析报告。
[0006]通过采用上述技术方案,能够对包含唯一分子标记的数据根据该唯一分子标记的类型进行适应性纠正,同时对标准测序数据进行去重处理,能够将染色体通过PCR测序时重复的基因片段序列进行去除,从而提升得到的一致性序列与采样的个体的实际序列的吻合度更高,从而提升了检测精度;同时,对该测试数据进行单核苷酸变异和短插入确实变异,
能够同时对有对照样本或者单样本的肿瘤样本进行测试,从而能够对于缺乏正常配对样本的肿瘤样本也能够快速准确地检测出各种突变,并结合对应的拷贝数变异、基因融合、肿瘤突变负荷、微卫星不稳定性等突变及标志物的检测,能够挖掘更多肿瘤精准治疗靶点信息,为患者选择潜在获益的靶向药物提供更多帮助。
[0007]本申请在一较佳示例中可以进一步配置为:所述获取待测序数据,对所述待测序数据进行预处理,从预处理结果中进行唯一分子标记,得到标准测序数据,具体包括:通过预设的指令将所述待测序数据进行拆分,得到大小相等的待标记数据;识别每个所述待标记数据,若识别到所述唯一分子标记,则对所述待标记数据标注序列注释信息,得到注释数据,否则作为未注释数据;对所述未注释数据和所述注释数据进行清洗,去除多余序列数据后,将清洗后的注释数据和未注释数据进行合并,得到所述标准测序数据。
[0008]通过采用上述技术方案,对待测序数据进行拆分,得到大小相等的待标记数据,能够利用多线程运算提升测序数据比对的效率,同时能够去除测序数据中的接头序列、低质量值序列以及未知碱基含量过高的序列等,减少不必要的文件产生;同时,通过判断是否包含唯一分子标记从而进行注释,得到未注释数据和注释数据,从而能够对针对肿瘤DNA样本记性对应的数据分析,从而提升了测试的适用性。
[0009]本申请在一较佳示例中可以进一步配置为:所述获取参考基因组,根据所述唯一分子标记将所述标准测序数据与所述参考基因组进行比对,得到对应的比对结果,具体包括:获取所述唯一分子标记将所述标准测序数据与所述参考基因组进行比对的第一比对结果,并将所述标注序列注释信息附加到所述第一比对结果,得到第二比对结果;获取所述参考基因组的坐标信息,根据所述坐标信息对所述第二比对结果进行排序后,得到所述比对结果。
[0010]通过采用上述技术方案,根据唯一份子标记将标准测序数据与参考基因组进行比对,根据第一比对结果附加该标注序列注释信息,从而能够基于该参考基因组便于对标准测序数据进行分析,同时根据该坐标信息对第二比对结果进行排序,从而能够使得得到的比对结果能够按照参考的基因序列进行排序,便于后续进行基因突变的检测。
[0011]本申请在一较佳示例中可以进一步配置为:所述根据对所述唯一分子标记的所述比对结果,对所述标准测序数据进行去重处理,得到一致性序列,具体包括:获取所述未注释数据在所述参考基因组上的第一起始终止位置,根据所述第一起始终止位置标记为第一重复序列;获取所述注释数据在所述参考基因组上的第二起始终止位置,根据所述第二起始终止位置在所述参考基因组上获取比对序列注释信息,并将所述比对序列注释信息与对应的所述序列注释信息进行比对;若比对不一致,则将所述注释数据标记为第二重复序列,并去除所述第一重复序列和所述第二重复序列;若比对一致,则将所述注释数据和所述参考基因组对应的序列作为待处理数据组,判断每组所述待处理数据组的唯一分子标记类型,根据所述唯一分子标记类型进行一致性处理,得到所述一致性序列。
[0012]通过采用上述技术方案,由于在通过PCR测得样本基因序列时,需要对应的引物进行DNA的提取,同时,测得的结果也可能因为染色体比较接近导致的识别错误,因此,通过根据未注释数据和注释数据标记第一和第二重复序列,去除该重复数据,从而能够将识别错误的序列去除,同时,针对注释数据,根据唯一分子标记类型进行对应的一致性处理,从而能够将引物序列等其他错误序列去除,使得得到的一致性序列与样本实际的序列更加吻合。
[0013]本申请在一较佳示例中可以进一步配置为:所述根据所述一致性序列进行变异检测,得到对应的检测结果,其中,所述单核苷酸变异和短插入缺失变异检测具体包括:对所述一致性序列进行单样本变异检测,得到变异检测原始结果,并对所述变异检测原始结果进行标准化处理,得到第一变异标准化结果;对所述第一变异标准化结果进行基础过滤,以去除所述变异标准化结果中的假阳性变异和胚系变异,得到第一基础变异结果;从所述基础变异结果中筛选出体细胞变异数据,对所述细胞变异数据进行变异位点链偏好过滤、基于基因组重复区域及问题区域的过滤、低等位基因频率变异过滤以及基于自建背景噪声数据数据库过滤,得到第一高级变异结果;对所述第一高级变异结果进行功能过滤后,得到第一体细胞单核苷酸和短插入缺失变异数据。
[0014]通过采用上述技术方案,由于在肿瘤/对照配对样本中,在检测过程中基于对照配对样本就可以过滤胚系突变,就可以得到体细胞突变;对于肿瘤单样本,首先检出所有的突变,既包本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种靶向基因二代测序数据体细胞突变检测方法,其特征在于,所述靶向基因二代测序数据体细胞突变检测方法包括:获取待测序数据,对所述待测序数据进行预处理,从预处理结果中进行唯一分子标记,得到标准测序数据;获取参考基因组,根据所述唯一分子标记将所述标准测序数据与所述参考基因组进行比对,得到对应的比对结果;根据对所述唯一分子标记的所述比对结果,对所述标准测序数据进行去重处理,得到一致性序列;根据所述一致性序列进行变异检测,得到对应的检测结果,其中,所述变异检测包括单核苷酸变异和短插入缺失变异检测、拷贝数变异检测、基因融合检测、肿瘤突变负荷检测以及微卫星不稳定性检测;根据所述结果生成突变检测分析报告。2.根据权利要求1所述的靶向基因二代测序数据体细胞突变检测方法,其特征在于,所述获取待测序数据,对所述待测序数据进行预处理,从预处理结果中进行唯一分子标记,得到标准测序数据,具体包括:通过预设的指令将所述待测序数据进行拆分,得到大小相等的待标记数据;识别每个所述待标记数据,若识别到所述唯一分子标记,则对所述待标记数据标注序列注释信息,得到注释数据,否则作为未注释数据;对所述未注释数据和所述注释数据进行清洗,去除多余序列数据后,将清洗后的注释数据和未注释数据进行合并,得到所述标准测序数据。3.根据权利要求2所述的靶向基因二代测序数据体细胞突变检测方法,其特征在于,所述获取参考基因组,根据所述唯一分子标记将所述标准测序数据与所述参考基因组进行比对,得到对应的比对结果,具体包括:获取所述唯一分子标记将所述标准测序数据与所述参考基因组进行比对的第一比对结果,并将所述标注序列注释信息附加到所述第一比对结果,得到第二比对结果;获取所述参考基因组的坐标信息,根据所述坐标信息对所述第二比对结果进行排序后,得到所述比对结果。4.根据权利要求2所述的靶向基因二代测序数据体细胞突变检测方法,其特征在于,所述根据对所述唯一分子标记的所述比对结果,对所述标准测序数据进行去重处理,得到一致性序列,具体包括:获取所述未注释数据在所述参考基因组上的第一起始终止位置,根据所述第一起始终止位置标记为第一重复序列;获取所述注释数据在所述参考基因组上的第二起始终止位置,根据所述第二起始终止位置在所述参考基因组上获取比对序列注释信息,并将所述比对序列注释信息与对应的所述序列注释信息进行比对;若比对不一致,则将所述注释数据标记为第二重复序列,并去除所述第一重复序列和所述第二重复序列;若比对一致,则将所述注释数据和所述参考基因组对应的序列作为待处理数据组,判断每组所述待处理数据组的唯一分子标记类型,根据所述唯一分子标记类型进行一致性处
理,得到所述一致性序列。5.根据权利要求1所述的靶向基因二代测序数据体细胞突变检测方法,其特征在于,所述根据所述一致性序列进行变异检测,得到对应的检测结果,其中,所述单核苷酸变异和短插入缺失变异检测具体包括:对所述一致性序列进行单样本变异检测,得到变异检测原始结果,并对所述变异检测原始结果进行标准化处理,得到第一变异标准化结果;对所述第一变异标准化结果进行基础过滤,以去除所述变异标准化结果中的假阳性变异和胚系变异,得到第一基础变异...

【专利技术属性】
技术研发人员:李尔汉杨冬成邓泱泱李梦真资意蔡兴盛陈敬臣李金辉
申请(专利权)人:广州迈景基因医学科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1