血液系统疾病NGS报告解读方法技术方案

技术编号:34607033 阅读:22 留言:0更新日期:2022-08-20 09:11
本发明专利技术涉及一种血液系统疾病NGS报告解读方法,属于生信解读领域,包括以下步骤:S1:上传生信分析的结果数据vcf文件;S2:判断上传文件是否为注释文件,若是注释文件则执行步骤S4,否则执行步骤S3;S3:获取样本对应检测项目相关过滤条件进行过滤处理并生成注释文件;S4:读取注释文件中的变异位点信息并结构化保存;S5:匹配知识库中的变异位点信息;S6:获取报告数据;S7:根据送检单位获取报告模板;S8:生成报告并导出。本发明专利技术实现了便捷地管理数据和快速地输出报告,帮助用户实现基因数据的智能化管理,全面提升报告解读能力,极大地提高了效率。了效率。了效率。

【技术实现步骤摘要】
血液系统疾病NGS报告解读方法


[0001]本专利技术属于生信解读领域,涉及一种血液系统疾病NGS报告解读方法。

技术介绍

[0002]高通量测序技术(NGS)能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志,通过读取多个短DNA片段,拼接成完整的序列信息。NGS生信流程可分为三个层级:一级信息分析——下机原始数据(BCL格式)转换为可读数据(VCF格式);二级信息分析——针对VCF数据进行位点注释过滤等;三级信息分析——结合患者临床诊疗情况,对突变基因位点进行临床意义解读。其中报告解读是最后也是最重要的环节。二代测序的报告解读需要查找大量的数据库和专业文献,面临数据量大、操作繁琐、查询困难等问题,一份肿瘤报告完全人工解读6小时左右。

技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种血液系统疾病NGS报告解读方法。
[0004]为达到上述目的,本专利技术提供如下技术方案:
[0005]一种血液系统疾病NGS报告解读方法,包括以下步骤:
[0006]S1:上传生信分析的结果数据vcf文件;
[0007]S2:判断上传文件是否为注释文件,若是注释文件则执行步骤S4,否则执行步骤S3;
[0008]S3:获取样本对应检测项目相关过滤条件进行过滤处理并生成注释文件;
[0009]S4:读取注释文件中的变异位点信息并结构化保存;
[0010]S5:匹配知识库中的变异位点信息;
[0011]S6:获取报告数据;
[0012]S7:根据送检单位获取报告模板;
[0013]S8:生成报告并导出。
[0014]进一步,所述知识库中包括以下结构信息:
[0015]基因:收录人体基因相关的信息,包括基因的基础信息、描述信息和其他相关信息,所述基础信息包括基因名称、基因位置、基因类型以及常用转录本,所述其他相关信息包括基因的蛋白结构域、相关疾病以及证据;
[0016]变异:分为母变异和子变异;
[0017]母变异:将通用的变异相关信息整合归纳,并对其进行变异等级分级,并将该类型的子变异关联到该母变异,同时进行归纳总结该母变异的变异描述内容,根据该类型母变异的相关疾病整理疾病对应的变异总结信息,根据靶向用药、治疗、预后、诊断、风险、临床特征、人群分布、药物代谢多种类型将相关证据整理证据汇总信息;
[0018]子变异:包括多种类型,每种类型子变异的详情中包含该变异相关基础信息、变异描述信息和分级信息,并关联相关的母变异信息,同时根据该子变异相关的疾病整理变异
总结信息,根据靶向用药、治疗、预后、诊断、风险、临床特征、人群分布、药物代谢多种类型将相关证据整理证据汇总信息;
[0019]证据:包含批准用药、指南、临床试验以及文献证据,通过对不同类型文献的解读,总结出文献针对的基因、变异、疾病,以及证据类型、证据关系和证据定级相关信息;
[0020]疾病:收录临床血液相关疾病,并按照疾病进行分级处理。
[0021]进一步,所述子变异类型包括:
[0022]SNP/InDel:单碱基变异,以及小片段的插入缺失;
[0023]Fusion:融合基因,两个基因拼接在一起;
[0024]CNV:拷贝数变异,大片段的重复;
[0025]SV:其他结构性变异。
[0026]进一步,步骤S5所述的匹配知识库中的变异位点信息具体包括:
[0027]对每一个位点信息进行是否移码热点变异判断,若为移码热点变异,则通过transvar进行校正;接着进行位点知识库匹配,通过基因、转录本、p点进行匹配,若匹配到了多条知识库变异位点,则优先取c点为空的那个变异位点,如果没有匹配到变异位点,则通过基因、转录本、c点进行匹配,若匹配到变异位点信息,则返回变异位点解读信息;
[0028]若未匹配到的变异为移码或热点变异类型时,则通过该变异位点匹配母变异,若匹配到相应母变异位点信息为有临床意义,则表明这个未记录到知识库的位点为有临床意义的变异位点,将自动根据相关信息,对位点做分级和初步解读,同时记录到知识库中进行标记,等待专家解读;
[0029]若未匹配到变异位点信息,则根据情况选择进入人工解读阶段,最后通过报告解读人员确认报告位点并生成报告。
[0030]进一步,解读的具体内容如下:
[0031]根据变异位点分级,找出有临床意义和潜在临床意义变异;根据患者临床诊断疾病在疾病树的层级关系,对同一变异下靶向用药、治疗、预后、诊断、风险、临床特征、人群分布、药物代谢等多条不同维度的证据做权重打分,找出最佳解读数据;
[0032]证据权重打分:变异的所有证据包括证据类型、证据标签、相关疾病三个维度,在解读时根据样本信息和报告用途对这三个维度做打分,分值低者为最佳解读证据;
[0033]证据类型:包括批准用药、指南、临床试验以及文献类型,用于判断条件报告用途;
[0034]证据标签:包括治疗、预后、诊断、风险、临床特征、人群分布标签,也用于判断条件报告用途;
[0035]相关疾病:根据与样本信息中患者诊断疾病在疾病数中层级关系判断分值,规则如下:本节点和子级节点优先级一样打1分,本节点兄弟节点及其下子节点打分1.5分,父节点分数为2分,父节兄弟节点及其下子节点打分2.5分,以此逻辑逐级评分,所有证据;
[0036]得到三个维度评分后,根据需要将三个评分相乘获取最匹配证据,或将三个维度分组排序,选择最佳解读数据生成报告。
[0037]本专利技术的有益效果在于:本专利技术通过将生信分析结果结构化保存,方便用户更准确的,多维度的解读位点数据;可以通过基因位点快速查询到详细的解读信息,查看与之相关的功能影响、疾病、药物等信息,每一条信息都可以方便地追溯到信息源头的原文,并且可以根据最新的研究及时更新解读内容;已经解读过的内容会逐渐沉淀形成知识库,用户
上传二代测序数据后会自动匹配知识库,标示出已经解读过的基因位点,帮助用户进行位点筛选。每一条解读信息都可以按照信息来源、基因变异类型、疾病、药物等多个维度信息。用户通过选择需要写入报告的基因位点,即可一键生成报告,从上传测序数据到出报告,短短几分钟就能完成。
[0038]本专利技术的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本专利技术的实践中得到教导。本专利技术的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
[0039]为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作优选的详细描述,其中:
[0040]图1为血液系统疾病NGS报告解读方法整体流程图;
[0041]图2为知识库结构图;
[0042]图3为自动+人工匹配流程图;
[0043]图4为自动+人工匹配具体实施图;
[0044]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种血液系统疾病NGS报告解读方法,其特征在于:包括以下步骤:S1:上传生信分析的结果数据vcf文件;S2:判断上传文件是否为注释文件,若是注释文件则执行步骤S4,否则执行步骤S3;S3:获取样本对应检测项目相关过滤条件进行过滤处理并生成注释文件;S4:读取注释文件中的变异位点信息并结构化保存;S5:匹配知识库中的变异位点信息;S6:获取报告数据;S7:根据送检单位获取报告模板;S8:生成报告并导出。2.根据权利要求1所述的血液系统疾病NGS报告解读方法,其特征在于:所述知识库中包括以下结构信息:基因:收录人体基因相关的信息,包括基因的基础信息、描述信息和其他相关信息,所述基础信息包括基因名称、基因位置、基因类型以及常用转录本,所述其他相关信息包括基因的蛋白结构域、相关疾病以及证据;变异:分为母变异和子变异;母变异:将通用的变异相关信息整合归纳,并对其进行变异等级分级,并将该类型的子变异关联到该母变异,同时进行归纳总结该母变异的变异描述内容,根据该类型母变异的相关疾病整理疾病对应的变异总结信息,根据靶向用药、治疗、预后、诊断、风险、临床特征、人群分布、药物代谢多种类型将相关证据整理证据汇总信息;子变异:包括多种类型,每种类型子变异的详情中包含该变异相关基础信息、变异描述信息和分级信息,并关联相关的母变异信息,同时根据该子变异相关的疾病整理变异总结信息,根据靶向用药、治疗、预后、诊断、风险、临床特征、人群分布、药物代谢多种类型将相关证据整理证据汇总信息;证据:包含批准用药、指南、临床试验以及文献证据,通过对不同类型文献的解读,总结出文献针对的基因、变异、疾病,以及证据类型、证据关系和证据定级相关信息;疾病:收录临床血液相关疾病,并按照疾病进行分级处理。3.根据权利要求1所述的血液系统疾病NGS报告解读方法,其特征在于:所述子变异类型包括:SNP/InDel:单碱基变异,以及小片段的插入缺失;Fusion:融合基因,两个基因拼接在一起;CNV:拷贝数变异,大片段的重复;SV:其他结构性变异。4.根据权利要求1...

【专利技术属性】
技术研发人员:付海阔王奇隆舒金才陈金雄尚华
申请(专利权)人:北京高灵智腾信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1