本申请公开了用于体细胞诊断辅助决策的解读方法及系统,所述解读方法包括:上传测序产生的数据;配置生信脚本对上传的数据进行生信分析,得到生信分析结果,并识别出变异位点;根据注释数据库对生信分析结果中识别的变异位点进行注释,以及根据评级数据库对变异位点进行打分评级;根据预设阈值,对经过变异位点注释和打分评级后的变异位点进行筛选;筛选后的变异位点与变异位点信息库中的数据进行匹配,生成解读报告。本申请根据上传的测序数据自动进行生信分析和生成解读报告,实现了肿瘤评级体系的本地化建设,可以辅助临床医生实现精准诊疗。精准诊疗。精准诊疗。
【技术实现步骤摘要】
用于体细胞诊断辅助决策的解读方法及系统
[0001]本专利技术涉及生物医学
,尤其涉及一种用于体细胞诊断辅助决策的解读方法及系统。
技术介绍
[0002]相关技术中,二代测序(NGS)已成为中国临床肿瘤医生常用检测工具,中国临床肿瘤学会(CSCO)肿瘤生物标志物专家委员会发布的第一个NGS临床应用调研显示,大于30%的肿瘤科医生每月NGS检测量超5个,而中国超过90%临床医生需要NGS报告解读支持。对于医生来说,能否正确理解NGS报告的逻辑结构、抓取关键信息并综合分析,以实际指导临床决策,决定了NGS检测能否为肿瘤患者带来真实的临床获益。
[0003]基于NGS技术检测肿瘤体细胞变异的实验流程可概括为以下几个主要环节:样本采集及质量控制、DNA提取、文库制备、测序、基因组数据生成及数据分析。数据分析可进一步拆解为三个流程:变异识别(variant identification)、变异注释及过滤(variant annotation and prioritization)、变异的临床解读(interpretation of clinical significance)。其中,变异识别、变异注释及过滤经由生物信息学工具实现;而临床解读则需要基于严格的分级逻辑,整合当前公共数据库及已发表文献的海量信息,特别是变异
‑
药物敏感性信息,建立基因变异的临床解读知识库,最终将与送检样本的对应癌种及检出的基因变异相匹配的临床意义(如药物敏感性信息)及其证据级别呈现在NGS报告中。可用于指导基因体细胞变异的临床解读的循证分级系统,包括2017年美国分子病理学协会(AMP)/美国临床肿瘤学会(ASCO)/美国病理学家协会(CAP)联合制定的体细胞变异解读指南,2018年欧洲肿瘤内科学会(ESMO)发布的分子靶点临床可操作性量表(ESCAT)以及纪念斯隆
‑
凯特琳癌症中心(MSKCC)的精准医疗肿瘤数据库(OncoKB)证据等级规则。
[0004]较为常见的方案是生物信息分析员通过一些流程脚本运行各个处理步骤,包含碱基识别和去重复、去除引物序列、去除接头序列、去除低质量碱基、序列比对、去重、插入缺失再比对、校正质量评分、变异判读、注释、筛选,然后由遗传咨询师或分子病理医师进行结果解读并出具临床诊断报告。
技术实现思路
[0005]有鉴于此,本专利技术的目的在于提供一种用于体细胞诊断辅助决策的解读方法及系统,可根据不同的NGS试剂盒对分析工具、变异层面、质控参数、过滤参数、评级方法进行配置,并依据循证医学给出体细胞评级的证据依据及得分,根据证据评分设置对应的阈值计算体细胞评级,给出相应的诊断、药物治疗与预后辅助决策支持。
[0006]为实现上述目的,本专利技术采用以下技术方案:
[0007]第一个方面,本专利技术提供了一种用于体细胞诊断辅助决策的解读方法,步骤包括:
[0008]上传测序产生的数据;
[0009]配置生信脚本对上传的数据进行生信分析,得到生信分析结果,并识别出变异位
点;
[0010]根据注释数据库对生信分析结果中识别的变异位点进行注释,以及根据评级数据库对变异位点进行打分评级;
[0011]根据预设阈值,对经过变异位点注释和打分评级后的变异位点进行筛选;
[0012]筛选后的变异位点与变异位点信息库中的数据进行匹配,生成解读报告。
[0013]作为优选,所述测序,可以是包括扩增、靶向捕获测序、全外显子测序或全基因组测序中的任意一种或更多种。
[0014]作为优选,在上传测序产生的数据之前、过程中或之后,还添加样本信息数据;所述步骤还包括:将样本信息数据与测序产生的数据相关联。例如,所述样本信息数据可以是包括:姓名,性别,年龄,身份证号,送检单位,检测样本,送检医生,送检日期、临床诊断信息、癌种中的任意一种或更多种。
[0015]作为优选,添加样本信息数据与上传测序产生的数据的先后顺序不受限制。
[0016]作为优选,所述生信分析可以是包括SNPInde突变、拷贝数变异CNV、融合基因Fusion、免疫分析TMB/MSI中的任意一种或更多种。
[0017]具体而言,作为优选,例如采用全基因组测序、全外显子测序、大panel试剂盒测序中的一种或更多种数据,可以进行所述SNPIndel突变、拷贝数变异CNV、融合基因Fusion、免疫分析TMB/MSI的生信分析。
[0018]作为优选,测序产生的数据的文件格式,可以是包括fastq、fastq.gz、BAM和VCF中的任意一种或多种。
[0019]作为优选,如果所述文件格式为fastq或fastq.gz格式,所述生信分析包括如下步骤:
[0020]使用Fastp工具和/或FastQC工具对测序产生的文件进行质控过滤,例如,所述质控过滤可以是包括去除低于质量阈值的碱基片段和接头引物,基于测序总数据量、碱基质量分布、read长度分布、Q30中的一个或多个参数对测序数据进行统计;
[0021]使用BWA
‑
mem算法将过滤后的reads与参考基因组进行比对,得到比对后的BAM文件,使用samtools工具根据基因组坐标对BAM文件进行排序、去重和统计,再进行BAM文件的分割;
[0022]基于GATK原理寻找基因组上的变异位点,同时基于nextflow流程串联生信分析工具对变异位点进行分析。
[0023]作为优选,所述评级数据库,基于OncoKB和/或CancerVar肿瘤分级体系。
[0024]上述内容中,所述OncoKB肿瘤分级体系,是根据不同证据水平将肿瘤中基因变异信息分为如下数据等级:Tier I、Tier II、Tier III A、Tier III B和Tier VI,其中,
[0025]Tier I类:是被FDA批准的肿瘤药物biomarkers的变异;
[0026]Tier II类:是NCCN指南或专家共识的,在肿瘤治疗中可作为经FDA批准的肿瘤药物biomarkers的变异;
[0027]Tier III A类:是被认可的临床实验证明的,可以作为肿瘤药物治疗疗效潜在的靶标的变异;
[0028]Tier III B类:是经调查表明某FDA批准或未批准药物在肿瘤标准治疗中可以作为药物疗效biomarkers,但尚未被专家共识认可的变异;
[0029]Tier VI类:是经过高质量的实验或文献报道的可作为肿瘤治疗潜在靶标的变异。
[0030]上述内容中,所述CancerVar肿瘤分级体系,是通过使用机器学习的方法,不仅可以识别体细胞癌突变,还可从肿瘤诊断、预后等多个方面对突变进行解释,能够自动生成包括诊断、预后、靶向药物和位点的临床实验的总结性文本。此外对于未公开报告过的致癌突变,可以通过使用OPAI机器学习的方法,预测突变的致癌性以及药物信息、临床证据等相关的临床信息。
[0031]作为优选,所述对变异位点进行打分本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.用于体细胞诊断辅助决策的解读方法,其特征在于,包括:上传测序产生的数据;配置生信脚本对上传的数据进行生信分析,得到生信分析结果,并识别出变异位点;根据注释数据库对生信分析结果中识别的变异位点进行注释,以及根据评级数据库对变异位点进行打分评级;根据预设阈值,对经过变异位点注释和打分评级后的变异位点进行筛选;筛选后的变异位点与变异位点信息库中的数据进行匹配,生成解读报告。2.根据权利要求1所述的解读方法,其特征在于,在上传测序产生的数据之前、过程中或之后,还添加样本信息数据;所述步骤还包括:将样本信息数据与测序产生的数据相关联。3.根据权利要求1所述的解读方法,其特征在于,所述评级数据库,基于OncoKB和/或CancerVar肿瘤分级体系。4.根据权利要求3所述的解读方法,其特征在于,所述对变异位点进行打分评级,是通过综合OncoKB和CancerVar肿瘤分级体系的评级逻辑,根据注释信息,对检测的变异位点进行肿瘤评级,具体包括:A)获取变异位点在OncoKB数据库和CancerVar数据库这两个评级体系中的评级类别,取较高的评级类别作为此变异位点的肿瘤评级;或者,B)获取变异位点在OncoKB数据库和CancerVar数据库这两个评级体系中的评级类别、以及评级类别对应的评级标准,将样本的临床信息、测序数据的质量与所述评级类别以及评级类别的评级标准进行关联读取,对肿瘤评级进行人工调整。5.根据权利要求1所述的解读方法,其特征在于,所述筛选的维度包括:肿瘤评级、证据维度、可信度维度、本地库及人群库频率维度、蛋白影响维度中的任意一种或更多种;其中,肿瘤评级及证据维度包括肿瘤评级、证据评分、靶向药物、化疗药物、临床实验中的任意一种或多种;可信度维度包括质量评分、总深度、突变深度、突变频率中的任意一种或多种;本地库及人群库频率维度包括本地数据库频率、最小MAF、1000genome中的任意一种或多种;蛋白影响维度包括蛋白影响、危害性中的任意一种或多种。6.根据权利要求1所述的解读方法,其特征在于,所述方法还包括:在生成解读报告之前,对解读结果进行审核,生成初始报告;以及在审核完成后,对初始报告进行复核,复核完成后生成解读报告生成请求。7.根据权利要求1所述的解读方法,其特征在于,所述变异位点信息库包括临床解读库与突变频率库;其中,历史解读数据和...
【专利技术属性】
技术研发人员:梅园,
申请(专利权)人:上海申挚医疗科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。