一种降低靶向二代测序背景噪音的方法技术

技术编号:39821921 阅读:19 留言:0更新日期:2023-12-22 19:41
本发明专利技术提供了一种降低靶向二代测序背景噪音的方法

【技术实现步骤摘要】
一种降低靶向二代测序背景噪音的方法、系统及可存储介质


[0001]本专利技术属于生信分析领域,更具体地,涉及一种降低靶向二代测序背景噪音的方法

系统

设备

计算机可读存储介质及其应用


技术介绍

[0002]单核苷酸突变
(Single nucleotide variant

SNV)
和插入缺失突变
(Insertion/Deletion mutation

InDel)
是人基因组常见的变异类型,很多
SNV

InDel
突变会引起细胞生长异常和失控,影响一系列细胞关键功能的稳态发育

准确检测和鉴定
SNV

InDel
在临床诊断

用药指导

治疗和预后方面有非常重要的作用

随着测序技术和生物信息学的不断发展,越来越多的测序平台和突变识别算法被用来检测...

【技术保护点】

【技术特征摘要】
1.
一种降低靶向二代测序背景噪音的方法,其特征在于,所述方法包括:
S11
:获取待降噪样本的靶向捕获测序数据;
S21
:基于所述待降噪样本的靶向捕获测序数据与参考基因组比对,通过变异检测工具得到包含待降噪样本的
SNV、InDel
突变的文件;
S31
:计算每个待降噪样本的每个位点的正链参考
reads
支持数,记为
VzA
;负链参考
reads
支持数,记为
VfA
;正链突变
reads
支持数,记为
VzB
;负链突变
reads
支持数,记为
VfB
;所述正链参考
reads
支持数和所述正链突变
reads
支持数之和,记为
Zsum
;所述负链参考
reads
支持数和所述负链突变
reads
支持数之和,记为
Fsum

S41
:采用贝塔

二项分布,计算所述
Zsum
和假阳性发生率达到阈值时的正链假阳性
reads
支持数,记为
zN
;计算所述
Fsum
和假阳性发生率达到阈值时的负链假阳性
reads
支持数,记为
fN
;如果
zN≤VzB

fN≤VfB
,则为真阳性位点,否则为假阳性位点;
S5
:去除所述假阳性位点的靶向捕获测序数据
。2.
根据权利要求1所述的降低靶向二代测序背景噪音的方法,其特征在于,所述方法还包括:执行
S11、S21

S31

S32
:计算每个待降噪样本的每个位点的变异频率
vaf

(VzB+VfB)/(Zsum+Fsum)

S42
:采用单样本
t
检验,计算以位点列表
filRate
为总体,位点变异频率为
vaf
的情况下,位点变异频率
vaf
与位点总体
filRate
均值是否存在显著差异;如果存在显著差异,则为真阳性位点,否则为假阳性位点;优选地,如果
P

0.05
,则为真阳性位点;执行
S5。3.
根据权利要求2所述的降低靶向二代测序背景噪音的方法,其特征在于,所述位点列表
filRate
的分析流程包括:
S12
:获取健康外周血样本的靶向捕获测序数据;
S22
:基于所述健康外周血样本的靶向捕获测序数据与参考基因组比对,通过变异检测工具得到包含健康外周血样本的
SNV、InDel
突变的文件;
S33
:将变异频率超过阈值的位点设置为
NA
,计算每个位点不为
NA
的样本个数,如果不为
NA
的样本个数超过阈值,那么删除该位点,否则保留该位点,得到候选位点;优选地,变异频率
≥15
%的位点设置为
NA
,如果
NA
的样本个数
≥2
,那么删除该位点,否则保留该位点,得到候选位点;
S34
:每个候选位点包含每个健康外周血样本的突变频率列表,所述突变频率列表即为位点列表
filRate
;其中某样本未找到位点,记为
NA。4.
根据权利要求1所述的降低靶向二代测序背景噪音的方法,其特征在于,所述方法还包括:
S13
:获取待降噪样本和对照血样本的靶向捕获测序数据;
S23
:基于所述待降噪样本和对照血样本的靶向捕获测序数据与参考基因组比对,通过变异检测工具得到包含健康外周血样本的
SNV、InDel
突变的文件;执行
S31、S32

S35
:计算每个对照血样本的每个位点的正链参考
reads
支持数,记为
BzA
;负链参考
reads
支持数,记为
BfA
;正链突变
reads
支持数,记为
BzB<...

【专利技术属性】
技术研发人员:翟兵兵刘建红邓涛孙立超
申请(专利权)人:北京博奥医学检验所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1