System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及核酸测序领域,尤其涉及一种纳米孔测序信号评价方法、装置、电子设备和存储介质。
技术介绍
1、纳米孔测序作为新一代的测序技术,与第二代测序技术最大的不同之一是测序信号由光学信号转变成了电流信号。对测序信号的质量进行评估,是保证测序结果准确度的必要步骤。而传统的第二代测序技术的测序信号评估方法并不适用于第三代测序,因此建立新的测序信号评价体系是三代测序技术发展中的一个关键问题。
技术实现思路
1、有鉴于此,本公开提出了一种纳米孔测序信号评价方法、装置、电子设备和存储介质,旨在对纳米孔测序过程以及测序结果进行评价。
2、根据本公开的第一方面,提供了一种纳米孔测序信号评价方法,所述方法包括:
3、获取通过纳米孔测序方式对核酸序列进行检测得到的原始测序信号;
4、分割所述原始测序信号得到第一信号、第二信号和第三信号,所述第一信号为纳米孔在没有与核酸分子结合时采集的空白电流信号,所述第二信号为核酸分子与纳米孔结合后未开始过孔时的电流信号,第三信号为核酸序列开始连续过孔时的电流信号;
5、基于所述第一信号和所述第二信号进行统计分析,得到第一评价指标、第二评价指标和第三评价指标;
6、基于所述第三信号进行统计分析,得到第四评价指标和第五评价指标;
7、根据所述第一评价指标、第二评价指标、第三评价指标、第四评价指标和第五评价指标中的至少一种对所述原始测序信号进行评价。
8、在一种可能的实现方式中,所述基于所
9、对所述第一信号进行统计分析得到第一评价指标;
10、对所述第二信号进行统计分析得到第二评价指标;
11、对所述第一信号和所述第二信号进行综合统计分析得到第三评价指标。
12、在一种可能的实现方式中,所述对所述第一信号进行统计分析得到第一评价指标,包括:
13、划分第一信号得到前部第一信号和后部第一信号;
14、计算所述前部第一信号均值和所述后部第一信号均值,信号均值为对应信号中每个信号采样点电流值的平均值;
15、根据所述第一信号中的信号采样点数量、每个所述信号采样点的电流值,以及全部所述信号采样点的平均电流值计算所述第一信号的第一信号噪声;
16、根据所述前部第一信号均值、所述后部第一信号均值和所述第一信号噪声确定第一评价指标。
17、在一种可能的实现方式中,所述对所述第二信号进行统计分析得到第二评价指标,包括:
18、计算所述第二信号中每个信号采样点的电流值均值,得到第二信号均值作为第二评价指标。
19、在一种可能的实现方式中,所述对所述第一信号和所述第二信号进行综合统计分析得到第三评价指标,包括:
20、计算所述第一信号和所述第二信号的电流值均值的比值,得到第三评价指标。
21、在一种可能的实现方式中,所述基于所述第三信号进行统计分析,得到第四评价指标和第五评价指标,包括:
22、根据预设的接头序列信号模板去除所述第三信号中的接头序列信号,得到目标序列信号;
23、对所述目标序列信号进行统计分析得到第四评价指标;
24、对所述目标序列信号进行片段化处理,得到目标信号曲线;
25、对所述目标信号曲线进行统计分析,得到第五评价指标。
26、在一种可能的实现方式中,所述根据预设的接头序列信号模板去除所述第三信号中的接头序列信号,得到目标序列信号,包括:
27、基于动态调整算法在所述第三信号中搜索与所述接头序列信号模板最相似的信号片段;
28、在所述第三信号中去除所述信号片段,得到目标序列信号。
29、在一种可能的实现方式中,所述对所述目标序列信号进行统计分析得到第四评价指标,包括:
30、确定所述目标序列信号中每个信号采样点的电流值的均值和中位数,得到第三信号均值和电流中位数;
31、根据所述第三信号均值和所述电流中位数确定第四评价指标。
32、在一种可能的实现方式中,所述对所述目标序列信号进行片段化处理,得到目标信号曲线,包括:
33、对所述目标序列信号进行片段化处理,得到至少一个序列信号片段;
34、计算每个所述序列信号片段中信号采样点的电流值均值,得到对应的电流信号;
35、对每个所述电流信号由小到大排序并绘制曲线,得到目标信号曲线。
36、在一种可能的实现方式中,所述对所述目标序列信号进行片段化处理,得到至少一个序列信号片段,包括:
37、根据预设尺寸的第一滑动窗口以预设的第一步长在所述目标序列信号中依次获取多个区间信号;
38、计算相邻区间信号之间的信号观测值;
39、响应于所述信号观测值大于临界值,确定所述相邻区间信号属于两个不同的信号片段;
40、根据不同区间信号所属的信号片段,分割所述目标序列信号,得到至少一个序列信号片段。
41、在一种可能的实现方式中,所述计算相邻区间信号之间的信号观测值,包括:
42、根据公式计算得到信号观测值t,其中,和分别为相邻的两个区间信号中包括的信号采样点数量,和分别为相邻的两个区间信号中包括的信号采样点的电流值均值,和分别为相邻的两个区间信号中包括的信号采样点的电流值方差。
43、在一种可能的实现方式中,所述对每个所述电流信号由小到大排序并绘制曲线,得到目标信号曲线,包括:
44、对每个所述电流信号由小到大排序并绘制曲线,得到候选信号曲线;
45、基于局域多项式最小二乘法拟合的滤波方法对所述候选信号曲线进行平滑滤波,得到目标信号曲线。
46、在一种可能的实现方式中,所述对所述目标信号曲线进行统计分析,得到第五评价指标,包括:
47、统计计算所述目标信号曲线中的信号最大值、信号最小值、信号中位数、信号预设百分位数、曲线曲率的最大点、曲线曲率的最小点、曲线最值连线与曲线的切点、曲线最值连线的斜率、所述目标序列信号片段化处理后的偏移程度、曲线信号噪声和曲线信号信噪比,以得到第五评价指标。
48、在一种可能的实现方式中,所述方法还包括:
49、绘制所述第一评价指标、第三评价指标、第四评价指标和第五评价指标分别对应的可视化信号图;
50、汇总每个所述可视化信号图得到信号评价汇总图并显示。
51、根据本公开的第二方面,提供了一种纳米孔测序信号评价装置,所述装置包括:
52、序列确定模块,用于获取通过纳米孔测序方式对核酸序列进行检测得到的原始测序信号;
53、信号分割模块,用于分割所述原始测序信号得到第一信号、第二信号和第三信号,所述第一信号为纳米孔在没有与核酸分子结合时采集本文档来自技高网...
【技术保护点】
1.一种纳米孔测序信号评价方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一信号和所述第二信号进行统计分析,得到第一评价指标、第二评价指标和第三评价指标,包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述第一信号进行统计分析得到第一评价指标,包括:
4.根据权利要求2或3所述的方法,其特征在于,所述对所述第二信号进行统计分析得到第二评价指标,包括:
5.根据权利要求2所述的方法,其特征在于,所述对所述第一信号和所述第二信号进行综合统计分析得到第三评价指标,包括:
6.根据权利要求1所述的方法,其特征在于,所述基于所述第三信号进行统计分析,得到第四评价指标和第五评价指标,包括:
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
8.一种纳米孔测序信号评价装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,包括:
10.一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指
...【技术特征摘要】
1.一种纳米孔测序信号评价方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一信号和所述第二信号进行统计分析,得到第一评价指标、第二评价指标和第三评价指标,包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述第一信号进行统计分析得到第一评价指标,包括:
4.根据权利要求2或3所述的方法,其特征在于,所述对所述第二信号进行统计分析得到第二评价指标,包括:
5.根据权利要求2所述的方法,其特征在于,所述对所述第一信号和所述第二信号...
【专利技术属性】
技术研发人员:杨邵谊,孙琛,王大千,
申请(专利权)人:北京普译生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。