用于纳米孔信号的编码器制造技术

技术编号:39577649 阅读:9 留言:0更新日期:2023-12-03 19:28
本发明专利技术公开了一种用于纳米孔信号的编码器

【技术实现步骤摘要】
用于纳米孔信号的编码器、解码器、编解码系统和方法


[0001]本申请涉及生物检测
,尤其涉及一种用于纳米孔信号的编码器

解码器

编解码系统和方法


技术介绍

[0002]现有技术中通常是使用序列到序列(
seq

to

seq
)的方法将纳米孔电信号识别为碱基序列,而传统的
seq

to

seq
方法主要是基于马尔可夫模型的方法进行识别

随着深度学习的快速发展,基于深度学习的方法有着更优异的识别性能

由于在
seq

to

seq
任务中,输入序列和输出序列通常是不等长的,典型的深度学习的
seq

to

seq
模型通常包含编码器和解码器两个部分

其中,编码器负责对输入序列进行信息提取,并转换成特征向量或特征矩阵;将特征向量或特征矩阵作为输入传给解码器,解码器负责将其转换为输出序列

[0003]在纳米孔测序的任务中,编码器负责纳米孔电信号的特征提取,并集成上下文的信息,解码器则负责将信号特征翻译为碱基序列

在现有的技术中,编码器主要是通过纯卷积神经网络(
Convolutional Neural Networks

CNN
)堆叠或卷积神经网络加循环神经网络(
Recurrent Neural Network

RNN
)的堆叠来实现,而解码器则主要是通过基于
CTC
的维特比或束搜索来实现

[0004]然而,在编码方面,纳米孔信号受限于控速酶的特点,每一个聚合物单元的过孔时间较不稳定,表达成信号以后持续的长度高度不均

当使用
CNN
网络作为编码器时,
CNN
网络卷积核是固定不变的,并且每一个卷积核对整条信号权值共享

因此,
CNN
作为编码器中主要的特征提取单元,比较难同时对较快和较慢的聚合物表达进行兼容

如果通过
RNN
实现这个精度的特征提取和快慢兼容,由于
RNN
的参数量非常大,模型效率会非常低下

总之,在纳米孔测序任务中,当前技术对控速酶控速稳定性的要求非常高

[0005]在解码方面,使用
CTC
模型虽然可以很好的实现长序列到短序列(信号序列到测序序列)的映射,但是有以下的缺点:需要通过维特比或者束搜索算法解码,难以实现完全端到端预测,理论上模型性能受到人为设计的状态节点的影响,不能充分发挥机器学习技术的优势;比较难以利用目前不断发展的并行化高速计算技术(如
GPU
),效率(特别是未来的效率)比较低


技术实现思路

[0006]有鉴于此,本公开的实施例提供了一种用于纳米孔信号的编码器

解码器

编解码系统和方法

[0007]第一方面,本公开的实施例提供了一种用于纳米孔信号的编码器,该编码器中包括:分窗单元

移位单元和至少两个编码单元;所述分窗单元,用于将所接收的纳米孔信号分割为
M
个信号段后输出至与所述分窗单元连接的编码单元,所述
M
个信号段中的数据无交叠;其中,
M
为大于1的整数;所述编码单元中至少包括:第一自查询权值计算器;
所述第一自查询权值计算器中包括:至少一个第一注意力模块;所述第一注意力模块,用于对所接收的每个信号段分别进行注意力计算,将
M
个信号段的注意力计算结果组合成一个注意力计算结果作为信号特征输出;每两个相邻的编码单元之间设置有一个移位单元;所述移位单元,用于对所接收的信号特征按照预设的平移值进行数据循环平移,将平移后的信号特征重新分割为
M
个信号段后输出至与其输出端连接的编码单元

[0008]第二方面,本公开的实施例提供了一种用于纳米孔信号的解码器,该解码器中包括:分窗单元

移位单元和至少两个解码单元;所述分窗单元,用于将所接收的信号特征分割为
M
个信号段后输出至与所述分窗单元连接的解码单元,所述
M
个信号段中的数据无交叠;其中,
M
为大于1的整数;所述解码单元中至少包括:第二自查询权值计算器;所述第二自查询权值计算器中包括:至少一个第二注意力模块;所述第二注意力模块,用于对所接收的每个信号段分别进行注意力计算,将并将
M
个信号段的注意力计算结果组合成一个注意力计算结果作为信号特征输出;每两个相邻的解码单元之间设置有一个移位单元;所述移位单元,用于对所接收的信号特征按照预设的平移值进行数据循环平移,将平移后的信号特征重新分割为
M
个信号段后输出至与其输出端连接的解码单元

[0009]第三方面,本公开的实施例提供了一种用于纳米孔信号的编解码系统,该编解码系统中包括:编码器和解码器;所述编码器中包括:分窗单元

移位单元和至少两个编码单元;所述分窗单元,用于将所接收的纳米孔信号分割为
M
个信号段后输出至与所述分窗单元连接的编码单元,所述
M
个信号段中的数据无交叠;其中,
M
为大于1的整数;所述编码单元中至少包括:第一自查询权值计算器;所述第一自查询权值计算器中包括:至少一个第一注意力模块;所述第一注意力模块,用于对所接收的每个信号段分别进行注意力计算,将
M
个信号段的注意力计算结果组合成一个注意力计算结果作为信号特征输出;每两个相邻的编码单元之间设置有一个移位单元;所述移位单元,用于对所接收的信号特征按照预设的平移值进行数据循环平移,将平移后的信号特征重新分割为
M
个信号段后输出至与其输出端连接的编码单元;所述解码器中包括:分窗单元

移位单元和至少两个解码单元;所述分窗单元,用于将所接收的信号特征分割为
M
个信号段后输出至与所述分窗单元连接的解码单元,所述
M
个信号段中的数据无交叠;其中,
M
为大于1的整数;所述解码单元中至少包括:第二自查询权值计算器;所述第二自查询权值计算器中包括:至少一个第二注意力模块;所述第二注意力模块,用于对所接收的每个信号段分别进行注意力计算,并将
M
个信号段的注意力计算结果组合成一个将注意力计算结果作为信号特征输出;每两个相邻的解码单元之间设置有一个移位单元;所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种用于纳米孔信号的编码器,其特征在于,该编码器中包括:分窗单元

移位单元和至少两个编码单元;所述分窗单元,用于将所接收的纳米孔信号分割为
M
个信号段后输出至与所述分窗单元连接的编码单元,所述
M
个信号段中的数据无交叠;其中,
M
为大于1的整数;所述编码单元中至少包括:第一自查询权值计算器;所述第一自查询权值计算器中包括:至少一个第一注意力模块;所述第一注意力模块,用于对所接收的每个信号段分别进行注意力计算,将
M
个信号段的注意力计算结果组合成一个注意力计算结果作为信号特征输出;每两个相邻的编码单元之间设置有一个移位单元;所述移位单元,用于对所接收的信号特征按照预设的平移值进行数据循环平移,将平移后的信号特征重新分割为
M
个信号段后输出至与其输出端连接的编码单元
。2.
根据权利要求1所述的编码器,其特征在于:所述第一注意力模块使用注意力机制

自注意力机制

交叉注意力机制

通道注意力机制或卷积增强的注意力方法进行注意力计算
。3.
根据权利要求1所述的编码器,其特征在于:所述数据循环平移的长度为信号段长度的一半
。4.
根据权利要求1所述的编码器,其特征在于,所述编码单元中还包括:第一邻域特征预处理器;所述第一邻域特征预处理器,用于对纳米孔信号进行预处理,并将预处理后的纳米孔信号输出至所述第一自查询权值计算器
。5.
根据权利要求4所述的编码器,其特征在于:所述第一邻域特征预处理器为卷积神经网络或循环神经网络
。6.
根据权利要求1或4所述的编码器,其特征在于,所述编码单元中还包括:第一邻域信息处理器;所述第一邻域信息处理器,用于对第一自查询权值计算器输出的信号特征进行顺序信息关联处理
。7.
根据权利要求6所述的编码器,其特征在于:所述第一邻域信息处理器为卷积神经网络或循环神经网络
。8.
一种用于纳米孔信号的解码器,其特征在于,该解码器中包括:分窗单元

移位单元和至少两个解码单元;所述分窗单元,用于将所接收的信号特征分割为
M
个信号段后输出至与所述分窗单元连接的解码单元,所述
M
个信号段中的数据无交叠;其中,
M
为大于1的整数;所述解码单元中至少包括:第二自查询权值计算器;所述第二自查询权值计算器中包括:至少一个第二注意力模块;所述第二注意力模块,用于对所接收的每个信号段分别进行注意力计算,将并将
M
个信号段的注意力计算结果组合成一个注意力计算结果作为信号特征输出;每两个相邻的解码单元之间设置有一个移位单元;所述移位单元,用于对所接收的信号特征按照预设的平移值进行数据循环平移,将平移后的信号特征重新分割为
M
个信号段后输出至与其输出端连接的解码单元

9.
根据权利要求8所述的解码器,其特征在于:所述第二注意力模块使用注意力机制

自注意力机制

交叉注意力机制或通道注意力机制进行注意力计算,得到注意力计算结果
。10.
根据权利要求8所述的解码器,其特征在于:所述第二注意力模块在进行注意力计算时,将信号特征与预存的历史输出序列或位置信息进行注意力计算
。11.
根据权利要求8所述的解码器,其特征在于,所述解码单元中还可以包括:第二邻域特征预处理器;所述邻域特征预处理器,用于对信号特征进行预处理,并将预处理后的信号特征输出至所述第二自查询权值计算器
。12.
根据权利要求
11
所述的解码器,其特征在于:所述第二邻域特征预处理器为循环神经网络
。13.
根据权利要求8所述的解码器,其特征在于,所述解码单元中还可以包括:第二邻域信息处理器;所述第二邻域信息处理器,用于对第二自查询权值计算器输出的信号特征进行顺序信息关联处理
。14.
根据权利要求
13
所述的解码器,其特征在于:所述第二邻域信息处理器为循环神经网络或卷积神经网络
。15.
一种用于纳米孔信号的编解码系统,其特征在于,该编解码系统中包括:编码器和解码器;所述编码器中包括:分窗单元

移位单元和至少两个编码单元;所述分窗单元,用于将所接收的纳米孔信号分割为
M
个信号段后输出至与所述分窗单元连接的编码单元,所述
M
个信号段中的数据无交叠;其中,
M
为大于1的整数;所述编码单元中至少包括:第一自查询权值计算器;所述第一自查询权值计算器中包括:至少一个...

【专利技术属性】
技术研发人员:李锐郝俊龙卓远田利民
申请(专利权)人:广州齐碳科技有限公司成都齐碳科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1