【技术实现步骤摘要】
用于纳米孔信号的编码器、解码器、编解码系统和方法
[0001]本申请涉及生物检测
,尤其涉及一种用于纳米孔信号的编码器
、
解码器
、
编解码系统和方法
。
技术介绍
[0002]现有技术中通常是使用序列到序列(
seq
‑
to
‑
seq
)的方法将纳米孔电信号识别为碱基序列,而传统的
seq
‑
to
‑
seq
方法主要是基于马尔可夫模型的方法进行识别
。
随着深度学习的快速发展,基于深度学习的方法有着更优异的识别性能
。
由于在
seq
‑
to
‑
seq
任务中,输入序列和输出序列通常是不等长的,典型的深度学习的
seq
‑
to
‑
seq
模型通常包含编码器和解码器两个部分
。
其中,编码器负责对输入序列进行信息提取,并转换成特征向量或特征矩阵;将特征向量或特征矩阵作为输入传给解码器,解码器负责将其转换为输出序列
。
[0003]在纳米孔测序的任务中,编码器负责纳米孔电信号的特征提取,并集成上下文的信息,解码器则负责将信号特征翻译为碱基序列
。
在现有的技术中,编码器主要是通过纯卷积神经网络(
Convolutional Neural Networks
,
CNN ...
【技术保护点】
【技术特征摘要】
1.
一种用于纳米孔信号的编码器,其特征在于,该编码器中包括:分窗单元
、
移位单元和至少两个编码单元;所述分窗单元,用于将所接收的纳米孔信号分割为
M
个信号段后输出至与所述分窗单元连接的编码单元,所述
M
个信号段中的数据无交叠;其中,
M
为大于1的整数;所述编码单元中至少包括:第一自查询权值计算器;所述第一自查询权值计算器中包括:至少一个第一注意力模块;所述第一注意力模块,用于对所接收的每个信号段分别进行注意力计算,将
M
个信号段的注意力计算结果组合成一个注意力计算结果作为信号特征输出;每两个相邻的编码单元之间设置有一个移位单元;所述移位单元,用于对所接收的信号特征按照预设的平移值进行数据循环平移,将平移后的信号特征重新分割为
M
个信号段后输出至与其输出端连接的编码单元
。2.
根据权利要求1所述的编码器,其特征在于:所述第一注意力模块使用注意力机制
、
自注意力机制
、
交叉注意力机制
、
通道注意力机制或卷积增强的注意力方法进行注意力计算
。3.
根据权利要求1所述的编码器,其特征在于:所述数据循环平移的长度为信号段长度的一半
。4.
根据权利要求1所述的编码器,其特征在于,所述编码单元中还包括:第一邻域特征预处理器;所述第一邻域特征预处理器,用于对纳米孔信号进行预处理,并将预处理后的纳米孔信号输出至所述第一自查询权值计算器
。5.
根据权利要求4所述的编码器,其特征在于:所述第一邻域特征预处理器为卷积神经网络或循环神经网络
。6.
根据权利要求1或4所述的编码器,其特征在于,所述编码单元中还包括:第一邻域信息处理器;所述第一邻域信息处理器,用于对第一自查询权值计算器输出的信号特征进行顺序信息关联处理
。7.
根据权利要求6所述的编码器,其特征在于:所述第一邻域信息处理器为卷积神经网络或循环神经网络
。8.
一种用于纳米孔信号的解码器,其特征在于,该解码器中包括:分窗单元
、
移位单元和至少两个解码单元;所述分窗单元,用于将所接收的信号特征分割为
M
个信号段后输出至与所述分窗单元连接的解码单元,所述
M
个信号段中的数据无交叠;其中,
M
为大于1的整数;所述解码单元中至少包括:第二自查询权值计算器;所述第二自查询权值计算器中包括:至少一个第二注意力模块;所述第二注意力模块,用于对所接收的每个信号段分别进行注意力计算,将并将
M
个信号段的注意力计算结果组合成一个注意力计算结果作为信号特征输出;每两个相邻的解码单元之间设置有一个移位单元;所述移位单元,用于对所接收的信号特征按照预设的平移值进行数据循环平移,将平移后的信号特征重新分割为
M
个信号段后输出至与其输出端连接的解码单元
。
9.
根据权利要求8所述的解码器,其特征在于:所述第二注意力模块使用注意力机制
、
自注意力机制
、
交叉注意力机制或通道注意力机制进行注意力计算,得到注意力计算结果
。10.
根据权利要求8所述的解码器,其特征在于:所述第二注意力模块在进行注意力计算时,将信号特征与预存的历史输出序列或位置信息进行注意力计算
。11.
根据权利要求8所述的解码器,其特征在于,所述解码单元中还可以包括:第二邻域特征预处理器;所述邻域特征预处理器,用于对信号特征进行预处理,并将预处理后的信号特征输出至所述第二自查询权值计算器
。12.
根据权利要求
11
所述的解码器,其特征在于:所述第二邻域特征预处理器为循环神经网络
。13.
根据权利要求8所述的解码器,其特征在于,所述解码单元中还可以包括:第二邻域信息处理器;所述第二邻域信息处理器,用于对第二自查询权值计算器输出的信号特征进行顺序信息关联处理
。14.
根据权利要求
13
所述的解码器,其特征在于:所述第二邻域信息处理器为循环神经网络或卷积神经网络
。15.
一种用于纳米孔信号的编解码系统,其特征在于,该编解码系统中包括:编码器和解码器;所述编码器中包括:分窗单元
、
移位单元和至少两个编码单元;所述分窗单元,用于将所接收的纳米孔信号分割为
M
个信号段后输出至与所述分窗单元连接的编码单元,所述
M
个信号段中的数据无交叠;其中,
M
为大于1的整数;所述编码单元中至少包括:第一自查询权值计算器;所述第一自查询权值计算器中包括:至少一个...
【专利技术属性】
技术研发人员:李锐,郝俊龙,卓远,田利民,
申请(专利权)人:广州齐碳科技有限公司成都齐碳科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。