【技术实现步骤摘要】
碱基识别方法及其训练集构建方法、基因测序仪及介质
[0001]本申请涉及基因测序
,尤其是涉及一种碱基识别的训练集构建方法
、
碱基识别方法
、
基因测序仪及计算机可读存储介质
。
技术介绍
[0002]目前,基因测序技术主要可分为四代,第一代测序技术
Sanger
法是基于
DNA
合成反应的测序技术,又称为
SBS
法
、
末端终止法,由
Sanger1975
年提出,并于
1977
发表第一个完整的生物体基因组序列
。
第二代测序技术是以
Illumina
平台为代表的测序,实现了高通量测序,有了革命性进展,使得大规模并行测序成为现实,极大推动了生命科学领域基因组学的发展
。
第三代测序技术是
Nanopore
纳米孔测序技术,是单分子实时测序的新一代技术,主要是通过
ssDNA
或
RNA
模板分子通过纳米孔而带来的电信号变化推测碱基组成进行实时测序
。
[0003]第二代基因测序技术中,利用荧光显微镜成像技术,将荧光分子的信号保存到图像中,通过解码图像信号来获得碱基序列
。
为了实现对不同碱基的区分,需要使用滤光片获取测序芯片在不同频率下荧光强度的图像,以获得荧光分子发光的频谱特征
。
同一场景下需要拍摄多张图像,通过对这些图
【技术保护点】
【技术特征摘要】
1.
一种碱基识别的训练集构建方法,其特征在于,包括:获取针对测序芯片的与不同碱基类型的测序信号响应对应的多张原始荧光图像,将分别与不同碱基类型的测序信号响应对应的多张原始荧光图像为一个训练样本的多通道样本图像;对所述原始荧光图像经初级碱基识别,得到碱基识别结果,并根据碱基信号采集单元位置形成掩膜图;根据在基因测序中针对所述测序芯片连续采集的所述原始荧光图像的所述碱基识别结果获得碱基序列,将所述碱基序列与已知基因库中的标准碱基序列进行比对,筛选比对成功的碱基序列,并对所述比对成功的碱基序列根据各自匹配的标准碱基序列对其进行校正,根据校正后的碱基序列对所述原始荧光图像经碱基识别确定的对应碱基识别结果进行修正,经修正后得到作为所述训练样本的所述多通道样本图像的碱基类型标签;根据未比对成功的碱基序列对所述掩膜图进行修正,经修正后得到掩膜标签图像
。2.
如权利要求1所述的碱基识别的训练集构建方法,其特征在于,所述对所述原始荧光图像经初级碱基识别,得到碱基识别结果,并根据碱基信号采集单元位置形成掩膜图,包括:针对至少一训练样本,对所述原始荧光图像经碱基信号采集单元检测定位算法处理确定碱基信号采集单元位置,根据碱基信号采集单元位置形成掩膜图;根据所述碱基信号采集单元位置,对所述原始荧光图像中的碱基信号采集单元经碱基识别算法进行识别,得到碱基识别结果
。3.
如权利要求1所述的碱基识别的训练集构建方法,其特征在于,所述根据在基因测序中针对所述测序芯片连续采集的所述原始荧光图像的所述碱基识别结果获得碱基序列,包括:针对在基因测序中对所述测序芯片连续采集的所述原始荧光图像,根据对应的所述掩膜图中所述碱基信号采集单元位置,分别对所述原始荧光图像中的碱基信号采集单元经碱基识别算法进行识别得到碱基识别结果,根据连续采集的所述原始荧光图像的所述碱基识别结果获得碱基序列;或,针对在基因测序中对所述测序芯片连续采集的所述原始荧光图像,通过初步训练的碱基识别模型进行识别得到碱基识别结果,根据连续采集的所述原始荧光图像的所述碱基识别结果获得碱基序列
。4.
如权利要求1所述的碱基识别的训练集构建方法,其特征在于,所述获取针对测序芯片的与不同碱基类型的测序信号响应对应的多张原始荧光图像,将分别与不同碱基类型的测序信号响应对应的多张原始荧光图像为一个训练样本的多通道样本图像,包括:在基因测序中对多个碱基识别的对应多个循环内,分别对测序芯片的目标部位采集与不同碱基类型的测序信号响应对应的多张荧光图像;以每一所述循环中,分别与
A、C、G、T
四种类型碱基的测序信号响应对应的每四张原始荧光图像作为一组,每一训练样本中包括由一组所述原始荧光图像形成的多通道样本图像
。5.
一种碱基识别方法,其特征在于,包括:获取针对测序芯片的与不同碱基类型的测序信号响应对应的多张待测荧光图像形成
的多通道输入图像数据;通过碱基识别模型以所述多通道输入图像数据为输入,对所述原始荧光图像进行识别,输出与各通道输入图像数据对应的碱基识别结果;其中,所述碱基识别模型为采用如权利要求1至4任一项所述的碱基识别的训练集构建方法得到的训练样本对初始的神经网络模型进行训练后得到
。6.
如权利要求5所述的碱基识别方法,其特征在于,所述碱基识别模型包括特征提取网络和分类预测网络;所述通过碱基识别模型以所述多通道输入图像数据为输入,对所述原始荧光图像进行识别,输出与各通道输入图像数据...
【专利技术属性】
技术研发人员:彭宽宽,陈伟,周祎楠,王谷丰,赵陆洋,
申请(专利权)人:深圳赛陆医疗科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。