【技术实现步骤摘要】
碱基簇检测方法及装置、基因测序仪及存储介质
[0001]本申请涉及图像处理
,尤其涉及一种基于荧光标记dNTP基因测序中碱基簇检测方法及装置,基因测序仪及计算机可读存储介质。
技术介绍
[0002]目前,基因测序技术主要可分为四代,第一代测序技术Sanger法是基于DNA合成反应的测序技术,又称为SBS法、末端终止法,由Sanger1975年提出,并于1977发表第一个完整的生物体基因组序列。第二代测序技术是以Illumina平台为代表的测序,实现了高通量测序,有了革命性进展,使得大规模并行测序成为现实,极大推动了生命科学领域基因组学的发展。第三代测序技术是以Pacbio平台为代表的SMRT(Single
‑
Molecule Real Time Sequencing,单分子荧光信号实时测序),测序技术具有高通量、长读长的特点。第四代测序技术是Nanopore纳米孔测序技术,是单分子实时测序的新一代技术,主要是通过ssDNA或RNA模板分子通过纳米孔而带来的电信号变化推测碱基组成进行实时测序。Sange ...
【技术保护点】
【技术特征摘要】
1.一种基于荧光标记dNTP基因测序中碱基簇检测方法,其特征在于,包括:获取针对测序芯片的与不同类型碱基的测序信号响应对应的多张待测荧光灰度图像,其中,每一所述待测荧光灰度图像中各荧光点与对应类型碱基的各碱基簇一一对应;通过反距离变换图预测模型对所述待测荧光灰度图像进行预测,得到各所述待测荧光灰度图像分别对应的预测反距离变换图;其中,所述反距离变换图预测模型为通过以对应反距离变换图作为标签的样本图像对卷积神经网络进行训练得到的深度学习模型;基于所述预测反距离变换图,分别确定对应所述待测荧光灰度图像中的碱基簇位置,根据多张所述待测荧光灰度图像中碱基簇位置的并集,确定所述测序芯片的目标部位包含的碱基簇的模板点位置。2.如权利要求1所述的碱基簇检测方法,其特征在于,所述获取针对测序芯片的与不同类型碱基的测序信号响应对应的多张待测荧光灰度图像之前,还包括:获取训练样本集;所述训练样本集包括以对应反距离变换图作为标签的样本图像;初始化卷积神经网络的权重参数;基于所述训练样本集对卷积神经网络进行训练,以卷积神经网络输出的预测图像与对应样本图像的标签之间的结构相似性误差构建损失函数,训练直至所述损失函数收敛,得到训练后的反距离变换图预测模型。3.如权利要求2所述的碱基簇检测方法,其特征在于,所述损失函数表示如下:Loss = 1
ꢀ–ꢀ
SSIM;;其中,E和G分别代表预测图像和标签,μ和σ 代表均值和标准差,λ为防止除零错误的参数。4.如权利要求2所述的碱基簇检测方法,其特征在于,所述获取训练样本集,包括:获取荧光灰度图像,对所述荧光灰度图像的荧光点进行标注形成标注点;根据所述标注点的位置信息,计算对应所述荧光灰度图像中各像素与其最近标注点之间的距离,生成反距离变换图作为标签,根据各所述荧光灰度图像及其标签分别得到样本图像。5.如权利要求4所述的碱基簇检测方法,其特征在于,所述反距离变换图表示如下:;;其中,I
’
为反距离变换图,C为防止除零错误的参数,P(x, y)为任意像素(x, y) 其最近标注点之间的距离,B为标注点集。6.如权利要求1至5中任一项所述的碱基簇检测方法,其特征在于,所述获取针对测序芯片的与不同类型碱基的测序信号响应对应的多张待测荧光灰度图像,包括:
在碱基簇测序读段中对一个碱基识别的循环内,针对测序芯片的目标部位采集分别与A、C、G、T四种类型碱基的测序信号响应对应的四张待测荧光灰度图像;或,在碱基簇测序读段中对多个碱基识别的对应多个循环内,针对每一所述循环,对测序芯片的目标部位采集与不同类型碱基的测序信号响应对应的多张荧光灰度图像,从多个所述循环内选择分别与A、C、G、T四种类型碱基的测序信号响应对应的四张荧光灰度图像作为待测荧光灰度图像。7.如权利要求1至5中任一项所述的碱基簇检测方法...
【专利技术属性】
技术研发人员:彭宽宽,陈伟,周祎楠,王谷丰,赵陆洋,
申请(专利权)人:深圳赛陆医疗科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。