高密度样品基因测序方法技术

技术编号:37334467 阅读:26 留言:0更新日期:2023-04-21 23:13
一种高密度样品基因测序方法,通过分别采集按二维点阵排列的高密度测序样品的A、C、T、G四通道荧光采集图像各一次并确定每个荧光信号的衍射斑中心位置,从而计算得到样品点阵的整体空间位置分布并确定每一个样品点在成像时单独存在信号情况下的荧光信号计算图像,再根据该荧光信号图像对耦合图像进行解耦,得到每个样品点的信号强度,通过对每一样品点在每一次成像时不同波长通道的信号强度分析,确定每一样品点中核酸的碱基排布顺序。本发明专利技术在现有测序仪器的基础上,最小可以将样品分布间距减小到成像系统分辨率的0.45倍,且保持读取错误率为万分之一。缩小样品间距到成像系统分辨率的0.36倍,保持错误率为千分之一。保持错误率为千分之一。保持错误率为千分之一。

【技术实现步骤摘要】
高密度样品基因测序方法


[0001]本专利技术涉及的是一种生物医学领域的技术,具体是一种密度大于16000K/mm2的基因测序方法。

技术介绍

[0002]现有DNA测序方法通过对荧光图像进行分割,获得测序信号所在位置处的信号强度。这种方法对于测序样品密度有一定的要求。由于光学成像系统衍射极限的存在,当测序样品的密度较大时,不同的碱基信号会耦合在一起,对测序结果产生影响。在以荧光像方式为基础的核酸序列检测中,由于光学系统的衍射极限以及邻近信号的影响,限制了每一样品点之间距离缩小以及样品点密度的提高,从而阻碍了测序通量的进一步提升。

技术实现思路

[0003]本专利技术针对现有基因测序技术中的检测方法无法读取高密度样品信号的问题,提出一种高密度样品基因测序方法,通过对大面积的宽光束照明以及成像,对高密度的样品进行实时计算分析,实现高速、高通量的基因测序任务。在现有测序仪器的基础上,最小可以将样品分布间距减小到成像系统分辨率的0.45倍,且保持读取错误率为万分之一。缩小样品间距到成像系统分辨率的0.36倍,保持错误率为千分之一。
[0004]本专利技术是通过以下技术方案实现的:
[0005]本专利技术涉及一种高密度样品基因测序方法,通过分别采集按二维点阵排列的高密度测序样品的A、C、T、G四通道荧光采集图像各一次并确定每个荧光信号的衍射斑中心位置,从而计算得到样品点阵的整体空间位置分布并确定每一个样品点在成像时单独存在信号情况下的荧光信号计算图像,再根据该荧光信号图像对耦合图像进行解耦,得到每个样品点的信号强度,通过对每一样品点在每一次成像时不同波长通道的信号强度分析,确定每一样品点中核酸的碱基排布顺序。
[0006]所述的二维点阵排列是指:通过微加工制得具有空间分布的阵列,阵列中各点相距固定的距离,阵列上每个点加工出一定半径的槽。制备具有待测序DNA模板的成像样品,通过气相沉积方法,使得待测序核酸只会在槽中进行扩增。
[0007]所述的四通道荧光采集图像,通过以下方式采集得到:通过在二维点阵排列的一侧设置棱镜,用于反射入射激光,在二维点阵排列的另一侧设置大于0.5数值孔径的镜头,在镜头以及镜筒透镜后设置图像传感器获得二维点阵排列的每一样品点与其序列信息相关联的荧光信号的耦合宽场图像。
[0008]所述的每个荧光信号的衍射斑中心位置,通过以下方式得到:对有序列信息相关联的荧光信号的耦合宽场图像进行预处理,然后通过计算图像局部极大值点并经阈值筛选得到若干待定拟合的像素点,再利用高斯分布函数拟合衍射斑的点扩散函数从而得到各衍射斑的位置坐标(x
i
,y
i
)以及衍射斑的大小σ
x
,σ
y

[0009]优选地,通过反复地拟合图像中各候选点,对比单个样品点产生的衍射斑的大小,
过滤掉多个样品点耦合的衍射斑的中心位置,得到一系列位置的坐标(x1,y1),(x2,y2)...(x
n
,y
n
)。
[0010]所述的预处理包括:均值滤波、高斯滤波、低通高斯滤波、高斯差分函数滤波、小波滤波以及均值滤波。
[0011]所述的高斯分布函数为:其中:I为四通道荧光采集图像的信号,I
i
为荧光信号计算图像的强度,x
i
,y
i
为拟合信号的中心位置坐标,σ
x
,σ
y
为拟合出的光斑在x轴和y轴的大小。通过最小二乘法或极大似然估计实现对上述参数的估计。
[0012]所述的解耦是指:根据衍射斑中心位置估计视野中第一个点的位置,从而生成测序样品的空间分布的基坐标矩阵A,利用正交匹配追踪算法来优化问题min||y

Ax||,其中:y是步骤B中得到的四通道荧光采集图像,A为基坐标矩阵,x为最终计算得到的点阵各位置信号的强度,求得各个坐标下的分量即样品对应点的信号强度。
[0013]所述的视野中第一个点的位置是指:最接近荧光信号计算图像坐标原点的样品点的位置,一般根据图像像素的定义,选择图像左上角第一个;基于衍射斑中心位置的点坐标P
i
=x
i
,y
i
)与视野中第一个点的坐标满足:其中:n
i
,m
i
为正整数,以x坐标为例,对等式取模运算有(x
i

x0)mod d=(n
i
·
d)mod d,即x
i
mod d=x0,因此将定位到的点序列转换为对视野中第一个点的估计,即P

i
=(x
i
mod d,y
i
mod d),计算整体的估计的方差Q=Σ(P0‑
P

i
)2,通过使得整体方差最小即可得到对视野中第一个点的最小方差估计P0=(P
′1+P
′2+...+P

n
)/n;当确定视野中第一个点的位置P0=(x0,y0)后,其余点的位置可以通过点阵的参数计算得到:0≤x0,y0<d,其中:d为点阵设计时的采用的间距。
[0014]所述的基坐标矩阵是指:基坐标矩阵中的每一列为各个样品点单独存在信号情况下计算得到的宽场荧光成像图,并且将其从二维图像的上一行尾与下一行首相连形成的一维向量。基坐标矩阵中每一列都是模拟计算得到的荧光信号计算图像。
[0015]所述的正交匹配追踪,具体包括:
[0016]i)将每一通道实际采集到耦合荧光图像一维化处理后与每一样品点在成像时单独存在信号情况下的一维化的荧光信号计算图像即基坐标矩阵中的每一列向量进行内积计算;
[0017]ii)取得到内积最大的信号点的值作为对应点的信号强度的估计,将采集到的耦合图像信号减去估计的信号;
[0018]iii)当估计的样品点数大于等于两个时,采用最小二乘法对已估计的信号强度进行修正,具体操作为:优化方程min||A
new
λ

y||,其中A
new
为步骤i和步骤ii中已经进行估计信号位置的基坐标矩阵对应向量所组成的矩阵,y为已经估计出的信号强度。将采用最小二乘法估计得到的λ来修正步骤ii中的对样品点所在位置的信号强度的估计。
[0019]iv)迭代上述步骤i到步骤iii直至迭代大于一定步数或耦合图像趋于0时停止。
[0020]所述的信号强度分析是指:通过对每一样品点在每一次成像时不同波长通道的信号强度分析,确定每一样品点中核酸的碱基排布顺序。对比四个通道信号的强度,强度最大
的信号的碱基通道来确定所测碱基所属的碱基类别。如果四个通道信号强度相差较小,则丢弃此信号点信号,将此点作为废弃点,表示读取错误。技术效果
[0021]本专利技术利用测序四通道荧光图像的稀疏性,定位得到点阵样品的实际空间分布,通过对上本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种高密度样品基因测序方法,其特征在于,通过分别采集按二维点阵排列的高密度测序样品的A、C、T、G四通道荧光采集图像各一次并确定每个荧光信号的衍射斑中心位置,从而计算得到样品点阵的整体空间位置分布并确定每一个样品点在成像时单独存在信号情况下的荧光信号计算图像,再根据该荧光信号图像对耦合图像进行解耦,得到每个样品点的信号强度,通过对每一样品点在每一次成像时不同波长通道的信号强度分析,确定每一样品点中核酸的碱基排布顺序。2.根据权利要求1所述的高密度样品基因测序方法,其特征是,所述的二维点阵排列是指:通过微加工制得具有空间分布的阵列,阵列中各点相距固定的距离,阵列上每个点加工出一定半径的槽,制备具有待测序DNA模板的成像样品,通过气相沉积方法,使得待测序核酸只会在槽中进行扩增。3.根据权利要求1所述的高密度样品基因测序方法,其特征是,所述的四通道荧光采集图像,通过以下方式采集得到:通过在二维点阵排列的一侧设置棱镜,用于反射入射激光,在二维点阵排列的另一侧设置大于0.5数值孔径的镜头,在镜头以及镜筒透镜后设置图像传感器获得二维点阵排列的每一样品点与其序列信息相关联的荧光信号的耦合宽场图像。4.根据权利要求1所述的高密度样品基因测序方法,其特征是,所述的每个荧光信号的衍射斑中心位置,通过以下方式得到:对有序列信息相关联的荧光信号的耦合宽场图像进行预处理,然后通过计算图像局部极大值点并经阈值筛选得到若干待定拟合的像素点,再利用高斯分布函数拟合衍射斑的点扩散函数从而得到各衍射斑的位置坐标(x
i
,y
i
)以及衍射斑的大小σ
x
,σ
y
,通过反复地拟合图像中各候选点,对比单个样品点产生的衍射斑的大小,过滤掉多个样品点耦合的衍射斑的中心位置,得到一系列位置的坐标(x1,y1),(x2,y2)...(x
n
,y
n
)。5.根据权利要求4所述的高密度样品基因测序方法,其特征是,所述的预处理包括:均值滤波、高斯滤波、低通高斯滤波、高斯差分函数滤波、小波滤波以及均值滤波;所述的高斯分布函数为:其中:I为四通道荧光采集图像的信号,I
i
为荧光信号计算图像的强度,x
i
,y
i
为拟合信号的中心位置坐标,σ
x
,σ
y
为拟合出的光斑在x轴和y轴的大小,通过最小二乘法或极大似然估计实现对上述参数的估计。6.根据权利要求1所述的高密度样品基因测序方法,其特征是,所述的解耦是指:根据衍射斑中心位置估计视野中第一个点的位置,从而生成测序样品的空间分布的基坐标矩阵A,利用正交匹配追踪算法来优化问题min||y

Ax||,其中:y是步骤B中得到的四通道荧光采集图像,A为基坐标矩阵,x为最终计算得到的点阵各位置信号的强度,求得各个坐标下的分量即样品对应点的信号强度。7.根据权利要求6所述的高密度样品基因测序方法,其特征是,所述的...

【专利技术属性】
技术研发人员:陈杰孙嘉伟邵志峰沈玉梅孙洁林李小卫程酩沈轶
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1