【技术实现步骤摘要】
本专利技术涉及DNA测序分析领域,尤其涉及一种DNA测序的图像识别的预处理方法及装置。
技术介绍
在DNA测序
,整体操作流程描述如下:DNA样品通过破碎后,应用建库试剂进行加接头、单链捕获、结合至微球、微乳液PCR扩增、破乳液,获得建立在微球上的DNA文库,应用加样板将文库和测序反应需要的酶等铺放至具有微反应池的测序芯片,测序芯片和测序试剂安装至主机上,通过控制计算机根据模块数量和位置启动测序程序,自动化进行测序反应,产生的数据传输至数据分析计算机,完成测序后应用计算分析软件进行图像处理、序列读出、质量分析、序列拼接等工作,最终得到DNA样本的序列信息。微反应池测序芯片是测序反应的载体,载有测序模板的DNABeads及各种测序反应用酶均位于刻有微反应池的测序芯片中。在对反应芯片的图像采集时,目标和背景不容易识别,进而造成目标的误识别,会影响图像识别的准确性进而严重影响对碱基类型的判定。鉴于上述缺陷,本专利技术创作者经过长时间的研究和实践终于获得了本创作。
技术实现思路
本专利技术的目的在于提供一种DNA测序的图像识别的预处理方法及装置,用以克服上述技术缺陷。为实现上述目的,本专利技术提供一种DNA测序的图像识别的预处理方法,包括:获取图谱信息,在对每个图谱的采样时间间隔内分别获取DNA图谱;对所述图谱进行灰度线性拉伸,获得拉伸后的DNA图谱;获取所述拉伸后DNA图谱的第 ...
【技术保护点】
一种DNA测序的图像识别的预处理方法,其特征在于,包括:获取图谱信息,在对每个图谱的采样时间间隔内分别获取DNA图谱;对所述图谱进行灰度线性拉伸,获得拉伸后的DNA图谱;获取所述拉伸后DNA图谱的第一像素和第二像素,其中,第一像素A为目标像素,第一像素的灰度值大于或等于初始分割阈值T0,像素总数为N;第二像素B为背景像素,第二像素的灰度值小于初始分割阈值T0,像素总数为M;图谱f(i,j)的最大值为Vmax,最小值为Vmin其中,T0=1/2(Vmin+Vmax) (1);计算第一像素和第二像素的灰度均值的全局阈值T;T=1/2(Σf(i,j)≥T0f(i,j)N+Σf(i,j)<T0f(i,j)M)---(2);]]>计算第一像素和第二像素的方差σ2σ2=(PA+PB)(T‑T0)2 (3);其中,第一像素的概率为:PA=Σk=1M+NNM+N---(4)]]>第二像素的概率为:PB=Σk=1M+NMM+N---(5)]]>若方差在预设范围内,则以T为全局 ...
【技术特征摘要】 【专利技术属性】
1.一种DNA测序的图像识别的预处理方法,其特征在于,包括:
获取图谱信息,在对每个图谱的采样时间间隔内分别获取DNA图谱;
对所述图谱进行灰度线性拉伸,获得拉伸后的DNA图谱;
获取所述拉伸后DNA图谱的第一像素和第二像素,其中,第一像素A为目标
像素,第一像素的灰度值大于或等于初始分割阈值T0,像素总数为N;第二像素B
为背景像素,第二像素的灰度值小于初始分割阈值T0,像素总数为M;图谱f(i,j)
的最大值为Vmax,最小值为Vmin其中,T0=1/2(Vmin+Vmax)(1);
计算第一像素和第二像素的灰度均值的全局阈值T;
T=1/2(Σf(i,j)≥T0f(i,j)N+Σf(i,j)<T0f(i,j)M)---(2);]]>计算第一像素和第二像素的方差σ2σ2=(PA+PB)(T-T0)2(3);
其中,第一像素的概率为:
PA=Σk=1M+NNM+N---(4)]]>第二像素的概率为:
PB=Σk=1M+NMM+N---(5)]]>若方差在预设范围内,则以T为全局阈值对所述图谱进行分割。
2.根据权利要求1所述的DNA测序的图像识别的预处理方法,其特征在于,
还包括:
获取CY3、CY5、FAM和TXR四种荧光图像;
以所述图谱为基准图像,对所述四种荧光图像进行配准,得到配准后的荧
光图像;
在所述配准后的四种荧光图像中查找的磁珠中心点;
对所述中心点进行融合处理,以获得融合后的磁珠中心点。
3.根据权利要求2所述的DNA测序的图像识别的预处理方法,其特征在于,
在所述配准后的四种荧光图像中查找的磁珠中心点,具体包括:
对所述配准后的四种荧光图像识别磁珠像素,如果f(i,j)最小值min(i,j)
差值的绝对值大于等于T0,则识别为磁珠,否则,为背景像素。
4.根据权利要求3所述的DNA测序的图像识别的预处理方法,其特征在于,
在所述配准后的四种荧光图像中查找的磁珠中心点,还包括:
遍历所述磁珠像素,获取磁珠中心像素,其中,磁珠中心像素为,当前点
的灰度值等于以当前点为中心的4*4像素区域内灰度的最大值,且当前点的四
邻域都是目标像素。
5.根据权利要求1所述的DNA测序的图像识别的预处理方法,其特征在于,
获取图谱信息时,对信号波形,在每连续的K个周期内,每周期选择n个预设时
刻的采样点,每间隔时间T0采样一次,连续取样M次;为了保证取样数据的可
\t参考性与准确性,在每一周期内选择的n个采样点的时间间隔Δt按照下述公式计
算,
Δt=a·sin(ω+β)·Tλ---(6)]]>式中,Δt表示采样点的时间间隔,a为修正系数,其大小由采样点数量决定,
ω表示拍照信号的角频率,由CCD相机的性能决定,β为初始相角,T表示信号
周期的时间,λ表示信号波形的峰值。
6.一种DNA测序的图像识别的预处理装置,其特征在于,包括:
技术研发人员:刘元杰,陈哲,张睿,范东雨,高科,王者馥,王绪敏,殷金龙,任鲁风,
申请(专利权)人:北京中科紫鑫科技有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。