一种基于机器学习的光学显微镜自动聚焦方法技术

技术编号:20654559 阅读:30 留言:0更新日期:2019-03-23 06:25
本发明专利技术提出一种基于机器学习的光学显微镜自动聚焦方法,属于医学图像处理技术领域。该方法首先将光学显微镜采集并分组后的图片用设计的原始特征和组合特征表示,并将图片与组内最清晰图片的序列差值作为图片的标签,然后采用由回归树构成的随机森林对原始特征和组合特征的重要性进行计算,结合设定的阈值多次迭代筛选出重要性较高的特征,接着用留一法和筛选出的特征将数据划分为训练集和测试集来训练梯度提升回归树,最后迭代训练得到的强回归器进行自动聚焦。

【技术实现步骤摘要】
一种基于机器学习的光学显微镜自动聚焦方法
本专利技术属于医学图像处理
,涉及一种基于机器学习的光学显微镜自动聚焦方法。技术背景传统的人工阅片方法给病理医生带来了繁重的劳动,而且长时间高注意力地阅片易产生视觉疲劳,大大增加了误诊的概率。近年来,随着显微镜的自动化、智能化发展,自动阅片技术开始出现并迅速发展。显微镜的自动阅片技术由自动聚焦算法拍摄清晰的镜下图像,然后进行后续病理分析,显微镜自动聚焦算法作为自动阅片技术的第一步,极大的影响了后续的病理分析过程,其速度和精度显得尤为重要。显微视觉存在视场小、景深短、聚焦精度要求高等特点,这使得显微镜自动聚焦面临着很多亟待解决的难题。基于图像处理的自动聚焦法由于具有速度快、精度高、成本低和体积小等优点,成为了现代自动聚焦技术发展的主流。现有的基于图像处理的自动聚焦方法可以分为离焦深度法(DFD)和聚焦深度法(DFF)两类:离焦深度法(DFD)首先要对光学显微镜的成像系统进行建模,在此基础上采集模糊的图像,利用模糊图像和模型推导出该图像与焦平面的偏移量,然后驱动步进电机补偿偏移量达到聚焦平面,这种方法主要依据建模的精度,只需要采集2-3幅图像即可完成聚焦,聚焦时间比较短,但是,该方法依赖于成像系统的数学模型,不同的成像系统数学模型差异较大,数学模型建立的不准确则会导致聚焦误差,没有很好的泛化性能。聚焦深度法(DFF)是一种建立在搜索算法上的自动对焦方法,如专利文献CN105652429A公开了一种基于机器学习的显微镜细胞载玻片扫描自动聚焦方法,首先在扫描路径规划阶段,根据细胞载玻片情况确定选择扫描路径;然后在学习阶段,得到变步爬山法的步长、门限值以及低灰度值统计法的阈值;在聚焦阶段,首先使用灰度零值法判断当前位置以确定使用哪种聚焦策略,如果当前位置处于距离焦点较远处时,使用灰度零值法并使用大步长,经过试探判断焦点方向后进行移动,当位置处于焦点附近时选用较小步长,使用低灰度值统计法,经过试探判断焦点方向后进行移动,最后到达焦点位置聚焦完成。聚焦深度法(DFF)主要涉及聚焦评价函数的选择与设计、聚焦窗口的选择以及聚焦搜索策略的制定。在聚焦评价函数和聚焦窗口确定的情况下,聚焦搜索策略对聚焦性能的优劣起着决定性的作用。大量的诸如爬山法、二分法、斐波纳契搜索法、模糊控制搜索法、自适应步长法、函数曲线拟合法、离散差分方程预测法等搜索策略被用来自动聚焦,在一定程度上改善了调焦的速度和精度,但存在通用性较差,速率较慢的缺点,不适用于精度较高的显微镜自动聚焦。
技术实现思路
本专利技术针对现有技术的不足,提供一种基于机器学习的光学显微镜自动聚焦方法,将自动聚焦的调焦过程视为回归问题,通过设计特征和构造回归器,来同时获取显微镜调焦过程需要移动的步长和方向,避免了调焦过程中反复移动带来的回程误差。在保证显微镜聚焦精度的同时,大大的提高了聚焦的速度。本专利技术的具体技术方案如下:一种基于机器学习的光学显微镜自动聚焦方法,所述方法包括以下步骤:步骤1:沿着光学显微镜的Z轴采集p张原始图片Ii(x,y),并转化为灰度图fi(x,y),其中i={1,2,…,p},p=100~300;步骤2:重复步骤1,每次记为1组,采集q组数据共N张图片,q=20~40;步骤3:计算每张图片的48个原始特征和96个组合特征将所有图片用特征的形式表示,记为D={(x1,y1),(x2,y2),…,(xN,yN)},其中y表示当前图片到聚焦最清晰图片的序列差值,原始特征和组合特征的总数记为m,和分别表示显微镜当前位置和下一个位置图片的第j种原始特征,表示第j种原始特征的第k种组合特征,其中j={1,2,…,24},k={1,2,3,4},m=144;步骤4:采用自助法(bootstrapping)将所有数据D分为n个数据子集{D1,D2,…,Dn},其中未抽到的样本构成袋外数据集步骤5:对于每个数据子集Di,从所有特征中随机抽取w个特征(w<m)做为回归树Ti的训练集,训练生成回归树Ti,其中i={1,2,…,n},w=1~143;步骤6:重复步骤5,训练得到n颗回归树,用袋外数据计算均方误差,记为其中i={1,2,…,n};步骤7:随机对所有样本x的特征j加入噪声干扰,再次计算袋外数据误差,记为其中i={1,2,…,n},j={1,2,…,m};步骤8:计算特征j的重要性I(j),其中j={1,2,…,m};步骤9:重复步骤7-8,计算出所有特征的重要性,筛选出r个重要性较高的特征,记为S=(s1,s2,…,sr};步骤10:用步骤9中的特征S和留一法将数据集D划分为训练集Dtrain和测试集Dtest;步骤11:在训练集Dtrain上采用基于梯度提升的回归树(GradientBoostingRegressionTree)方法训练得到强回归树FM(x),其中F0表示初始的弱回归树,ν表示学习率,M表示迭代的总次数,m={1,2,…,M},i=1,2,…,n,j=1,2,…,Jm,Jm表示迭代第m次时回归树的叶节点个数,γjm表示第m次迭代时第j个叶结点的最佳拟合值,I(x∈Rjm)表示第m次迭代当样本归结为第j个叶结点时值为1,否者为0;步骤12:采用迭代强回归树FM(x)进行聚焦,直到不符合迭代条件。更进一步地,步骤3中,采用聚焦评估函数Fj作为图片原始特征,采用显微镜当前视野图片的聚焦评估函数计算值和下一个位置的计算值作为图片的原始特征,聚焦评估函数Fj可以为以下24种:原始特征F1为autocorrelation,计算方法为其中μ,σ2是灰度图片f(x,y)均值和方差,M,N表示为灰度图片f(x,y)长宽的像素点数量,k是常数,这里设置为2;原始特征F2为Brenner,计算方法为原始特征F3为entropyhistogram,计算方法为其中p(k)表示图片中像素值为k的像素点的相对频率;原始特征F4为firstDerivGaussian,计算方法为其中⊙表示相关运算,为7*7的滤波器,其中i,j为整数,取值为这里设置σ为0.8;原始特征F5为3×3Laplacian,计算方法为其中⊙表示相关运算,原始特征F6为5×5Laplacian,计算方法为其中原始特征F7为LoG,计算方法为其中为9*9的滤波器,产生的方式如下:其中i,j为整数,取值范围如下这里σ设置为1.2;原始特征F8为M&Ghistogram计算方法为其中h(k)表示图片中像素值为k的数量,μ为θMG+1,这里θMG为阈值,计算方法如下Δ=2(f(x,y-1)-f(x,y+1))2+2(f(x-1,y)-f(x+1,y))2+(f(x-1,y-1)-f(x+1,y+1))2+(f(x-1,y+1)-f(x+1,y-1))2原始特征F9为M&Mhistogram,计算方法为其中h(k)表示图片中像素值为k的像素点的数量,μ表示图片像素值的均值,这里设置为128;原始特征F10为normalizedvariance,计算方法为其中μ是灰度图片f(x,y)均值;原始特征F11为3×3Prewitt,计算方法为其中原始特征F12为rangehistogram,计算方法为max{h(k)}-min{h(k)}其中h(k)表示图本文档来自技高网
...

【技术保护点】
1.一种基于机器学习的光学显微镜自动聚焦方法,其特征在于,包括如下步骤:步骤1:沿着光学显微镜的Z轴采集p张原始图片Ii(x,y),并转化为灰度图fi(x,y),其中i={1,2,...,p},p=100~300;步骤2:重复步骤1,每次记为1组,采集q组数据共N张图片,q=20~40;步骤3:计算每张图片的特征,特征数记为m,将所有图片用特征的形式表示,记为D={(x1,y1),(x2,y2),…,(xN,yN)},其中y表示当前图片到聚焦最清晰图片的序列差值;步骤4:采用自助法将所有数据D分为n个数据子集{D1,D2,...,Dn},其中未抽到的样本构成袋外数据集

【技术特征摘要】
1.一种基于机器学习的光学显微镜自动聚焦方法,其特征在于,包括如下步骤:步骤1:沿着光学显微镜的Z轴采集p张原始图片Ii(x,y),并转化为灰度图fi(x,y),其中i={1,2,...,p},p=100~300;步骤2:重复步骤1,每次记为1组,采集q组数据共N张图片,q=20~40;步骤3:计算每张图片的特征,特征数记为m,将所有图片用特征的形式表示,记为D={(x1,y1),(x2,y2),…,(xN,yN)},其中y表示当前图片到聚焦最清晰图片的序列差值;步骤4:采用自助法将所有数据D分为n个数据子集{D1,D2,...,Dn},其中未抽到的样本构成袋外数据集步骤5:对于每个数据子集Di,从所有特征中随机抽取w个特征做为回归树Ti的训练集,训练生成回归树Ti,其中i={1,2,...,n},w<m,w=1~143;步骤6:重复步骤5,训练得到n颗回归树,用袋外数据计算均方误差,记为其中i={1,2,...,n};步骤7:随机对所有样本x的特征j加入噪声干扰,再次计算袋外数据误差,记为其中i={1,2,...,n},j={1,2,…,m};步骤8:计算特征j的重要性I(j),其中步骤9:重复步骤7-8,计算出所有特征的重要性,结合阈值筛,多次迭代选出重要性较高的特征;步骤10:用步骤9中的特征和留一法将数据集D划分为训练集Dtrain和测试集Dtest,这里留一法表示留一组数据做为测试集Dtest,其余组别全部作为训练集Dtrain;步骤11:在训练集Dtrain上采用基于梯度提升的回归树方法训练得到强回归树FM(x),其中F0表示初始的弱回归树,v表示学习率,M表...

【专利技术属性】
技术研发人员:梁毅雄
申请(专利权)人:湖南品信生物工程有限公司
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1