基于深度学习的亚像素位移方法技术

技术编号:36924207 阅读:7 留言:0更新日期:2023-03-22 18:47
本发明专利技术公开了一种基于深度学习的亚像素位移方法,涉及深度学习领域。本发明专利技术包括以下步骤:S1:获取3通道图像,所述3通道图像由3张单通道的灰度图在三维上叠加而成;S2:将3通道图像输入到ST

【技术实现步骤摘要】
基于深度学习的亚像素位移方法


[0001]本专利技术涉及深度学习领域,更具体的说是涉及一种基于深度学习的亚像素位移方法。

技术介绍

[0002]数字散斑相关方法(DSCM)又称数字图像相关方法(DICM)。它经过四十多年不断的理论创新和实践发展,毫无疑问已成为现代科学中不可或缺的光学测量方法之一。它以光学基本理论为主要基础,以力学实验为主要抓手,还结合了数学、材料学、电子计算机、图像处理以及人工智能等多学科交叉技术,其原理是通过比较变形前后的两幅散斑图像的数值信息来进行测量。对DSCM的研究主要集中在基于整像素位移搜索算法和基于亚像素位移搜索算法等方面,整像素位移搜索为亚像素位移搜索提供了像素级的初值,最后通过亚像素位移搜索来进一步提高测量精度,所以亚像素位移方法尤为重要。基于亚像素位移搜索算法主要有:梯度法、曲面拟合法等传统非迭代亚像素算法,FA

NR和IC

GN等传统迭代亚像素算法和基于人工神经网络(ANN)、卷积神经网络(CNN)等人工智能新型亚像素算法。与此同时,深度学习的广泛应用,为以完成位移场和应变场的检测提供了新的解决思路。

技术实现思路

[0003]有鉴于此,本专利技术提供了一种基于深度学习的亚像素位移方法,将传统的测量方法与深度学习相结合,可以避免传统的亚像素位移搜索算法限制于插值方法计算、图像梯度计算、初始值估计、迭代计算等各种计算问题,有助于提高测量精度、测量效率、测量实时性和方法的鲁棒性。
[0004]为了实现上述目的,本专利技术采用如下技术方案:
[0005]一种基于深度学习的亚像素位移方法,包括以下步骤:
[0006]S1:获取3通道图像,所述3通道图像由3张单通道的灰度图在三维上叠加而成:
[0007]S2:将3通道图像输入到ST

SDM中;
[0008]S3:在ST

SDM中,基于3通道图像分别利用第一级分类任务,第二级分类任务和第三级分类任务输出亚像素位移值。
[0009]可选的,在S1中,3张单通道的灰度图分别是:参考图像,目标图像,目标图像与参考图像对应点位上灰度值的差值而生成的灰度图。
[0010]可选的,在S3中具体包括:
[0011]对第一目标图像进行四个角度的顺时针旋转,分别叠加参考图像和对第一目标图像旋转后的4幅图像,得到4幅3通道的图像Img1(1),Img2(1),Img3(1),Img4(1);
[0012]使用F

ST计算0.1pixel像素级的位移值,得到(u1,v1);
[0013]用位移(

u1,

v1)对第一目标图像平移变形后得到第二目标图像,分别叠加参考图像和对第二目标图像旋转后的4幅图像,得到4幅3通道的图像Img1(2),Img2(2),Img3(2),Img4(2);
[0014]使用S

ST计算0.01pixel像素级的位移值,得到(u2,v2);
[0015]用位移(

u2,

v2)对第一目标图像平移变形后得到第三目标图像,分别叠加参考图像和对第三目标图像旋转后的4幅图像,得到4幅3通道的图像Img1(3),Img2(3),Img3(3),Img4(3);
[0016]使用T

ST计算0.001pixel像素级的位移值,得到(u3,v3);
[0017]得到最终的亚像素位移值(u,v)=(u1+u2+u3,v1+v2+v3)。
[0018]可选的,F

ST是第一级分类任务输出亚像素位移值的过程,S

ST是第二级分类任务输出亚像素位移值的过程,T

ST是第三级分类任务输出亚像素位移值的过程。
[0019]可选的,第一级分类任务中,在[0,0.9]的亚像素区间,以0.1为间隔,分为10类;第二级分类任务中,在[0,0.09]的亚像素区间,以0.01为间隔,分为10类;第三级分类任务中,在[0,0.009]的亚像素区间,以0.001为间隔,分为10类。
[0020]可选的,ST

SDM包括:区块划分、线性编码、区块合并、ST块。
[0021]可选的,ST

SDM的计算精度使用模型预测的准确率和平均偏差误差u
e
进行定量评估,u方向的位移平均偏差误差u
e
定义为:
[0022][0023]式中n表示子区中心点的数量,u
i
表示第i个POI处的位移计算值,u
d
表示真实亚像素位移值;计算效率以模型处理每张图片的平均耗时来定量表示。
[0024]经由上述的技术方案可知,与现有技术相比,本专利技术公开提供了一种基于深度学习的亚像素位移方法,具有以下有益效果:
[0025]1.采用三级分类任务,更容易获得训练集,网络结构简单,且每一级的分类只有10类,一共30类便能包含了1000个类别。
[0026]2.采用旋转

相对标签值法解决了位移正负的问题
[0027]3.采用平方式数据集扩充法来快速扩充数据集以满足深度学习算法需要大量的训练数据才能表现出优秀性能的要求。
附图说明
[0028]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0029]图1为本专利技术的流程示意图;
[0030]图2为本专利技术的旋转

相对标签值法示意图;
[0031]图3为本专利技术的Swin

Transformer结构图;
[0032]图4为本专利技术的ST

SDM的过程图。
具体实施方式
[0033]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于
本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0034]本专利技术实施例公开了一种基于深度学习的亚像素位移方法,如图1所示,包括以下步骤:
[0035]S1:获取3通道图像,3通道图像由3张单通道的灰度图在三维上叠加而成;
[0036]S2:将3通道图像输入到ST

SDM中;
[0037]S3:在ST

SDM中,基于3通道图像分别利用第一级分类任务,第二级分类任务和第三级分类任务输出亚像素位移值。
[0038]进一步的,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的亚像素位移方法,其特征在于,包括以下步骤:S1:获取3通道图像,所述3通道图像由3张单通道的灰度图在三维上叠加而成;S2:将3通道图像输入到ST

SDM中;S3:在ST

SDM中,基于3通道图像分别利用第一级分类任务,第二级分类任务和第三级分类任务输出亚像素位移值。2.根据权利要求1所述的一种基于深度学习的亚像素位移方法,其特征在于,在S1中,3张单通道的灰度图分别是:参考图像,目标图像,目标图像与参考图像对应点位上灰度值的差值而生成的灰度图。3.根据权利要求1所述的一种基于深度学习的亚像素位移方法,其特征在于,在S3中具体包括:对第一目标图像进行四个角度的顺时针旋转,分别叠加参考图像和对第一目标图像旋转后的4幅图像,得到4幅3通道的图像Img1(1),Img2(1),Img3(1),Img4(1);使用F

ST计算0.1pixel像素级的位移值,得到(u1,v1);用位移(

u1,

v1)对第一目标图像平移变形后得到第二目标图像,分别叠加参考图像和对第二目标图像旋转后的4幅图像,得到4幅3通道的图像Img1(2),Img2(2),Img3(2),Img4(2);使用S

ST计算0.01pixel像素级的位移值,得到(u2,v2);用位移(

u2,

v2)对第一目标图像平移变形后得到第三目标图像,分别叠加参考图像和对第三目标图像旋转后的4幅图像,得到4幅3通道的图像Img1(3),Im...

【专利技术属性】
技术研发人员:铁治欣陈强陶灵兵陈燕兵
申请(专利权)人:浙江理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1