一种基于卷积和注意力机制的图像差异识别方法技术

技术编号：36401606 阅读：18 留言：0更新日期：2023-01-18 10:08

一种基于卷积和注意力机制的图像差异识别方法，模板图像和对比图像分别输入编码器，经过多层由查询块和编码块组成的查询编码层编码之后，输出到解码器。在训练阶段，输入样本对儿对应的标签、并设定损失函数对模型进行训练。在推理阶段，模型解码器输出预测结果。利用计算机程序和图像传感器拍摄的图像，可以自动实现多张图像之间的内容差异识别，为现实应用中通过图像对比识别敏感内容的需求提供了一种健壮的智能化对别方法。种健壮的智能化对别方法。种健壮的智能化对别方法。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于卷积和注意力机制的图像差异识别方法

[0001]本专利技术涉及人工智能机器视觉的智能识别领域，具体涉及一种基于卷积和注意力机制的图像差异识别方法。

技术介绍

[0002]使用像机等图像传感器记录同一场景不同时刻的画面，对这些画面进行对比，从而甄别出场景的变化是一种常见的需求。例如，从遥感卫星拍摄的同一地点不同时期的地表变化图像，可以识别建筑、土壤、植被、重要设施等多种地表可观察事物的演变。或者，通过显微镜对别细胞、菌落等不同时刻的图像，可以观察实验的进展。再或者，通过照相机记录设备运转过程中不同时刻的画面，可以推理出设备破损、老化情况。这些场景中，大多数情形下，无法通过简单的图像颜色、像素值的变化自动识别出内容的变化，尤其是现实中拍摄时无法保证传感器姿态、拍摄环境、拍摄参数等多种条件一致，工业应用迫切需要一种健壮性的方法，可以允许在一定拍摄误差下智能识别出图像内容差异的技术。

技术实现思路

[0003]本专利技术为了克服以上技术的不足，提供了一种可以对抗相机角度、位姿、参数、光照环境等变化的情形的基于卷积和注意力机制的图像差异识别方法。
[0004]本专利技术克服其技术问题所采用的技术方案是：一种基于卷积和注意力机制的图像差异识别方法，包括如下步骤：a)建立图像差异识别模型，该模型由查询编码器、解码器及分类器构成；b)将模板图像和对比图像输入到编码器中；c)将编码器的输出结果输入到解码器中进行解码，输出得到预测结果图像。
[0005]进一步的，步骤b)包括如下步骤：b
...

【技术保护点】

【技术特征摘要】
1.一种基于卷积和注意力机制的图像差异识别方法，其特征在于，包括如下步骤：a)建立图像差异识别模型，该模型由查询编码器、解码器及分类器构成；b)将模板图像和对比图像输入到编码器中；c)将编码器的输出结果输入到解码器中进行解码，输出得到预测结果图像。2.根据权利要求1所述的基于卷积和注意力机制的图像差异识别方法，其特征在于，步骤b)包括如下步骤：b
‑
1)所述编码器N个查询编码层堆叠构成，每个查询编码器的输入来自上一个查询编码器的输出，N为大于等于2的正整数，每一个查询编码器由查询块和编码块构成；b
‑
2)将模板图像输入到第一个查询编码层中的查询块，查询块利用卷积操作对模板图像进行编码，输出得到特征图；b
‑
3)将第一个查询编码层中的查询块输出的特征图输入到第二个查询编码层中的查询块中，输出得到特征图；b
‑
4)重复步骤b
‑
3)直至第N个查询编码层的查询块输出特征图；b
‑
5)将第一个查询编码层中的查询块输出的特征图切割为相同尺寸的多个子区域，将切割后的多个子区域进行线性投影后与经经过分割和线性投影之后的对比图像的编码一起输入到第一个查询编码层中的编码块中，编码块利用多头注意力模块进行再编码，输出最新的编码；b
‑
6)将第一个查询编码层的编码块的输出复制两份，分别作为键和值输入到第二个查询编码层中的编码块中，将第二个查询编码层中的查询块输出的特征图切割为相同尺寸的多个子区域，将切割后的多个子区域进行线性投影后输入到第二个查询编码层中的编码块中，输出得到特征图分割后的线性投影的输出；b
‑
7)重复步骤b
...

【专利技术属性】
技术研发人员：高岩，郝虹，尹青山，宋虎，南国，
申请(专利权)人：山东新一代信息产业技术研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人