图像合成模型的训练方法、装置与电子设备制造方法及图纸

技术编号：29134595 阅读：19 留言：0更新日期：2021-07-02 22:30

本公开提供一种图像合成模型的训练方法、装置与电子设备，训练方法包括：对第一灰度图像样本和第二灰度遮罩图像样本进行合成处理，以获得合成图像样本；将采样图像样本数据输入至卷积神经网络进行训练，输出为单应性变换矩阵；根据单应性变换矩阵对第一灰度图像样本进行变换，以得第一灰度变换图像样本；确定第一灰度变换图像样本的第i个索引位置的第一像素值，第二灰度遮罩图像样本的第i个索引位置的第二像素值，并确定较大值；根据第一像素值、第二像素值和第二灰度遮罩图像样本的全部索引位置的像素值确定卷积神经网络的训练损失，并调整配置参数。通过本公开实施例，提升了单应性变换参数估计的准确性、图像合成的可靠性和适用性。

全部详细技术资料下载

【技术实现步骤摘要】
图像合成模型的训练方法、装置与电子设备
本公开涉及图像处理
，具体而言，涉及一种图像合成模型的训练方法、装置与电子设备。
技术介绍
目前，单应性变换是指从不同视角拍摄同一平面上物体形成的图像之间存在的映射关系，单应性变换被广泛应用于图像拼接、单目SLAM、视频稳定等领域，一般用一个3x3矩阵或等价的4-point形式H4pt表示。单应性变换估计传统上一般采用基于局部特征算子，例如SIFT(Scale-InvariantFeatureTransform，即尺度不变特征变换，是一种计算机视觉的特征提取算法，用来侦测与描述图像中的局部性)特征和ORB(OrientedFASTandRotatedBRIEF，尺度和旋转不变性)等，利用特征匹配建立两张图关键点集的对应关系，再使用RANSAC(随机一致性采样)寻找最佳的单应性变换参数估计。然而，在未能检测到足够多的图像特征关键点的情况下，或者在因图像间光照、视角差异过大引起的关键点匹配错误的情况下，基于特征算子估计单应性变换参数往往很不准确。在相关技术中，随着深度学习技术的发展，对单应性变换参数估计的研究目前已转向了基于深度学习的方法。但是，基于深度学习方式的图像合成方案至少存在以下技术问题：(1)缺少随机一致性采样的处理过程，不能排除运动物体或不在假设平面上的物体影响，造成了单应性变换参数估计不准确的问题。(2)损失函数直接在图像亮度域上计算，缺乏对环境光照变化的鲁棒性。(3)图像合成的方案只适用于描述平面目标的运动或由相机旋转引...

【技术保护点】
1.一种图像合成模型的训练方法，其特征在于，包括：/n对第一灰度图像样本和第二灰度遮罩图像样本进行合成处理，以获得合成图像样本；/n将所述采样图像样本数据输入至卷积神经网络进行训练，所述卷积神经网络的输出为单应性变换矩阵；/n根据单应性变换矩阵对所述第一灰度图像样本进行变换，以得第一灰度变换图像样本；/n确定所述第一灰度变换图像样本的第i个索引位置的第一像素值，所述第二灰度遮罩图像样本的第i个索引位置的第二像素值，并确定所述第一像素值与所述第二像素值之间的较大值；/n根据所述第一像素值、所述第二像素值和所述第二灰度遮罩图像样本的全部索引位置的像素值确定所述卷积神经网络的训练损失，并根据所述训练损失调整所述卷积神经网络的配置参数。/n

【技术特征摘要】
1.一种图像合成模型的训练方法，其特征在于，包括：
对第一灰度图像样本和第二灰度遮罩图像样本进行合成处理，以获得合成图像样本；
将所述采样图像样本数据输入至卷积神经网络进行训练，所述卷积神经网络的输出为单应性变换矩阵；
根据单应性变换矩阵对所述第一灰度图像样本进行变换，以得第一灰度变换图像样本；
确定所述第一灰度变换图像样本的第i个索引位置的第一像素值，所述第二灰度遮罩图像样本的第i个索引位置的第二像素值，并确定所述第一像素值与所述第二像素值之间的较大值；
根据所述第一像素值、所述第二像素值和所述第二灰度遮罩图像样本的全部索引位置的像素值确定所述卷积神经网络的训练损失，并根据所述训练损失调整所述卷积神经网络的配置参数。

2.如权利要求1所述的图像合成模型的训练方法，其特征在于，在对第一灰度图像样本和第二灰度遮罩图像样本进行合成处理前，还包括：
对待合成的两个灰度图像进行高斯滤波，以获得滤波图像；
对所述滤波图像进行梯度算子处理，以获得梯度图像；
确定所述梯度图像中的灰度最大值，并将所述梯度图像中的每个点的像素值除以所述灰度最大值，以获得归一化的灰度图像样本；
将所述灰度图像样本中的一个样本确定为所述第一灰度图像样本，将所述灰度图像样本中的另一个样本确定为所述第二灰度遮罩图像样本。

3.如权利要求1所述的图像合成模型的训练方法，其特征在于，对第一灰度图像样本和第二灰度遮罩图像样本进行合成处理，以获得合成图像样本，具体包括：
对所述第一灰度图像样本和所述第二灰度遮罩图像样本进行合并处理，以获得合并图像样本；
对所述合并图像样本进行下采样处理，并将采样处理的结果确定为所述合成图像样本。

4.如权利要求1所述的图像合成模型的训练方法，其特征在于，将所述采样图像样本数据输入至卷积神经网络进行训练，所述卷积神经网络的输出为单应性变换矩阵，具体包括：
将所述合成图像样本输入至所述卷积神经网络，所述卷积神经网络执行1×1的卷积操作，所述卷积神经网络的输入通道为2，所述卷积神经网络的输出通道为3；
将所述输出通道的结果执行块归一化操作；
将所述块归一化操作的结果输入至回归骨干网，所述回归骨干网络输出单应性变换参数；
将所述单应性变换参数输入至直接线性变换层，所述直接线性变换层输出为所述单应性变换矩阵。

5.如权利要求1所述的图像合成模型的训练方法，其特征在于，所述卷积神经网络执行卷积核为5×5，所述卷积神经网络的执行步长为2，所述卷积神经网络...

【专利技术属性】
技术研发人员：姚寒星，王锦申，
申请(专利权)人：北京亮亮视野科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人