一种机器学习任务用水下视觉图像数据集的获取方法技术

技术编号:39641560 阅读:10 留言:0更新日期:2023-12-09 11:08
本发明专利技术提供了一种机器学习任务用水下视觉图像数据集的获取方法,属于水下光电成像技术领域

【技术实现步骤摘要】
一种机器学习任务用水下视觉图像数据集的获取方法


[0001]本专利技术属于水下光电成像
,尤其涉及一种机器学习任务用水下视觉图像数据集的获取方法


技术介绍

[0002]水下光电成像技术是现代海洋光学研究的重要方向之一,也是本专利技术的基础理论

水下光电成像和空气中成像存在差异,原因在于光子在水体里更容易发生散射或者折射,光子在水下传播的衰减显著

由于水体对光的吸收散射作用,水下图像会产生色彩失真

对比度低等问题,进而影响了水下观测工作

因此想要深入探测水下状况,首先就需要进行水下视觉处理,获取分辨率更高的水下图像

当前,水下视觉处理面临着许多困难,主要有以下几个方面:水下图像质量低,受到水体吸收

散射

色彩失真

噪声干扰等因素的影响

水下目标多样,形状

大小

颜色

纹理等特征不明显或不稳定,难以区分背景和前景

基于机器学习的水下视觉处理水下数据集缺乏,水下环境复杂多变,难以获取大量高质量的标注数据,导致训练数据不足或不平衡

[0003]基于机器学习的水下视觉图像处理利用机器学习算法对水下图像进行分析和处理,以实现水下目标的检测

识别

定位

跟踪等功能
r/>这是一个具有重要应用价值和挑战性的研究领域,涉及到水下机器人

海洋资源开发

海洋环境监测等方面

为了解决水下视觉处理当前存在的问题,基于机器学习的水下视觉图像处理主要采用了以下几种方法:数据预处理,对水下图像进行增强

去噪

校正等操作,以改善其可视性和特征表达

数据集处理,通过数据增广

样本均衡

多尺度训练等方式,扩充和优化训练数据集

模型选取与训练,根据水下目标的特点,选择合适的机器学习模型,如单目或双目视觉
、one

stage

two

stage
检测网络等,并采用一些
trick
来提高模型的性能和鲁棒性

[0004]基于机器学习的水下视觉图像处理目前还有许多问题有待进一步探索和解决

例如,如何提高水下图像的质量和信息量,如何设计更适合水下场景的机器学习模型和算法,如何构建更大更全面的水下数据集等

[0005]数据集作为数据驱动,是机器学习的基础,没有数据集,机器无法训练学习,进而无法预测

其作为机器学习的输入,数据集包含了训练数据和测试数据,通常将水下模糊退化图像作为输入,用其对应的清晰图像在网络输出作为监督

在机器学习中,数据集的质量和数量对模型的准确性有很大影响

[0006]当前常见的获取机器学习数据集的方法包括,在线数据集:
UCI
机器学习数据库
、Kaggle、Google Dataset Search
等;爬虫:通过爬虫程序从网站上获取数据集;数据库:从数据库中获取数据集;自己制作:自己制作数据集,如手动标注图片

但现存的数据集获取方法大多建立在已有现实拍摄图像或对抗网络生成的基础上,数量有限
(
现实拍摄
)
或效率

质量不高
(
对抗网络生成
)
,限制了机器学习准确性的提高


技术实现思路

[0007]本专利技术针对机器学习水下视觉图像数据集数量不足

质量不高的缺口,通过
RGB
三色通道各自在不同水体环境下的衰减扩散情况和光场分布,从几何光学的角度,在光子传播过程的散射衰减物理依据下,建立复杂水体环境下图像
RGB
通道传输成像仿真模拟模型,利用清晰目标图像,快速准确仿真模拟得到复杂水体环境中的退化成像效果,从而丰富机器学习数据集

[0008]本专利技术提供了一种机器学习任务用水下视觉图像数据集的获取方法,包括以下步骤:
[0009]步骤1,搭建水体环境下图像
RGB
通道传输成像仿真模型;运用朗伯点光源模拟目标图像像素点,运用蒙特卡罗算法模拟光子水下传输,运用准直辐亮度计接收打在模拟接收平面上的光子;
[0010]步骤2,选取清晰的目标图像,将目标图像进行三通道分离及像素离散化处理后分解为基本的单通道单像素单元,根据目标图像的像素点在
RGB
三通道值的比例,完成目标图像
RGB
每个通道每个像素发射光子数目的定义;
[0011]步骤3,根据步骤2中的光子数目分配将每个单通道单像素单元输入到步骤1的仿真模型中进行光子水下传输的模拟,每个单通道单像素的光子达到接收平面后,被接收记录下光场信息;
[0012]步骤4,累计合成各个通道各个像素点,分别得到三个通道的水下仿真成像,之后将三个通道合并实现水体环境下的图像仿真成像,最后得到一组目标图像及对应的退化图像;
[0013]步骤5,选取若干张清晰的目标图像,每张目标图像分别循环上述步骤2至步骤4,最终得到机器学习任务用水下视觉图像数据集

[0014]优选的,所述朗伯点光源基于朗伯定律,用公式可以表示为
:
[0015]I
e

I0×
cos
θ
[0016]将坐标轴
z
轴规定为
I0的方向,每个光子与
z
轴方向的夹角记为天顶角
θ

θ
的取值范围为
[0,90
°
)
,同时每一个光子发射方向在
x

O

y
平面内的投影同
x
轴正向的夹角定义为方位角
φ

φ
的取值范围为
[0,360
°
)
,对天顶角
θ
和方位角
φ
分别进行等间距分割,模拟光子的发射方向

[0017]优选的,所述运用蒙特卡罗算法模拟光子水下传输,具体为:光子在模拟传播时,根据随机步长

随机散射方向和散射相位函数,更新自己的传播位置

传播方向和能量大小;光子在水下的传播衰减扩散过程,单个光子的随机步长
s
与水体的衰减系数
c
有如下关系:本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种机器学习任务用水下视觉图像数据集的获取方法,其特征在于,包括以下步骤:步骤1,搭建水体环境下图像
RGB
通道传输成像仿真模型;运用朗伯点光源模拟目标图像像素点,运用蒙特卡罗算法模拟光子水下传输,运用准直辐亮度计接收打在模拟接收平面上的光子;步骤2,选取清晰的目标图像,将目标图像进行三通道分离及像素离散化处理后分解为基本的单通道单像素单元,根据目标图像的像素点在
RGB
三通道值的比例,完成目标图像
RGB
每个通道每个像素发射光子数目的定义;步骤3,根据步骤2中的光子数目分配将每个单通道单像素单元输入到步骤1的仿真模型中进行光子水下传输的模拟,每个单通道单像素的光子达到接收平面后,被接收记录下光场信息;步骤4,累计合成各个通道各个像素点,分别得到三个通道的水下仿真成像,之后将三个通道合并实现水体环境下的图像仿真成像,最后得到一组目标图像及对应的退化图像;步骤5,选取若干张清晰的目标图像,每张目标图像分别循环上述步骤2至步骤4,最终得到机器学习任务用水下视觉图像数据集
。2.
如权利要求1所述的一种机器学习任务用水下视觉图像数据集的获取方法,其特征在于:所述朗伯点光源基于朗伯定律,用公式可以表示为
:I
e

I0×
cos
θ
将坐标轴
z
轴规定为
I0的方向,每个光子与
z
轴方向的夹角记为天顶角
θ

θ
的取值范围为
[0,90
°
)
,同时每一个光子发射方向在
x

O

y
平面内的投影同
x
轴正向的夹角定义为方位角
φ

φ
的取值范围为
[0,360
°
)
,对天顶角
θ
和方位角
φ
分别进行等间距分割,模拟光子的发射方向
。3.
如权利要求1所述的一种机器学习任务用水下视觉图像数据集的获取方法,其特征在于,所述运用蒙特卡罗算法模拟光子水下传输,具体为:光子在模拟传播时,根据随机步长

随机散射方向和散射相位函数,更新自己的传播位置

传播方向和能量大小;光子在水下的传播衰减扩散过程,单个光子的随机步长
s
与水体的衰减系数
c
有如下关系:
s


ln
τ
/c
其中,
s
为单个光子的随机步长,
τ

[0,1]
间随机数,
c
为提前设置的散射系数和吸收系数之和;在蒙特卡罗模拟过程中,光子会与介质中粒子发生碰撞,每次碰撞后必须根据散射相函数通过抽样确定出散射方向,采用的
Henyey

Greenstein
散射相函数的解析形式可表示为:其中,
θ
为光子下次动作时与
z
轴方向的夹角;
g
为先前输入的不对称因子,当
g
为0时,水体各向同性;
rnd
为自动产生的
(0,1)
区间内随机数<...

【专利技术属性】
技术研发人员:江克洲隋均茹昝瑞
申请(专利权)人:南通海沐海洋工程装备有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1