面向电力场景单张图像距离量测的深度神经网络模型制造技术

技术编号:38904335 阅读:13 留言:0更新日期:2023-09-22 14:22
本发明专利技术面向电力场景单张图像距离量测的深度神经网络模型,包含以下模块:特征提取模块(A)、空洞卷积模块(B)和距离映射模块(C);所述特征提取模块(A)用于将输入的RGB图像抽取为特征向量;所述空洞卷积模块(B)用于扩大感受野;所述距离映射模块(C)用于生成距离信息,本发明专利技术构造的损失函数,不仅包含各个像素上的距离预测误差,同时还顾及了不同像素之间距离预测误差的符号一致性和数值相关性,利用不同像素间的像素距离计算权重,相比传统损失函数能更好地反映全局计算误差。能更好地反映全局计算误差。能更好地反映全局计算误差。

【技术实现步骤摘要】
面向电力场景单张图像距离量测的深度神经网络模型


[0001]本专利技术涉及一种面向电力场景单张图像距离量测的深度神经网络模型,它用于从单张图像中提取电力场景的距离信息。

技术介绍

[0002]单张图像距离量测主要通过复杂的非线性仿射变换建立RGB像素与空间距离间的回归模型。
[0003]单张图像距离量测技术发展经历了传统算法、机器学习算法和深度学习算法三个阶段。传统算法利用图像的纹理几何信息来估计局部距离信息,只能用于严格限定的应用场景,且仅能计算图像中相对距离,不仅计算量大、预测精度也不高。
[0004]机器学习算法利用马尔可夫/条件随机场进行建模,以能量函数最小为准则求解距离,由于需要人工假定RGB与距离之间的关系,因而其预测精度有限。
[0005]深度学习算法利用深层卷积神经网络来逐层抽象图像的特征,并通过反向传播优化权重,因此其精度较传统方法和机器学习方法要高。
[0006]但是现有深度学习算法所使用的卷积层,提取出的局部特征无法有效地和全局特征融合,成为制约距离量测精度的重要因素。

技术实现思路

[0007]本专利技术的目的在于克服上述现有
技术介绍
的不足之处,而提供一种面向电力场景单张图像距离量测的深度神经网络模型,本专利技术可以提高单张图像距离量测的精度,尤其是电力场景下单张图像距离量测的精度。
[0008]本专利技术的目的是通过如下措施来达到的:面向电力场景单张图像距离量测的深度神经网络模型,其特征在于包含以下模块:特征提取模块、空洞卷积模块和距离映射模块;
[0009]所述特征提取模块用于将输入的RGB图像抽取为特征向量,包含N层卷积层,N≥3,其中第1层卷积层的输入为原始图像,第i层卷积层的输入为第1至第i

1层卷积层的经降采样的输出之和,i≥2;
[0010]所述空洞卷积模块用于扩大感受野,包含N个子模块,N≥3,其中第i个子模块用于连接第i层特征提取模块和第i层距离映射模块,i=1,2,

,N;且第i个子模块的输入为所述特征提取模块中第i层卷积层的输出、第i+1至第N个子模块的经上采样的输出之和;
[0011]所述距离映射模块用于生成距离信息,包含N个映射层,N≥3,且其中第i个映射层的输入为第i层空洞卷积子模块的输出、第N至第i+1层距离映射层的经上采样的输出、第i层特征提取层的输出之和。
[0012]在上述技术方案中,所述神经网络模型的损失函数为:其中n为像素个数,表示距离预测值L
i
与距离参考值之间的差值,log为对数函数,d
ij
表示两个像素点之间的像素距离。
[0013]在上述技术方案中,所述降采样采用平均池化,所述上采样采用双线性插值。
[0014]在上述技术方案中,所述特征提取模块中,第1层卷积层输出128个通道,第i层卷积层的输出通道数为第i

1层卷积层的2倍,i≥2。
[0015]在上述技术方案中,所述距离映射模块中的每一个映射层,由上采样层、通道降维卷积层、合成卷积层构成。
[0016]本专利技术针对电力场景下,距离较为连续平滑的特点,通过构建具有特殊结构的深度神经网络模型,将单张图像的局部与全局特征进行多尺度融合,提升了距离量测的准确率。通过引入空洞卷积,扩大了特征提取的感受野,提高了获取全局特征的运算效率。通过多层子模块之间的直接连接,能很好地解决现有技术中深层网络梯度消失问题。
[0017]传统的损失函数仅考虑各个像素上的距离预测误差,未考虑不同像素上预测误差之间的相关性,因而不能客观的反映整体的预测效果。本专利技术构造的损失函数,不仅包含各个像素上的距离预测误差,同时还顾及了不同像素之间距离预测误差的符号一致性和数值相关性,利用不同像素间的像素距离计算权重,相比传统损失函数能更好地反映全局计算误差。
附图说明
[0018]图1为本专利技术一个实施例模型的结构示意图。
[0019]图中:raw表示原始输入图像,out表示最终输出的距离图像,A表示特征提取模块,B表示空洞卷积模块,C表示距离映射模块,字母后面的数字表示层的序号,如:A1

4表示特征提取模块的第1

4层;B1

4表示空洞卷积模块的第1

4个子模块;C1

4表示距离映射模块的第1

4层;箭头方向为传输方向。
具体实施方式
[0020]下面结合附图详细说明本专利技术的实施情况,但它们并不构成对本专利技术的限定,仅作举例而已。同时通过说明本专利技术的优点将变得更加清楚和容易理解。
[0021]参阅附图可知:本专利技术面向电力场景单张图像距离量测的深度神经网络模型,其特征在于包含以下模块:特征提取模块A、空洞卷积模块B和距离映射模块C;
[0022]所述特征提取模块A用于将输入的RGB图像抽取为特征向量,包含N层卷积层,N≥3,其中第1层卷积层的输入为原始图像,第i层卷积层的输入为第1至第i

1层卷积层的经降采样的输出之和,i≥2;
[0023]所述空洞卷积模块B用于扩大感受野,包含N个子模块,N≥3,其中第i个子模块用于连接第i层特征提取模块和第i层距离映射模块,i=1,2,

,N;且第i个子模块的输入为所述特征提取模块中第i层卷积层的输出、第i+1至第N个子模块的经上采样的输出之和;
[0024]所述距离映射模块C用于生成距离信息,包含N个映射层,N≥3,且其中第i个映射层的输入为第i层空洞卷积子模块的输出、第N至第i+1层距离映射层的经上采样的输出、第i层特征提取层的输出之和。
[0025]所述神经网络模型的损失函数为:其中n为像素个数,表示距离预测值L
i
与距离参考值之间的差值,log为对数函数,d
ij
表示两个像素点之间的像素距离。
[0026]所述降采样采用平均池化,所述上采样采用双线性插值。
[0027]所述特征提取模块中,第1层卷积层输出128个通道,第i层卷积层的输出通道数为第i

1层卷积层的2倍,i≥2。
[0028]所述距离映射模块C中的每一个映射层,由上采样层、通道降维卷积层、合成卷积层构成。
[0029]图1示意性地给出了本专利技术的一个实施例。该实施例由特征提取模块A1

A4、空洞卷积模块B1

B4和距离映射模块C1

C4构成,每一个模块包含4层,也可以根据需要增加或减少层数。其中距离映射模块中的每一层均由上采样层、通道降维卷积层、合成卷积层构成。
[0030]表1为各模块之间的构成关系
[0031][0032]其中表示和,f(x)表示x模块的输出,
d
表示平均池化下采样,
u
表示双线性插值上采样,L为图像分辨率。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.面向电力场景单张图像距离量测的深度神经网络模型,其特征在于包含以下模块:特征提取模块(A)、空洞卷积模块(B)和距离映射模块(C);所述特征提取模块(A)用于将输入的RGB图像抽取为特征向量,包含N层卷积层,N≥3,其中第1层卷积层的输入为原始图像,第i层卷积层的输入为第1至第i

1层卷积层的经降采样的输出之和,i≥2;所述空洞卷积模块(B)用于扩大感受野,包含N个子模块,N≥3,其中第i个子模块用于连接第i层特征提取模块和第i层距离映射模块,i=1,2,

,N;且第i个子模块的输入为所述特征提取模块中第i层卷积层的输出、第i+1至第N个子模块的经上采样的输出之和;所述距离映射模块(C)用于生成距离信息,包含N个映射层,N≥3,且其中第i个映射层的输入为第i层空洞卷积子模块的输出、第N至第i+1层距离映射层的经上采样的输出、第i层特征提取层的输出之和。2.根据权利要求1所述的...

【专利技术属性】
技术研发人员:吴新桥覃平陈远刘岚张宸瑞詹谭博驰董永明黄林超周雨迪张可颖沈家旭金石
申请(专利权)人:南方电网数字电网科技广东有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1