基于信息混乱度度量的语义边缘检测方法及系统技术方案

技术编号：30899149 阅读：29 留言：0更新日期：2021-11-22 23:42

本公开提供了一种基于信息混乱度度量的语义边缘检测方法及系统，包括：获取待进行语义边缘检测的图像；将图像输入预先训练的语义边缘检测模型中，获得图像张量形式的神经网络表示图；使用混乱度度量函数对所述神经网络表示图计算混乱度图像，将混乱度图像进行归一化转换为语义边缘图像；其中，所述语义边缘检测模型采用神经网络模型，其训练过程基于真值对语义边缘的随机性最大化和对非语义边缘的随机性最小化，进行模型参数的训练。所述方案利用语义边缘特征较非语义边缘特征的固有信息混乱度差异来反映语义边缘的位置，从而有效提升了网络的训练效率，并在检测结果上缓解了结果不全和产生杂边的问题。果不全和产生杂边的问题。果不全和产生杂边的问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于信息混乱度度量的语义边缘检测方法及系统

[0001]本公开属于计算机视觉
，尤其涉及一种基于信息混乱度度量的语义边缘检测方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息，不必然构成在先技术。
[0003]边缘作为一种指示视觉场景中结构信息的关键因素，在计算机视觉任务中有广泛的应用。由于生物感知和计算处理过程的不同，边缘可以被分类为三类：对应于局部梯度变化的低层次边，人类能够直观感知到的感知边，以及表示不同实例或类别的边缘的语义边。对比前两种边缘，语义边从更高层次的视角反映视觉场景的信息，因此在目标检测，视觉显著性以及自动驾驶中有广泛的应用。然而，因为它需要从单纯边缘注释中准确理解隐藏在场景中的语义信息，所以检测高层次的语义边是非常具有挑战性的。
[0004]现有方法大多借助深度卷积神经网络来检测图像的语义边缘，通过使用一个预训练后的分割网络作为骨干网络，并且将语义边缘检测看作是一个二分类问题，旨在学习语义边缘和非语义边缘上的深度神经表示(特征)，然后将这些深度神经表示划分成两个不同的类，语义边缘上的神经表示以具有语义融合的形式出现。然而，由于语义融合的类型较多，无法有效通过学习来捕捉，无论是传统二值分割还是回归，都会导致语义边缘的不完整和噪声，进而导致语义边缘检测结果不全、检测杂边以及训练效率低下等问题。
[0005]专利技术人发现，与非边缘相比，边缘上的语义融合具有较大的信息随机性。借助这一理解，专利技术人从信息不确定性(随机性)度量的角度重新...

【技术保护点】

【技术特征摘要】
1.一种基于信息混乱度度量的语义边缘检测方法，其特征在于，包括：获取待进行语义边缘检测的图像；将图像输入预先训练的语义边缘检测模型中，获得图像张量形式的神经网络表示图；使用混乱度度量函数对所述神经网络表示图计算混乱度图像，将混乱度图像进行归一化转换为语义边缘图像；其中，所述语义边缘检测模型采用神经网络模型，其训练过程基于真值对语义边缘的随机性最大化和对非语义边缘的随机性最小化，进行模型参数的训练。2.如权利要求1所述的一种基于信息混乱度度量的语义边缘检测方法，其特征在于，所述神经网络模型采用残差网络和自注意力模块作为骨干网络，其通过1
×
1的卷积将特征通道减少的预设数量，并通过softmax操作获得用于测量随机性的神经网络表示图。3.如权利要求1所述的一种基于信息混乱度度量的语义边缘检测方法，其特征在于，所述神经网络模型的训练过程中，其网络参数通过下式进行优化：其中，Ω
E
和Ω
N
分别表示为边缘区域和非边缘区域，且Ω＝Ω
E
∩Ω
N
，和分别是定义在Ω
E
和Ω
N
的条件。4.如权利要求1所述的一种基于信息混乱度度量的语义边缘检测方法，其特征在于，所述混乱度度量函数，具体表示如下：其中，r(P
i，j
)表示在概率图P中(i，j)位置的信息不确定性度量，φ为神经网络模型的参数集合，τ
max
、τ
min
分别为信息不确定性度量的上下界。5.如权利要求4所述的一种基于信息混乱度度量的语义边缘...

【专利技术属性】
技术研发人员：蒋鹏，潘志一，曾琼，屠长河，
申请(专利权)人：山东大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人