一种视觉理解模型的建立方法和图像分割预测方法技术

技术编号：37412471 阅读：10 留言：0更新日期：2023-04-30 09:37

本发明专利技术公开了一种视觉理解模型的建立方法和图像分割预测方法，属于视觉理解技术领域，建立方法包括：建立条件边缘损失函数；训练初始视觉理解模型过程通过条件边缘损失函数调整模型参数得到目标视觉理解模型。条件边缘损失函数通过采样各个锚点所对应的正样本与负样本，利用正样本产生锚点所对应的条件局部类中心，通过监督条件局部类中心特征使其含有丰富的本类判别性特征，通过提升锚点特征与其对应的条件局部类中心特征之间的相似性，通过基于类别的锚点到样本间相似性监督将锚点周围的局部类别特征信息编码到锚点特征中。本发明专利技术能够使处于类别边缘的像素在学习到精确的类别相关信息，提高视觉理解任务中对于边缘像素分类的准确度。素分类的准确度。素分类的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种视觉理解模型的建立方法和图像分割预测方法

[0001]本专利技术属于视觉理解
，更具体地，涉及一种视觉理解模型的建立方法和图像分割预测方法。

技术介绍

[0002]边缘像素，是指图像中位于两不同类别交界处周围区域的像素。对于语义分割、目标分割等视觉理解任务，当前主流方法较难预测正确边缘像素的类别，因此提升边缘像素预测精度的工作对于进一步提升视觉理解任务的表现具有重要意义，例如医学图像分割、自动驾驶等领域中需要对目标进行精细轮廓的预测。由于主流方法均使用堆叠卷积层、池化层等降低分辨率的结构以获得大尺度感受野，因此边缘像素中会含有较多周围其他类别像素的类别相关特征，导致较低的边缘像素分类正确率。另外，主流方法多使用的自注意力机制与多尺度特征融合等主流方法也进一步加剧了此种现象。为解决上述问题，先前的边缘像素精度提升工作主要依靠添加边缘分割的辅助任务，或对输入图像全图的像素间关系进行监督。但因这些方法缺乏对每个边缘像素的条件性优化，导致与任务优化目标产生冲突。
[0003]前者通过在视觉理解模型训练过程中添加辅助的边缘像素分割任务与目标视觉理解任务共同优化，将像素是否为边缘像素的信息编码进特征中。但该边缘分割任务只是简单将不同语义类别的边缘像素都划归为边缘类别，不同语义类别的物体内部像素都划归为非边缘类别。由于忽视属于不同语义类别的边缘像素和属于不同语义类别的内部像素内部不一致的语义类别，边缘分割任务损害了类间区分性。此外，属于同一类别的边缘像素与内部像素之间也被分别划分为边缘类别与非边缘类别，降低了同类...

【技术保护点】

【技术特征摘要】
1.一种视觉理解模型的建立方法，其特征在于，包括：S1：建立条件边缘损失函数；所述条件边缘损失函数包括：基于正确率的条件采样模块、条件局部类中心生成模块、条件局部类中心分类损失结构、锚点
‑
条件局部类中心相似性损失结构和锚点
‑
样本相似性损失结构；S2：利用标准数据集训练初始视觉理解模型，训练过程通过所述条件边缘损失函数调整模型参数，得到目标视觉理解模型；所述标准数据集中每个标准数据包括：输入图及其对应的真值标签；其中，所述基于正确率的条件采样模块，用于根据所述输入图的特征图中预设区域内每个锚点确定出对应的多个候选样本，并从中确定出正样本集合和负样本集合；所述锚点的真值标签、候选样本的真值标签、候选样本的分割预测一致；所述条件局部类中心生成模块，以所述每个锚点对应的正样本集中的样本作为其输入，用于生成每个锚点的条件局部类中心特征，用以表征每个锚点的周围局部信息与类别相关信息；所述条件局部类中心分类损失结构，用于增强所述正样本集中每个锚点对应的条件局部类中心特征中局部信息与其真值类别的类别相关信息；所述锚点
‑
条件局部类中心相似性损失结构，用于增强每个锚点与其对应的条件局部类中心之间的特征相似性；所述锚点
‑
样本相似性损失结构，用于将每个锚点与其对应的正样本和负样本之间的细粒度类别关系信息编码到锚点特征中；所述条件边缘损失函数的最终输出损失为条件局部类中心分类损失结构、锚点
‑
条件局部类中心相似性损失结构以及锚点
‑
样本相似性损失结构三者输出损失之和。2.如权利要求1所述的视觉理解模型的建立方法，其特征在于，所述基于正确率的条件采样模块包括：局部邻居采样单元，用于针对每个锚点，其选取的候选样本处于锚点为中心的窗口内；正确分类采样单元，用于针对每个锚点，其选取的候选样本能够被当前训练中的视觉理解模型分类正确；同类别正样本采样单元，用于从每个锚点对应的所述候选样本中选取的正样本满足：与其所对应锚点的真值标签类别相同，以构成所述正样本集；非同类别负样本采样单元，用于从每个锚点对应的所述候选样本中选取的负样本满足：与其所对应锚点的真值标签类别不相同，以构成所述负样本集。3.如权利要求2所述的视觉理解模型的建立方法，其特征在于，所述条件局部类中心生成模块，用于以锚点的对应的正样本集合为输入，进行特征逐通道的平均操作，输出平均后的特征作为锚点对应的条件局部类中心特...

【专利技术属性】
技术研发人员：高常鑫，吴东岳，桑农，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人