一种基于改进自注意力机制的管线识别方法及系统技术方案

技术编号：38903195 阅读：16 留言：0更新日期：2023-09-22 14:21

本发明专利技术提出了一种基于改进自注意力机制的管线识别方法及系统，涉及计算机视觉领域。本发明专利技术首先根据原有管线数据集进行管线数据扩充，并通过间距控制还原管线分布特征，解决管线数据集数据不平衡问题，然后将特征金字塔中的有效目标特征与传统自注意力机制模型相结合，从而充分利用自注意力机制和特征金字塔的优势，在特征的表达和多尺度信息的处理上取得双赢的效果。得双赢的效果。得双赢的效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进自注意力机制的管线识别方法及系统

[0001]本专利技术属于计算机视觉领域，特别涉及一种基于改进自注意力机制的管线识别方法及系统。

技术介绍

[0002]自注意力机制和特征金字塔是深度学习领域中两个备受瞩目的特征处理技术。自注意力机制通过学习特征之间的相互依赖关系，使得模型能够准确地捕捉上下文信息，无论是在自然语言处理还是计算机视觉任务中都展现了出色的性能。另一方面，特征金字塔则专注于解决多尺度信息的问题。特征金字塔可以有效地整合不同尺度下的特征，从而提升了模型对不同尺寸目标的识别能力。然而，尽管自注意力机制和特征金字塔在各自的领域内都取得了显著的成就，但目前却缺乏一个有效的方法将它们结合起来，以进一步提升模型的性能。目前存在的结合尝试往往面临着融合策略不明确、模型复杂度增加等问题，使得最终效果不如预期。如果能够在一个模型中充分利用自注意力机制和特征金字塔的优势，就能够在特征的表达和多尺度信息的处理上取得双赢的效果。

技术实现思路

[0003]本专利技术提供一种基于改进自注意力机制的管线识别方法及系统，旨在利用自注意力机制和特征金字塔的优势提高管线的识别效果。
[0004]本专利技术对于传统自注意力机制作出了改进，提供一种基于改进自注意力机制的管线识别方法，包括以下步骤：S1、设置训练模式和识别模式，在训练模式，从管线数据集获得所有待检测图像和标注数据，统计每种管线的数量，根据数量最大值进行数据扩充操作，将每种管线的数量都提升至数量最大值，从而获得扩充数据，并形成新管线数据集，在识...

【技术保护点】

【技术特征摘要】
1.一种基于改进自注意力机制的管线识别方法，其特征在于，包括以下步骤：S1、设置训练模式和识别模式，在训练模式，从管线数据集获得所有待检测图像和标注数据，统计每种管线的数量，根据数量最大值进行数据扩充操作，将每种管线的数量都提升至数量最大值，从而获得扩充数据，并形成新管线数据集，在识别模式，只获得所有待检测图像，并形成新管线数据集；S2、构建改进自注意力机制模型，模型由骨干网络、多层MHSA构建的编码器和解码器、特征金字塔分支组成；S3、将新管线数据集所有待检测图像和标注数据输入到骨干网络得到图像特征图，将图像特征图输入到特征金字塔分支，输出P2、P3、P4特征图；S4、使用目标位置检测头在P2、P3、P4特征图进行检测，并通过阈值筛选，获得每层特征图中存在目标的位置编码；S5、将图像特征图输入到编码器中，按照S3中的位置编码，抽取P2、P3、P4特征图对应位置的特征，并与模型编码器中每层MHSA模块的输出特征进行特征优化操作，获得管线检测结果。2. 根据权利要求1所述的一种基于改进自注意力机制的管线识别方法，其特征在于，S1提到的数据扩充操作为，统计单个种类管线数量最大值，并将每种管线的数量都提升至数量最大值，首先，设置得到每种管线的扩充数量，生成相同尺寸的新空白图像，从标注数据中随机选取一定数量需要进行扩充的同种类管线，并按照扩充种类个数进行相应次数选取，然后将选取管线的坐标数据当做新目标坐标数据，并复制原图中对应的目标到新空白图像，然后得到一张包含多种管线的新图像，经过多次重复得到多张类似新图像，直至所有管线种类数量均提升至数量最大值，在每一张新图像选取管线的过程中，设置对应坐标列表，每增加一个目标就将坐标存入坐标列表，每次将选取目标放入新图像前，需要将选取目标坐标和坐标列表中的已有坐标进行对比，只有当选取目标和新图像中的已有目标达到一定间距时，选取目标才可放入新图像，否则重新选取目标。3. 根据权利要求1所述的一种基于改进自注意力机制的管线识别方法，其特征在于，S2中的MHSA为多头自注意力，是一种用于处理序列数据和图像数据的机制，应用于自注意力机制模型，用于捕捉序列中不同位置之间的关系。4. 根据权利要求1所述的一...

【专利技术属性】
技术研发人员：李忠涛，刘圣勇，张玉璘，
申请(专利权)人：济南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人