基于混合池化的自注意力空间金字塔池化方法及相关组件技术

技术编号：42219145 阅读：36 留言：0更新日期：2024-07-30 18:59

本发明专利技术公开了一种基于混合池化的自注意力空间金字塔池化方法及相关组件，应用于视觉分析技术领域，为解决现有空间金字塔池化特征提取不充分的问题，提出将待分析图形的特征图组划分为第一特征图组和第二特征图组；通过通道分配层将第一特征图组划分为第一子特征图组和第二子特征图组；采用最大池化法和平均池化法分别对第一子特征图组和第二子特征图组进行池化处理，然后将得到的最大池化特征图组与平均池化特征图组进行拼接，采用自注意力模型对拼接后的池化特征图组进行扩充感受野处理，得到处理后的扩充特征图组；将扩充特征图组与第二特征图组进行拼接，得到空间金字塔池化结果；能够提升全局感受野，利于提升视觉分析性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视觉分析，特别是涉及一种基于混合池化的自注意力空间金字塔池化方法、装置、电子设备及计算机可读存储介质。

技术介绍

1、图像语义分割本质上是对图像中的每一个像素进行分类。现有语义分割算法主要基于编解码的架构进行设计，在编码器阶段，图像经过一系列卷积和池化操作变成富含高层语义信息的特征图；在解码器阶段，特征图逐步上采样产生与输入图像相等尺寸的预测结果。由于这种编解码的方式需要频繁下采样和上采样，会导致大量关键信息的丢失。针对这一问题，当前主流的解决方法有两种：

2、一种是减少特征提取模型的下采样数量，如enet（一种语音分割算法），enet通过丢弃模型最后阶段的下采样，以追求一个及其紧凑的框架，降低由于下采样导致的关键像素的丢失问题的发生。

3、另一种是采用多尺度融合的方法，由于底层特征使得模型能够看到很多图像的纹理细节，对于图像的某一小块来说可能十分精准，但是模型看不见整个对象，高层信息虽然使模型能够看到整个对象，但是下采样次数太多，边缘细节等信息变得模糊。因此，通过结合各个尺度特征信息对于上述问题的...

【技术保护点】

1.一种基于混合池化的自注意力空间金字塔池化方法，其特征在于，包括：

2.根据权利要求1所述的空间金字塔池化方法，其特征在于，所述采用自注意力模型对拼接后的池化特征图组进行扩充感受野处理，得到处理后的扩充特征图组，包括：

3.根据权利要求2所述的空间金字塔池化方法，其特征在于，所述采用对应的自注意力单元对所述子池化特征图组进行扩充感受野处理，得到与所述子池化特征图组中的每个子池化特征图对应的扩充特征图，包括：

4.根据权利要求3所述的空间金字塔池化方法，其特征在于，所述自注意力计算关系式为：

5.根据权利要求2所述的空间金字塔池化方法，其特...

【技术特征摘要】

1.一种基于混合池化的自注意力空间金字塔池化方法，其特征在于，包括：

4.根据权利要求3所述的空间金字塔池化方法，其特征在于，所述自注意力计算关系式为：

5.根据权利要求2所述的空间金字塔池化方法，其特征在于，所述将拼接后的池化特征图组中的各个池化特征图按照预设池化窗口...

【专利技术属性】
技术研发人员：张红亮，陈梅，杨小娜，马娜，魏祥，肖凤超，魏巍，
申请(专利权)人：杭州安脉盛智能技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人