【技术实现步骤摘要】
本专利技术涉及视觉分析,特别是涉及一种基于混合池化的自注意力空间金字塔池化方法、装置、电子设备及计算机可读存储介质。
技术介绍
1、图像语义分割本质上是对图像中的每一个像素进行分类。现有语义分割算法主要基于编解码的架构进行设计,在编码器阶段,图像经过一系列卷积和池化操作变成富含高层语义信息的特征图;在解码器阶段,特征图逐步上采样产生与输入图像相等尺寸的预测结果。由于这种编解码的方式需要频繁下采样和上采样,会导致大量关键信息的丢失。针对这一问题,当前主流的解决方法有两种:
2、一种是减少特征提取模型的下采样数量,如enet(一种语音分割算法),enet通过丢弃模型最后阶段的下采样,以追求一个及其紧凑的框架,降低由于下采样导致的关键像素的丢失问题的发生。
3、另一种是采用多尺度融合的方法,由于底层特征使得模型能够看到很多图像的纹理细节,对于图像的某一小块来说可能十分精准,但是模型看不见整个对象,高层信息虽然使模型能够看到整个对象,但是下采样次数太多,边缘细节等信息变得模糊。因此,通过结合各个尺度特征信息对于上述问题的
...【技术保护点】
1.一种基于混合池化的自注意力空间金字塔池化方法,其特征在于,包括:
2.根据权利要求1所述的空间金字塔池化方法,其特征在于,所述采用自注意力模型对拼接后的池化特征图组进行扩充感受野处理,得到处理后的扩充特征图组,包括:
3.根据权利要求2所述的空间金字塔池化方法,其特征在于,所述采用对应的自注意力单元对所述子池化特征图组进行扩充感受野处理,得到与所述子池化特征图组中的每个子池化特征图对应的扩充特征图,包括:
4.根据权利要求3所述的空间金字塔池化方法,其特征在于,所述自注意力计算关系式为:
5.根据权利要求2所述的空间
...【技术特征摘要】
1.一种基于混合池化的自注意力空间金字塔池化方法,其特征在于,包括:
2.根据权利要求1所述的空间金字塔池化方法,其特征在于,所述采用自注意力模型对拼接后的池化特征图组进行扩充感受野处理,得到处理后的扩充特征图组,包括:
3.根据权利要求2所述的空间金字塔池化方法,其特征在于,所述采用对应的自注意力单元对所述子池化特征图组进行扩充感受野处理,得到与所述子池化特征图组中的每个子池化特征图对应的扩充特征图,包括:
4.根据权利要求3所述的空间金字塔池化方法,其特征在于,所述自注意力计算关系式为:
5.根据权利要求2所述的空间金字塔池化方法,其特征在于,所述将拼接后的池化特征图组中的各个池化特征图按照预设池化窗口...
【专利技术属性】
技术研发人员:张红亮,陈梅,杨小娜,马娜,魏祥,肖凤超,魏巍,
申请(专利权)人:杭州安脉盛智能技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。