【技术实现步骤摘要】
本专利技术涉及一种特征编码技术,具体涉及一种基于三维稀疏卷积的多尺度稀疏特征压缩方法及系统,属于特征压缩。
技术介绍
1、传统视频编码方法主要针对人类视觉系统(hvs)进行优化,主要关注视频的视觉质量。随着深度学习取得了显著的成功,机器视觉任务的应用逐渐广泛。但是,不可否认的是,机器视觉系统(mvs)和hvs之间存在固有差异。因此,在机器视觉任务中应用传统编码方法可能并非最优的选择。为解决这一问题,mpeg组织在2019年推出了新一代视频编解码器,称为面向机器视觉的视频编码(vcm),专门设计用于为机器视觉任务提供压缩编码。由于vcm针对mvs进行了优化,因此在应用于机器视觉任务时,即使实现了非常高的压缩比,它也可以保持任务性能不会出现显著的下降。由于在机器视觉任务中相较于传统方法具有卓越的性能,vcm迅速获得了广泛关注和重视,并且现在已经出现了很多优秀的vcm相关工作。2019年南加州大学提出了一种新的名为bottlenet的单尺度2d特征压缩方法,通过在神经网络当中加入基于2d卷积的瓶颈实现对特征的压缩(参考a.e.eshratif
...【技术保护点】
1.一种基于三维稀疏卷积的多尺度稀疏特征压缩方法,其特征在于,包括:
2.根据权利要求1所述的一种基于三维稀疏卷积的多尺度稀疏特征压缩方法,其特征在于,输入LiDAR点云PL经过Voxel R-CNN前端特征提取网络,得到多尺度稀疏特征F2,F3和F4;包括:
3.根据权利要求1所述的一种基于三维稀疏卷积的多尺度稀疏特征压缩方法,其特征在于,多尺度稀疏特征中最大尺寸的稀疏特征F2经过空间尺寸的压缩,得到空间尺寸等于F3的稀疏特征F′2;包括:
4.根据权利要求1所述的一种基于三维稀疏卷积的多尺度稀疏特征压缩方法,其特征在于,3DFC
...【技术特征摘要】
1.一种基于三维稀疏卷积的多尺度稀疏特征压缩方法,其特征在于,包括:
2.根据权利要求1所述的一种基于三维稀疏卷积的多尺度稀疏特征压缩方法,其特征在于,输入lidar点云pl经过voxel r-cnn前端特征提取网络,得到多尺度稀疏特征f2,f3和f4;包括:
3.根据权利要求1所述的一种基于三维稀疏卷积的多尺度稀疏特征压缩方法,其特征在于,多尺度稀疏特征中最大尺寸的稀疏特征f2经过空间尺寸的压缩,得到空间尺寸等于f3的稀疏特征f′2;包括:
4.根据权利要求1所述的一种基于三维稀疏卷积的多尺度稀疏特征压缩方法,其特征在于,3dfc的输出单尺度稀疏特征f″234按照g-pcc相同的规则排序,得到排序后的单尺度稀疏特征f″s;包括:
5.根据权利要求1所述的一种基于三维稀疏卷积的多尺度稀疏特征压缩方法,其特征在于,和分别经过三个特征注意力模块,得到和包括:
6....
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。