【技术实现步骤摘要】
本专利技术涉及图像处理,具体涉及一种面向多机器视觉任务的高效编码方法、装置及介质。
技术介绍
1、机器视觉模型需要大量的训练数据,特别是最近流行的大型模型如clip、sam、blip等。这样大量的数据的传输和存储对机器视觉应用的进一步发展提出了重大挑战。特别是在边缘设备上,算力以及网络带宽存在一定限制。因此,压缩数据以减少存储和传输成本已成为一个迫切的任务。传统的标准化有损编码方法,如jpeg、hevc和vvc,已经被广泛用于日常数据压缩。近年来,快速发展的基于学习的编解码器也在速率失真性能方面表现出了强大的能力。但随着深度学习应用相关研究工作的逐步深入和成熟,图像或者视频信息在越来越多的场合会被用作机器智能分析任务(如自动驾驶、元宇宙、远程医疗等)的输入,现有的压缩主要致力于对视觉保真度进行优化,忽视了机器和人类对图像的不同感知。因此,这些方法产生的压缩图像常常在下游机器视觉任务中产生次优结果。因此如果能够设计一种面向多智能任务的高效编码框架,提高对于智能任务的率失真性能,将极大地降低所需传输带宽、存储空间,以及算力需求,推动智能多媒
...【技术保护点】
1.一种面向多机器视觉任务的高效编码方法,其特征在于,包括步骤:
2.如权利要求1所述的一种面向多机器视觉任务的高效编码方法,其特征在于,所述S1步骤中机器视觉任务包括图像分类、语义分割和目标检测。
3.如权利要求1所述的一种面向多机器视觉任务的高效编码方法,其特征在于,所述S1步骤中,目标先验信息包括目标检测框、边缘信息、灰度图、深度信息。
4.如权利要求1所述的一种面向多机器视觉任务的高效编码方法,其特征在于,所述内部适配器由两个深度卷积层和一个零卷积层组成,所述零卷积层为初始权重为零的卷积层。
5.如权利要求1所述
...【技术特征摘要】
1.一种面向多机器视觉任务的高效编码方法,其特征在于,包括步骤:
2.如权利要求1所述的一种面向多机器视觉任务的高效编码方法,其特征在于,所述s1步骤中机器视觉任务包括图像分类、语义分割和目标检测。
3.如权利要求1所述的一种面向多机器视觉任务的高效编码方法,其特征在于,所述s1步骤中,目标先验信息包括目标检测框、边缘信息、灰度图、深度信息。
4.如权利要求1所述的一种面向多机器视觉任务的高效编码方法,其特征在于,所述内部适配器由两个深度卷积层和一个零卷积层组成,所述零卷积层为初始权重为零的卷积层。
5.如权利要求1所述的一种面向多机器视觉任务的高效编码方法,其特征在于,所述内部适配器通过改变特征分布实现不同机器视觉任务之间的迁移学习。
6....
【专利技术属性】
技术研发人员:金鑫,刘津铭,曾文军,
申请(专利权)人:宁波东方理工大学暂名,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。