一种面向机器视觉的帧间图像编码率失真优化方法与系统技术方案

技术编号:41795363 阅读:22 留言:0更新日期:2024-06-24 20:20
本发明专利技术公开了一种面向机器视觉的帧间图像编码率失真优化方法与系统,涉及图像处理技术领域,包括步骤:提取当前视频帧原始图像以及相对应重建图像在各尺度下的特征图;根据原始图像与重建图像的特征图获取基于特征相似度的失真度量;根据原始图像与重建图像的点坐标像素值获取基于平方误差的失真度量;通过混合分别基于特征相似度、基于平方误差的失真度量,进行混合失真度量控制下的率失真优化。本发明专利技术通过将视频帧映射到特征空间并利用残差深度神经网络提取多尺度特征,能够更好地符合机器视觉系统对视频内容特征的敏感性,这不仅提高了编码效率,还确保了编码后的视频内容在机器处理时的关键特征得以保留,从而提升算法的性能和任务完成度。

【技术实现步骤摘要】

本专利技术涉及图像处理,具体涉及一种面向机器视觉的帧间图像编码率失真优化方法与系统


技术介绍

1、面向机器视觉的视频编码技术近年来成为研究与工业界的重要议题,这一趋势与5g和物联网技术的快速发展紧密相关。随着这些技术的兴起,边缘设备生成的视频内容日益增多,且最终多由机器进行消费,其量级甚至超过了供人类观看的视频。机器视觉任务,例如物体检测、图像分割、目标跟踪等,对视频编码的需求有别于服务于人类视觉的视频内容,因此催生了针对机器视觉优化的视频编码(video coding for machines, vcm)技术的发展需求。

2、国际标准化组织mpeg在2019年7月成立了vcm小组,专注于研究面向机器视觉视频编码的潜在标准化工作。在此背景下,vvc(versatile video coding)作为视频编码标准之一,其率失真优化(rdo)方法集中于提升编码效率和视频质量的平衡。vvc通过创新技术和算法,在确保视频质量的同时减少了所需数据量,具体技术包括基于样本的渐变边缘和角度预测,以及基于显著性检测的帧内比特分配方案,后者结合了canny边缘本文档来自技高网...

【技术保护点】

1.一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,包括步骤:

2.如权利要求1所述的一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,所述S1步骤中,通过残差神经网络进行特征图的提取,表示为如下公式:

3.如权利要求2所述的一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,所述S2步骤中,通过结构相似性指数获取基于特征相似度的失真度量,表示为如下公式:

4.如权利要求1所述的一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,所述S3步骤中,基于平方误差的失真度量通过如下公式获取:

5.如权利要求1所述的一...

【技术特征摘要】

1.一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,包括步骤:

2.如权利要求1所述的一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,所述s1步骤中,通过残差神经网络进行特征图的提取,表示为如下公式:

3.如权利要求2所述的一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,所述s2步骤中,通过结构相似性指数获取基于特征相似度的失真度量,表示为如下公式:

4.如权利要求1所述的一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,所述s3步骤中,基于平方误差的失真度量通过如下公式获取:

5.如权利要求1所述的一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,所述s4步骤中,混合失真度量通过如下公式获取:

...

【专利技术属性】
技术研发人员:蒋先涛柳云夏郭咏梅郭咏阳
申请(专利权)人:宁波康达凯能医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1