【技术实现步骤摘要】
本专利技术涉及图像处理,具体涉及一种面向机器视觉的帧间图像编码率失真优化方法与系统。
技术介绍
1、面向机器视觉的视频编码技术近年来成为研究与工业界的重要议题,这一趋势与5g和物联网技术的快速发展紧密相关。随着这些技术的兴起,边缘设备生成的视频内容日益增多,且最终多由机器进行消费,其量级甚至超过了供人类观看的视频。机器视觉任务,例如物体检测、图像分割、目标跟踪等,对视频编码的需求有别于服务于人类视觉的视频内容,因此催生了针对机器视觉优化的视频编码(video coding for machines, vcm)技术的发展需求。
2、国际标准化组织mpeg在2019年7月成立了vcm小组,专注于研究面向机器视觉视频编码的潜在标准化工作。在此背景下,vvc(versatile video coding)作为视频编码标准之一,其率失真优化(rdo)方法集中于提升编码效率和视频质量的平衡。vvc通过创新技术和算法,在确保视频质量的同时减少了所需数据量,具体技术包括基于样本的渐变边缘和角度预测,以及基于显著性检测的帧内比特分配方案,后者
...【技术保护点】
1.一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,包括步骤:
2.如权利要求1所述的一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,所述S1步骤中,通过残差神经网络进行特征图的提取,表示为如下公式:
3.如权利要求2所述的一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,所述S2步骤中,通过结构相似性指数获取基于特征相似度的失真度量,表示为如下公式:
4.如权利要求1所述的一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,所述S3步骤中,基于平方误差的失真度量通过如下公式获取:
5.
...【技术特征摘要】
1.一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,包括步骤:
2.如权利要求1所述的一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,所述s1步骤中,通过残差神经网络进行特征图的提取,表示为如下公式:
3.如权利要求2所述的一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,所述s2步骤中,通过结构相似性指数获取基于特征相似度的失真度量,表示为如下公式:
4.如权利要求1所述的一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,所述s3步骤中,基于平方误差的失真度量通过如下公式获取:
5.如权利要求1所述的一种面向机器视觉的帧间图像编码率失真优化方法,其特征在于,所述s4步骤中,混合失真度量通过如下公式获取:
...
【专利技术属性】
技术研发人员:蒋先涛,柳云夏,郭咏梅,郭咏阳,
申请(专利权)人:宁波康达凯能医疗科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。