面向机器视觉编码的目标级别恰可识别失真的生成方法技术

技术编号:37783472 阅读:19 留言:0更新日期:2023-06-09 09:14
本发明专利技术涉及图像视觉技术领域,具体是涉及面向机器视觉编码的目标级别恰可识别失真的生成方法。本发明专利技术首先将原始图像采用各个预设量化参数压缩得到各个压缩图像。之后将原始图像和压缩图像上裁剪下来得到目标的原始图像和目标的压缩图像分别输入至失真判别模型,本发明专利技术的容错策略纠错失真判别模型的判别结果,并基于纠错之后的判别结果判断哪个预设量化参数所对应的目标的压缩图像满足恰可识别失真,将其作为目标的量化参数,采用目标的量化参数对原始图像的目标所在区域压缩以满足解码端的识别需求;对原始图像的非目标区域进行压缩时,采用更大的量化参数对原始图像非目标区域压缩以减少比特。本发明专利技术提高了筛选出的目标的量化参数的准确性。标的量化参数的准确性。标的量化参数的准确性。

【技术实现步骤摘要】
面向机器视觉编码的目标级别恰可识别失真的生成方法


[0001]本专利技术涉及图像视觉
,具体是涉及面向机器视觉编码的目标级别恰可识别失真的生成方法。

技术介绍

[0002]基于机器视觉的应用的落地,如智慧城市、视频监控、自动驾驶和工业自动化等。这些应用通常会产生大量的图像和视频数据。由于带宽的限制,往往需要压缩图像视频数据以便存储和传输。采用越大的量化参数QP去压缩图像,越能降低压缩之后的图像所占用的存储空间,越有利于将压缩之后的图像传输至后端的机器视觉编码模型(机器视觉目标识别模型或机器视觉编码)上。而采用越大的量化参数QP压缩得到的图像失真程度越大,越不利于机器视觉编码模型针对该压缩图像进行相应的处理。因此需要找到一个QP值使得采用该QP值压缩之后的图像的失真程度达到恰可识别失真JRD,JRD表示的是能明显影响机器视觉识别模型性能的最小失真(压缩图像失真程度越大,机器视觉识别模型越难以识别出压缩图像中的目标。最小失真的压缩图像就是恰好能让机器视觉识别模型识别出该图像中的目标,失真程度比最小失真稍微再大一点,那么机器视觉识别模型将不能识本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向机器视觉编码的目标级别恰可识别失真的生成方法,其特征在于,包括:将各个预设量化参数所对应的目标的各个压缩图像和所述压缩图像所对应的目标的原始图像应用已训练的失真判别模型,得到已训练的失真判别模型输出的针对各个所述压缩图像的各个判别结果,所述判别结果用于表征各个目标的所述压缩图像相对目标的所述原始图像是否失真;对各个所述预设量化参数和各个所述预设量化参数的所述判别结果应用容错策略,从各个所述预设量化参数中筛选出目标的量化参数,目标的所述量化参数用于构建适用于机器视觉编码所需的压缩图像,所述压缩图像满足恰可识别失真条件,所述机器视觉编码用于识别所述压缩图像所包含的目标物体。2.如权利要求1所述的面向机器视觉编码的目标级别恰可识别失真的生成方法,其特征在于,所述失真判别模型包括如下组成部分:特征提取模块,用于提取目标的所述原始图像的特征和提取目标的所述压缩图像的特征;特征融合模块,输入端与所述特征提取模块的输出端电连接,用于融合目标的所述原始图像的特征和目标的所述压缩图像的特征;特征转化模块,输入端与所述特征融合模块的输出端相连接,用于对融合之后的特征进行通道降维处理,得到转换之后的特征;全连接层,用于对转换之后的特征进行判别分类。3.如权利要求2所述的面向机器视觉编码的目标级别恰可识别失真的生成方法,其特征在于,所述融合目标的所述原始图像的特征和目标的所述压缩图像的特征,包括:将目标的所述原始图像的特征减去目标的所述压缩图像的特征,得到差值特征;连接所述差值特征、目标的所述原始图像的特征和目标的所述压缩图像的特征,得到融合之后的特征。4.如权利要求1所述的面向机器视觉编码的目标级别恰可识别失真的生成方法,其特征在于,已训练的失真判别模型的训练方式包括:构建训练数据集,所述训练数据集包括目标的若干个原始样本图像和目标的每一个原始样本图像在设定数量的预设量化参数下的压缩样本图像;对所述训练数据集应用所述失真判别模型,得到所述失真判别模型针对各个目标的所述压缩样本图像输出的判别样本结果,所述判别样本结果用于表征目标的所述压缩样本图像相对目标的所述原始样本图像的失真程度;依据所述判别样本结果和所述压缩样本图像所对应的判别真实结果,计算所述判别样本结果相对所述判别真实结果的损失函数;依据所述损失函数,调整所述失真判别模型的参数,得到已训练的失真判别模型。5.如权利要求1所述的面向机器视觉编码的目标级别恰可识别失真的生成方法,其特征在于,所述对各个所述预设量化参数和各个所述预设量化参数的所述判别结果应用容错策略,从各个所述预设量化参数中筛选出目标的量化参数,目标的所述量化参数用于构建适用于机器视觉编码...

【专利技术属性】
技术研发人员:林浩钦李娜
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1