【技术实现步骤摘要】
面向人机混合的视频编码与解码方法、系统、设备及介质
[0001]本公开涉及视频编码
,尤其涉及一种面向人机混合的视频编码与解码方法、系统、设备及介质。
技术介绍
[0002]随着机器学习应用的增长,车联网、视频监控、智慧城市等领域已经采用了许多智能平台,这些平台与大量传感器之间产生了海量的数据通信。数据量的增长直接导致先前面向人类视觉的编码方法效率降低,在延时和规模上也难以满足现实,面向智能机器的特征编码提上议程。
[0003]在机器视觉任务中,解码端往往需要对输入机器视觉任务模型的视频图像进行维度、尺寸、对比度等方面的变换操作,这些变换操作统称为图像预处理。图像预处理的主要目的是消除图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取、图像分割、匹配和识别的可靠性。
[0004]相关技术中,为了降低视频图像传输过程中数据量,编码端会对采集的视频图像进行压缩编码,在解码端解压缩恢复出原始尺寸信息的视频图像,为了满足机器视觉任务的需求,可能需要通过解码端的图像预处理对解码端的视频图像进行尺寸调整,若此时也是需要缩小视频图像的尺寸,则信源与下游视觉任务模型输入层之间的大小之差会带来冗余。为了消除这种冗余,可以考虑将解码端的图像预处理前移到编码端执行,从而实现消除冗余的同时尽可能保留后续机器视觉任务的精度。
[0005]这种将图像预处理前移的方案,虽然能够在消除冗余的尽可能保留后续机器视觉任务的精度,但对于解码端的人眼视觉任务来说,可能出现视频图像 ...
【技术保护点】
【技术特征摘要】
1.一种面向人机混合的视频编码方法,其特征在于,包括:对采集的原始视频图像执行编码前图像预处理,得到第一视频图像;对第一视频图像进行编码,得到第一二进制码流;对第一二进制码流进行解码,得到第二视频图像;对第二视频图像执行编码前图像后处理,得到第三视频图像;根据第三视频图像和原始视频图像生成残差视频图像;对残差视频图像进行编码,得到第二二进制码流;将所述第一二进制码流和所述第二二进制码流分别传输至解码端,其中,所述解码端用于:对接收到的第一二进制码流进行解码得到第四视频图像,并对所述第四视频图像执行图像后处理得到第五视频图像;对接收到的第二二进制码流进行解码得到第六视频图像;根据所述第五视频图像和所述第六视频图像,合成待输入到人眼视觉任务模型的第七视频图像。2.根据权利要求1所述的面向人机混合的视频编码方法,其特征在于,所述对采集的原始视频图像执行编码前图像预处理,得到第一视频图像包括:在采集视频图像之前或在采集视频图像的过程中,向解码端请求待执行视觉任务信息;根据所述待执行视觉任务信息,判断所述原始视频图像是否满足编码前图像预处理条件;若所述原始视频图像满足编码前图像预处理条件,则对所述原始视频图像执行编码前图像预处理,得到所述第一视频图像。3.根据权利要求1或2所述的面向人机混合的视频编码方法,其特征在于,采用传统编码器对第一视频图像或残差视频图像进行编码。4.根据权利要求1或2所述的面向人机混合的视频编码方法,其特征在于,采用端到端神经网络编码器对第一视频图像或残差视频图像进行编码。5.一种面向人机混合的视频解码方法,其特征在于,包括:接收到第一二进制码流,并对第一二进制码流进行解码得到第四视频图像,其中,所述第一二进制码流为编码端对第一视频图像进行编码得到的二进制码流,所述第一视频图像为对原始视频图像执行编码前图像预处理得到的视频图像;对所述第四视频图像执行图像后处理得到第五视频图像;接收到第二二进制码流,并对第二二进制码流进行解码得到第六视频图像,其中,所述第二二进制码流为编码端对残差视频图像进行编码得到的二进制码流,所述残差视频图像为编码端根据第三视频图像和原始视频图像生成的视频图像,所述第三视频图像为编码端对第二视频图像执行编码前图像后处理得到的视频图像,所述第二视频图像为编码端对第一二进制码流进行解码得到的视频图像;根据所述第五视频图像和所述第六视频图像,合成待输入到人眼视觉任务模型的第七视频图像。6.根据权利要求5所述的面向人机混合的视频解码方法,其特征在于,在接收到第一二进制码流,并对第一二进制码流进行解码得到第四视频图像之后,所述方法还包括:根据待执行视觉任务信息,判断待执行视觉任务是否为机器视觉任务;
若待执行视觉任务为人眼视觉任务,则将第四视频图像输入到人眼视觉任务模型;若待执行视觉任务为机器视觉任务,则将第四视频图像输入到机器视觉任务模型。7.根据权利要求6所述的面向人机混合的视频解码方法,其特征在于,所述将第四视频图像输入到机器视觉任务模型:判断编码端对原始视频图像执行的编码前图像预处理模式与待执行机器视觉任务要求的图像预处理模式是否一致;当编码端对原始视频图像执行的编码前图像预处理模式与待执行机器视觉任务要求的图像预处理模式一致时,将第四视频图像直接输入到机器视觉任务模型;当编码端对原始视频图像执行的编码前图像预处理模式与待执行机器视觉任务要求的图像预处理模式不一致时,对第四视频图像执行图像预处理后输入到机器视觉任务模型。8.根据权利要求5~7中任意一项所述的面向人机混合的视频解码方法,其特征在...
【专利技术属性】
技术研发人员:王慧芬,张园,杨明川,韩韬,王翰铭,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。