支持机器智能的通用视频压缩编码方法技术

技术编号：26386022 阅读：114 留言：0更新日期：2020-11-19 23:55

本发明专利技术公开了一种支持机器智能的通用视频压缩编码方法，针对机器智能分析任务进行压缩，将会得到能够实现相同机器智能分析任务时相较针对人眼压缩更高的压缩比，减少需要传输的信息，减轻传输负担；压缩得到特征能够直接应用于机器智能分析任务，不需要额外解码和处理，减少计算量，加速机器分析任务的进行，支持边缘计算的实现；此外，支持在编码压缩之前对原视频/图像上进行部分分析，不仅可以提高智能分析精度，还可生成结构化压缩码流，并支持后续更多的智能分析任务。综上所述，上述方法能够使得面向机器进行视频/图像压缩这一过程更加的通用、灵活、高效。

全部详细技术资料下载

【技术实现步骤摘要】
支持机器智能的通用视频压缩编码方法
本专利技术涉及视频/图像压缩编码
，尤其涉及一种支持机器智能的通用视频压缩编码方法。
技术介绍
现有视频/图像压缩标准主要针对的是面向人眼视觉的压缩，其目标是在人眼观看视频的失真一定的情况下，视频码率尽可能低。而随着机器学习的算法逐渐成熟，机器智能分析任务也逐渐开始被应用于人类社会生活生产的各个领域，例如智能工厂，智能城市，智能交通等等。实现这一系列应用往往伴随着对于大量视频/图像数据的分析，采用传统方法，视频/图像先用现有标准进行压缩，在进行分析前需要对压缩码流进行解码操作，得到压缩后的视频/图像，然后再对压缩恢复后的视频/图像进行分析。然而，存在如下问题：1)由于传统视频/图像压缩标准针对的是人眼视觉，压缩码流中可能用大量码率表示视频/图像分析中不需要的内容，这样会给传输带来沉重的负担。2)由于传统方法中需要解码恢复压缩的视频/图像，然后再进行分析，这样还将会造成时延，导致用户体验不佳。3)由于压缩恢复的视频/图像具有一定的失真，分析会出现错误甚至更加严重的问题。随着边缘计算和终端智能技术的发展，更多的机器智能分析能够在边缘服务器或者终端设备上对视频/图像进行处理分析，因此如果能够实现面向机器的编码方法，编码后码流中只包含对机器智能分析有用的内容，将会大大降低机器智能分析任务需要传输的数据量。同时编码后的码流可以直接用于机器智能分析的任务中，不必恢复压缩的视频/图像，因此可以减少计算时延，提高处理效率。因此将部分机器智能分析编码之前进行，提升码流的结构化功能，利于...

【技术保护点】
1.一种支持机器智能的通用视频压缩编码方法，其特征在于，包括：帧内编码和帧间编码两部分；其中：/n帧内编码部分包括：对于输入视频帧，先进行物体检测，得到各个物体的空间位置信息和类别信息；基于各个物体的空间位置信息和类别信息进行属性解析、以及关系推理，获得各物体的属性信息、以及物体之间的拓扑关系；再将各个物体的空间位置信息和类别信息作为指导信息，利用物体的空间位置信息对输入视频帧进行编码单元的划分，并对划分后的编码单元进行编码，编码得到的码流中所包含的物体的类别信息用于帧间编码部分的视频帧重建过程；/n帧间编码部分包括：以输入视频帧或目标为单元进行视频帧的重建，并通过运动补偿，获得光流预测信息和残差编码信息；/n将帧内编码部分获得的各个物体的空间位置信息和类别信息、各物体的属性信息、物体之间的拓扑关系、编码后的编码单元、以及帧间编码部分获得的光流预测信息和残差编码信息进行熵编码，获得相应的码流。/n

【技术特征摘要】
1.一种支持机器智能的通用视频压缩编码方法，其特征在于，包括：帧内编码和帧间编码两部分；其中：
帧内编码部分包括：对于输入视频帧，先进行物体检测，得到各个物体的空间位置信息和类别信息；基于各个物体的空间位置信息和类别信息进行属性解析、以及关系推理，获得各物体的属性信息、以及物体之间的拓扑关系；再将各个物体的空间位置信息和类别信息作为指导信息，利用物体的空间位置信息对输入视频帧进行编码单元的划分，并对划分后的编码单元进行编码，编码得到的码流中所包含的物体的类别信息用于帧间编码部分的视频帧重建过程；
帧间编码部分包括：以输入视频帧或目标为单元进行视频帧的重建，并通过运动补偿，获得光流预测信息和残差编码信息；
将帧内编码部分获得的各个物体的空间位置信息和类别信息、各物体的属性信息、物体之间的拓扑关系、编码后的编码单元、以及帧间编码部分获得的光流预测信息和残差编码信息进行熵编码，获得相应的码流。

2.根据权利要求1所述的一种支持机器智能的通用视频压缩编码方法，其特征在于，所述关系推理包括：空间关系推理与语义关系推理；
利用各物体的空间位...

【专利技术属性】
技术研发人员：陈志波，金鑫，孙思萌，冯若愚，冯润森，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人