渐进压缩域计算机视觉和深度学习系统技术方案

技术编号:25645850 阅读:69 留言:0更新日期:2020-09-15 21:36
用于计算机视觉技术的压缩域渐进应用的方法和系统。一种用于解码视频数据的方法,包括:接收被编码用于多阶段解码的视频流。该方法包括通过执行多阶段解码的一个或更多个阶段来部分解码视频流。该方法包括确定是否可以基于部分解码的视频流来识别计算机视觉系统的决策。另外,该方法包括基于对视频流的解码生成计算机视觉系统的决策。用于编码视频数据的系统包括处理器,该处理器被配置为从相机接收视频数据,将从相机接收的视频数据编码为视频流,以供计算机视觉系统消费,并且将元数据包括在编码的视频流中以指示是否可以从元数据中识别出计算机视觉系统的决策。

【技术实现步骤摘要】
【国外来华专利技术】渐进压缩域计算机视觉和深度学习系统
本公开总体上涉及计算机视觉和深度学习系统。更具体地,本公开涉及计算机视觉技术的压缩域渐进应用。
技术介绍
使用计算机视觉和深度学习(CV/DL)技术处理相机视频流是人工智能(AI)和机器学习(ML)的新兴和迅速发展的领域。应用级别的目标是通过观察视频流来自动执行各种任务,例如用户感知应用、电子商务、社交媒体、视觉感知、监视和安全、导航等。这些应用使用各种基础的CV技术,例如,对象检测和识别、对象跟踪、人类检测和跟踪等。DL和卷积神经网络(CNN)是一组已被证明可以显著改善传统CV技术的检测率的极有价值的技术。
技术实现思路
技术问题本公开的实施例提供了渐进压缩域CV和DL系统。问题的解决方案在一个实施例中,提供了一种用于解码视频数据的方法。该方法包括接收被编码用于多阶段解码的视频流。该方法包括通过执行多阶段解码中的一个或更多个阶段来部分解码视频流。该方法包括确定是否可以基于部分解码的视频流识别出CV系统的决策。另外,该方法包括基于对视频流的解码来生成CV系统的决策。本文档来自技高网...

【技术保护点】
1.一种用于解码视频数据的方法,所述方法包括:/n接收被编码用于多阶段解码的视频流;/n使用处理器通过执行所述多阶段解码中的一个或更多个阶段来对所述视频流进行部分解码;/n使用处理器确定是否可以基于部分解码的视频流识别计算机视觉系统的决策;以及/n基于对所述视频流的解码生成所述计算机视觉系统的决策。/n

【技术特征摘要】
【国外来华专利技术】20180208 US 15/892,1411.一种用于解码视频数据的方法,所述方法包括:
接收被编码用于多阶段解码的视频流;
使用处理器通过执行所述多阶段解码中的一个或更多个阶段来对所述视频流进行部分解码;
使用处理器确定是否可以基于部分解码的视频流识别计算机视觉系统的决策;以及
基于对所述视频流的解码生成所述计算机视觉系统的决策。


2.根据权利要求1所述的方法,其中,对所述视频流进行部分解码并确定是否可以识别决策,包括:
逐阶段渐进解码所述视频流;
在一个或更多个阶段之后,确定是否可以基于渐进解码的视频流识别所述计算机视觉系统的决策;以及
响应于确定出可以基于所述渐进解码的视频流来识别所述计算机视觉系统的决策,生成决策并停止解码所述视频流。


3.根据权利要求1所述的方法,所述方法还包括:
在解码所述视频流之前提取所述视频流的元数据;
其中,确定是否可以识别决策,包括:
确定是否可以基于提取出的元数据识别所述计算机视觉系统的决策。


4.根据权利要求3所述的方法,所述方法还包括:在接收所述视频流之前,基于所述计算机视觉系统的应用,向所述视频流的编码器请求将所述元数据包括在所述视频流中。


5.根据权利要求3所述的方法,所述方法还包括:在对所述视频流进行部分解码之前,基于提取的元数据确定是否需要为所述计算机视觉系统解码所述视频流的帧。


6.根据权利要求1所述的方法,其中:
所述视频流包括指示所述视频流的一个或更多个帧中的感兴趣区域(ROI)的一个或更多个标记;并且
对所述视频流进行部分解码包括:识别所述一个或更多个标记,并基于识别的标记解码所述ROI。


7.根据权利要求1所述的方法,其中,所述视频流包括基于检查到所述计算机视觉系统的事件而编码的帧。


8.根据权利要求1所述的方法,其中,所述视频流包括帧,所述帧具有针对位于所述帧中的对象而编码的附加比特。


9.一种用于解码视频数据的系统,所述系统包括:
通信接口,所述通信接口被配置为接收被编码用于多阶段...

【专利技术属性】
技术研发人员:哈米德·R·谢赫戴维·刘罗谌持柳荣俊迈克尔·波莉
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国;KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1