智能视频分析和边缘计算系统中的端到端动作识别技术方案

技术编号：36098656 阅读：13 留言：0更新日期：2022-12-24 11:17

执行动作识别的装置、系统和技术。在至少一个实施例中，使用一个或更多个神经网络和硬件加速器执行动作识别，其中基于例如一个或更多个量化和修剪过程处理所述一个或更多个神经网络。经网络。经网络。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】智能视频分析和边缘计算系统中的端到端动作识别
[0001]相关申请的交叉引用
[0002]本申请要求2021年4月8日提交的题为“智能视频分析和边缘计算系统中的端到端动作识别(END TO END ACTION RECOGNITION IN INTELLIGENT VIDEO ANALYSIS AND EDGE COMPUTING SYSTEMS)”的美国专利申请第17/225,924号的优先权，其全部内容通过引用整体并入本文并用于所有目的。

[0003]至少一个实施例涉及用于执行和促进图像和视频帧中的动作识别的处理资源。例如，至少一个实施例涉及用于使用神经网络在图像中执行动作识别的处理器或计算系统。

技术介绍

[0004]动作识别是各种环境中的一项重要任务，例如视频监控和自动驾驶。在许多情况下，动作识别需要大量的计算资源来执行。这可能导致特定计算环境中的某些计算设备可能不具有执行动作识别的处理能力的情况。因此可以改进用于执行动作识别的内存量、时间量或计算资源量。
附图说明
[0005]图1示出了根据至少一个实施例的用于动作识别的系统的示例；
[0006]图2示出了根据至少一个实施例的修剪神经网络的示例；
[0007]图3示出了根据至少一个实施例的量化神经网络的权重的示例；
[0008]图4示出了根据至少一个实施例的结合用于动作识别的系统处理图像的示例；
[0009]图5示出了根据至少一个实施例的用于动作识别的边缘设备和系统的示例；
[0010]...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法，包括：接收视频的多个帧；确定所述多个帧中表示的一个或更多个对象；使并行处理单元计算在所述多个帧中的各帧中的一个或更多个像素中表示的所述一个或更多个对象的运动；以及使神经网络至少部分地基于计算的运动和确定的一个或更多个对象来对由所述一个或更多个对象执行并在所述多个帧中表示的一个或更多个动作进行分类。2.根据权利要求1所述的方法，还包括：生成与所述多个帧中表示的所述一个或更多个对象对应的包围盒集合。3.根据权利要求2所述的方法，还包括：基于所述包围盒集合对所述计算的运动执行第一裁剪操作集合以确定第一裁剪运动集合；以及基于所述包围盒集合对所述多个帧执行第二裁剪操作集合以确定第一裁剪帧集合。4.根据权利要求1所述的方法，还包括：至少部分地基于所述神经网络的一个或更多个内核确定一个或更多个值；以及至少部分地基于所述一个或更多个值从所述神经网络中移除内核集合。5.根据权利要求1所述的方法，其中所述一个或更多个动作至少包括坐动作、步行动作、跑步动作或爬楼梯动作。6.根据权利要求1所述的方法，其中所述神经网络包括一个或更多个量化的权重。7.一种处理器，包括：一个或更多个电路，用于：从视频数据中识别一个或更多个帧中描绘的一个或更多个对象；使用所述视频数据的所述一帧或更多个帧，计算一个或更多个流场和与所述一个或更多个对象对应的一个或更多个包围盒；以及基于所述一个或更多个流场和所述一个或更多个包围盒确定由所述一个或更多个对象执行的用于一个或更多个动作的一个或更多个分类。8.根据权利要求7所述的处理器，其中所述一个或更多个电路还用于：使用第一神经网络计算所述一个或更多个包围盒；以及使用第二神经网络确定所述一个或更多个分类。9.根据权利要求8所述的处理器，其中所述一个或更多个电路还用于：计算所述第一神经网络和所述第二神经网络的一个或更多个内核的一个或更多个L1范数值；以及至少部分地基于所述一个或更多个L1...

【专利技术属性】
技术研发人员：S，
申请(专利权)人：辉达公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人