【技术实现步骤摘要】
【国外来华专利技术】基于视频的活动识别
[0001]领域
[0002]本公开一般涉及活动检测或识别。在一些示例中,本公开的各方面涉及用于执行基于视频的活动识别的系统和技术。
[0003]背景
[0004]许多设备和系统允许通过生成场景的图像(或帧)和/或视频数据(包括多个帧)来捕捉该场景。例如,相机或包括相机的设备可以捕捉场景的帧序列(例如,场景的视频)。在一些情形中,帧序列可以被处理以用于执行一个或多个功能,可以被输出以用于显示,可以被输出以用于处理和/或由其他设备消耗以及用于其他用途。
[0005]交通工具是可包括一个或多个相机的设备的示例。例如,交通工具可包括可捕捉该交通工具的内部的各帧的一个或多个相机和/或可包括可捕捉该交通工具的外部的各帧的一个或多个相机。各帧可被处理以用于各种目的,诸如用于确定或识别由交通工具的驾驶员和/或乘客执行的活动,用于识别交通工具中的人的身份,用于标识交通工具附近的其他交通工具、对象和/或障碍物,等等。
[0006]简要概述
[0007]在一些示例中,描述了用于执行基于视频的活动识别以确定或识别 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于处理一个或多个帧的装置,包括:存储器;以及耦合至所述存储器的处理器,所述处理器被配置成:使用第一机器学习模型来从第一帧提取第一一个或多个特征并从第二帧提取第二一个或多个特征,所述第一一个或多个特征和所述第二一个或多个特征与驾驶交通工具的人相关联;使用第二机器学习模型来处理所述第一一个或多个特征和所述第二一个或多个特征;以及基于使用所述第二机器学习模型处理所述第一一个或多个特征和所述第二一个或多个特征来确定与驾驶所述交通工具的人相关联的至少一个活动。2.如权利要求1所述的装置,其中所述第一帧在帧序列中发生在所述第二帧之前。3.如权利要求1所述的装置,其中所述第一一个或多个特征在第一时间被提取,并且所述第二一个或多个特征在所述第一时间之后发生的第二时间被提取。4.如权利要求1所述的装置,其中所述处理器被配置成:至少部分地通过组合所述第一一个或多个特征和所述第二一个或多个特征来生成组合式特征表示;其中与驾驶所述交通工具的人相关联的所述至少一个活动是基于使用所述第二机器学习模型处理所述组合式特征表示来确定的。5.如权利要求4所述的装置,其中所述组合式特征表示包括特征向量。6.如权利要求5所述的装置,其中所述特征向量包括二维特征向量。7.如权利要求5所述的装置,其中为了组合所述第一一个或多个特征和所述第二一个或多个特征,所述处理器被配置成级联所述第一一个或多个特征和所述第二一个或多个特征。8.如权利要求1所述的装置,其中所述处理器被配置成:在存储设备中存储所述第一一个或多个特征和所述第二一个或多个特征。9.如权利要求8所述的装置,其中所述处理器被配置成:从所述存储设备获得所述第一一个或多个特征和所述第二一个或多个特征;以及使用所述第一机器学习模型来从第三帧提取第三一个或多个特征,所述第三一个或多个特征与驾驶所述交通工具的人相关联;其中与驾驶所述交通工具的人相关联的所述至少一个活动是基于使用所述第二机器学习模型处理所述第一一个或多个特征、所述第二一个或多个特征和所述第三一个或多个特征来确定的。10.如权利要求9所述的装置,其中所述处理器被配置成:在所述存储设备中存储所述第三一个或多个特征;以及基于在所述存储设备中存储所述第三一个或多个特征来从所述存储设备移除特征。11.如权利要求9所述的装置,其中所述处理器被配置成:至少部分地通过组合所述第一一个或多个特征、所述第二一个或多个特征和所述第三一个或多个特征来生成组合式特征表示;其中与驾驶所述交通工具的人相关联的所述至少一个活动是基于使用所述第二机器
学习模型处理所述组合式特征表示来确定的。12.如权利要求1所述的装置,其中所述处理器被配置成:使用所述第二机器学习模型来确定与所述第一一个或多个特征和所述第二一个或多个特征相关联的分类,所述分类指示所述至少一个活动。13.如权利要求1所述的装置,其中所述第一机器学习模型包括神经网络。14.如权利要求1所述的装置,其中所述第二机器学习...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。