通过使用基于注意力的神经网络在视频剪辑中进行动作分类制造技术

技术编号：29036290 阅读：24 留言：0更新日期：2021-06-26 05:44

用于对视频中的动作进行分类的方法、系统和装置，包括编码在计算机存储介质上的计算机程序。所述方法中的一个：获得视频剪辑的特征表示；获得用于指定在关键视频帧中的多个候选代理边界框的数据；并且针对每个候选代理边界框，通过动作转换器神经网络来处理所述特征表示。示。示。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】通过使用基于注意力的神经网络在视频剪辑中进行动作分类

技术介绍

[0001]本说明书涉及通过使用神经网络来处理视频数据。
[0002]神经网络是采用一层或多层非线性单元针对接收到的输入来预测输出的机器学习模型。一些神经网络包括除输出层外的一个或多个隐藏层。每个隐藏层的输出用作所述网络中的下一层(即下一隐藏层或输出层)的输入。所述网络的每一层根据相应的参数集合的当前值从接收到的输入中生成输出。

技术实现思路

[0003]本说明书描述了一种在一个或多个位置中的一个或多个计算机上被实施为计算机程序的系统，所述系统对由在视频中的关键视频帧中描绘的一个或多个代理(例如，一个或多个人或其它动物或机器人)所执行的动作进行分类。特别地，所述系统识别在关键视频帧中的可能描绘一个代理的边界框，并且生成一组分类得分，该组分类得分包括针对在一组可能动作中的每个动作的相应得分。给定动作的得分表示在所述边界框中描绘的代理在包括所述关键视频帧的视频剪辑中正在执行所述动作的可能性。所述系统可以生成针对在关键视频帧中的多个边界框的这些动作得分。
[0004]可以实施本说明书中描述的主题的特定实施例，以便实现以下优点中的一个或多个。
[0005]所描述的系统有效地对由在视频剪辑中描绘的代理所执行的动作进行分类。特别地，所描述的系统可以在其动作被分类的代理周围有效地聚集来自(在视频剪辑内的)时空上下文的特征。这通过使用一种注意力机制来实现，所述注意力机制通过使用从与用于描绘其动作被分类的代理的边界框相对应的特征中导出的查询，来注意视频剪辑的...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法，包括：获得视频剪辑的特征表示，所述视频剪辑包括来自视频的关键视频帧和来自所述视频的一个或多个上下文视频帧；获得用于指定在所述关键视频帧中的多个候选代理边界框的数据，其中，每个候选代理边界框是所述关键视频帧中的描绘代理的部分的初始估计；以及针对每个候选代理边界框：通过动作转换器神经网络来处理所述特征表示，其中，所述动作转换器神经网络包括：动作转换器层的堆栈，所述动作转换器层的堆栈被配置为处理所述特征表示以生成用于所述候选代理边界框的最终查询特征向量，其中每个动作转换器层被配置为：针对一个或多个注意力单元中的每一个：接收用于所述动作转换器层的输入查询特征，从所述特征表示中生成键特征，从所述特征表示中生成值特征，将注意力机制应用于所述输入查询特征、所述键特征和所述值特征，以生成初始更新的查询特征；以及从所述初始更新的查询特征中生成输出查询特征，其中：用于在所述堆栈中的第一动作转换器层的输入查询特征是与在所述特征表示中的所述候选代理边界框相对应的特征，用于在所述堆栈中的除了所述第一动作转换器层之外的每个动作转换器层的输入查询特征是基于用于在所述堆栈中的前一个动作转换器层中的每个注意力单元的输出查询特征来生成的，以及所述最终查询特征是基于用于在所述堆栈中的最后动作转换器层中的每个注意力单元的输出查询特征来生成的；以及一个或多个分类输出层，所述一个或多个分类输出层被配置为处理由所述最终查询特征组成的最终特征向量，以生成用于在可能动作的集合中的每个动作的相应分类得分，所述分类得分表示在所述候选代理边界框中所描绘的人员正在执行所述视频剪辑中的所述动作的可能性。2.根据前述权利要求中的任一项所述的方法，其中，所述动作转换器神经网络还包括：一个或多个回归输出层，所述一个或多个回归输出层被配置为处理用于所述候选代理边界框的所述最终特征向量，以生成用于定义最终边界框的数据，所述最终边界框是所述关键视频帧中的描绘所述代理的部分的精炼估计。3.根据前述权利要求中的任一项所述的方法，其中，从所述特征表示中生成键特征包括：将第一学习线性转换应用于所述特征表示。4.根据前述权利要求中的任一项所述的方法，其中，从所述特征表示中生成值特征包括：将第二学习线性转换应用于所述特征表示。5.根据前述权利要求中的任一项所述的方法，还包括在所述特征表示中生成与所述候选代理边界框相对应的特征，包括：
从所述特征表示中提取用于所述候选代理边界框的感兴趣区域ROI池化特征...

【专利技术属性】
技术研发人员：若昂，
申请(专利权)人：渊慧科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人