时空动作与角色定位制造技术

技术编号：24693980 阅读：50 留言：0更新日期：2020-06-27 12:48

一种在一序列帧中像素级定位角色和动作的方法，包括接收描述该动作和该角色的自然语言查询。该方法还包括接收该序列帧。该方法还包括基于自然语言查询在该序列帧中定位该动作和该角色。

Spatiotemporal action and role orientation

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】时空动作与角色定位相关申请的交叉引用本申请要求于2018年11月13日提交的标题为“时空动作与角色定位”的美国专利申请No.16/189,974的权益，该专利申请要求于2017年11月14日提交的标题为“时空动作与角色定位”的美国临时专利申请No.62/586,071的权益，以上申请所公开的全部内容通过引用的方式明确地并入本文。
本公开的方面总体上涉及角色和动作的定位，更具体地，涉及基于自然语言查询的用于在一序列帧中定位角色和动作的系统和方法。
技术介绍
可以包括互连的一组人工神经元(例如神经元模型)的人工神经网络是一种计算设备，或者表示一种由计算设备执行的方法。人工神经网络(ANN)可以在一序列帧(诸如视频)上追踪目标。例如，目标追踪器可以在序列的初始帧处观察到目标的情况下，预测目标在视频序列上的位置。目标追踪(例如，对象追踪)可以用于互联网协议(IP)摄像机、物联网(IoT)、自主驾驶和/或服务机器人的各种应用中。对象追踪应用可以改善用于规划的目标路径的理解。例如，在自主驾驶期间，动作定位被使用以避免与行人和自行车骑手碰撞。常规的对象定位系统将对象在单个图像(例如帧)中定位。基于视频的第一帧中的定位，可以追踪通过多个帧的对象。在一些情况下，常规的对象定位系统基于自然语言查询来定位对象。例如，常规的对象定位系统可以接收查询：“穿红衫的女人”。在这个示例中，基于该查询，一个或多个穿红衫的女人在图像内被标识。具体地，常规的对象定位系统可以定位(例如，标识)和分类(例如，标签)该一个或多个穿红衫的...

【技术保护点】
1.一种在一序列帧中像素级定位角色和动作的方法，包括：/n接收描述所述动作和所述角色的自然语言查询；/n接收所述序列帧；以及/n基于所述自然语言查询，在所述序列帧中定位所述动作和所述角色。/n

【技术特征摘要】
【国外来华专利技术】20171114 US 62/586,071;20181113 US 16/189,9741.一种在一序列帧中像素级定位角色和动作的方法，包括：
接收描述所述动作和所述角色的自然语言查询；
接收所述序列帧；以及
基于所述自然语言查询，在所述序列帧中定位所述动作和所述角色。

2.根据权利要求1所述的方法，其中定位所述动作和所述角色包括：
基于所述自然语言查询，生成第一组动态过滤器；
基于所述第一组动态过滤器，将标签应用于在所述序列帧的每个帧中的每个像素；
基于所述标签，在每个帧中定位所述动作和所述角色。

3.根据权利要求2所述的方法，其中定位所述动作和所述角色还包括：
上采样所述序列帧的视觉表示的分辨率；
基于所述自然语言查询和所上采样的分辨率，生成第二组动态过滤器；以及
将所述上采样的视觉表示与所述第二组动态过滤器卷积以生成响应图。

4.根据权利要求3所述的方法，还包括：针对所述视觉表示的每个分辨率，重复所述上采样、所述生成以及所述卷积。

5.根据权利要求3所述的方法，其中所述第一组动态过滤器和所述第二组动态过滤器是二维过滤器或三维过滤器。

6.根据权利要求1所述的方法，还包括：基于所定位的动作和角色来控制装置。

7.一种用于在一序列帧中像素级定位角色和动作的装置，所述装置包括：
用于接收描述所述动作和所述角色的自然语言查询的器件；
用于接收所述序列帧的器件；以及
用于基于所述自然语言查询，在所述序列帧中定位所述动作和所述角色的器件。

8.根据权利要求7，其中用于定位所述动作和所述角色的所述器件包括：
用于基于所述自然语言查询生成第一组动态过滤器的器件；
用于基于所述第一组动态过滤器而将标签应用于在所述序列帧的每个帧中的每个像素的器件；以及
用于基于所述标签而在每个帧中定位所述动作和所述角色的器件。

9.根据权利要求8所述的装置，其中用于定位所述动作和所述角色的所述器件还包括：
用于上采样所述序列帧的视觉表示的分辨率的器件；
用于基于所述自然语言查询和所述上采样的分辨率而生成第二组动态过滤器的器件；以及
用于将所上采样的视觉表示与所述第二组动态过滤器卷积以生成响应图的器件。

10.根据权利要求9所述的装置，还包括：用于针对所述视觉表示的每个分辨率重复上采样、生成和卷积的器件。

11.根据权利要求9所述的装置，其中所述第一组动态过滤器和所述第二组动态过滤器是二维过滤器或三维过滤器。

12.根据权利要求7所述的装置，还包括：用于基于所定位的动作和角色来控制所述装置的器件。

13.一种用于在一序列帧中像素级定位角色和动作的装置，所述装置包括：
存储器；以及
耦合到所述存储器的至少一个处理器，所述至少一个处理器被配置为：
接收...

【专利技术属性】
技术研发人员：K·加弗里尔尤克，A·戈德拉蒂，李振扬，C·G·M·斯诺克，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人