用以识别及标记视频帧中的对象的交互式工具制造技术

技术编号：39936037 阅读：18 留言：0更新日期：2024-01-08 22:11

一种用以在人工神经网络的辅助下标记视频图像的系统、方法及设备。在用户提供第一输入来标记在第一视频帧中展示的对象的第一方面之后，所述人工神经网络推断或预测待针对第二视频帧中的所述对象标记的第二方面。图形用户接口在所述第二视频帧的显示器上呈现所述经推断或预测第二方面，以允许所述用户确认或修改所述推断或预测。例如，所述第一帧中的所关注对象可用分类及边界框来标记；且所述人工神经网络可经训练以针对所述第二帧中的对应对象推断或预测其边界框、分类及代表所述第二帧中的所述对象的图像的像素。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

本文中所公开的至少一些实施例大体上涉及用于处理视频图像的交互式工具，且更特定来说但不限于对视频图像中的对象的识别及分类。

技术介绍

1、人工神经网络(ann)使用神经元网络来处理所述网络的输入且从所述网络产生输出。

2、深度学习已被应用于许多应用领域，例如计算机视觉、语音/音频辨识、自然语言处理、机器翻译、生物信息学、药物设计、医学图像处理、游戏等。

技术实现思路

【技术保护点】

1.一种方法，其包括：

2.根据权利要求1所述的方法，其中所述第一方面包含对所述第一帧内展示所述对象的第一区的识别及所述对象的分类。

3.根据权利要求2所述的方法，其中所述第二帧在视频片段中被调度在所述第一帧之前。

4.根据权利要求3所述的方法，其中所述第二方面包含对所述第二帧内展示所述对象的第二区的识别及所述对象的所述分类。

5.根据权利要求4所述的方法，其中所述第二方面进一步包含对所述第二区内的像素的子集的识别以指示所述对象由所述第二区中的所述子集来表示。

6.根据权利要求5所述的方法，其中所述校正包含改变对所述第二帧内展示...

【技术特征摘要】
【国外来华专利技术】

1.一种方法，其包括：

2.根据权利要求1所述的方法，其中所述第一方面包含对所述第一帧内展示所述对象的第一区的识别及所述对象的分类。

3.根据权利要求2所述的方法，其中所述第二帧在视频片段中被调度在所述第一帧之前。

4.根据权利要求3所述的方法，其中所述第二方面包含对所述第二帧内展示所述对象的第二区的识别及所述对象的所述分类。

5.根据权利要求4所述的方法，其中所述第二方面进一步包含对所述第二区内的像素的子集的识别以指示所述对象由所述第二区中的所述子集来表示。

6.根据权利要求5所述的方法，其中所述校正包含改变对所述第二帧内展示所述对象的所述第二区的所述识别。

7.根据权利要求5所述的方法，其中所述校正包含改变对所述第二帧中展示的所述对象的所述分类。

8.根据权利要求5所述的方法，其中所述校正包含改变对所述子集的所述识别。

9.根据权利要求5所述的方法，其中所述校正包含去除针对所述第二帧识别的所述第二方面。

10.根据权利要求5所述的方法，其进一步包括：

11.根据权利要求2所述的方法，其中所述第二帧在视频片段中被调度在所述第一帧之后。

12.一种设备，其包括：

13.根据权利要求12所述的设备，其中所述用户接口包含图形用户接口，所述图形用户接口具有用以接收来自所述用户的输入的一或多个输入装置及用以呈现在所述视频图像中识别的对象的方面的显示装置。

1...

【专利技术属性】
技术研发人员：M·C·格拉帕，A·肖拉西亚，E·库卢尔切洛，
申请(专利权)人：美光科技公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人