System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用以识别及标记视频帧中的对象的交互式工具制造技术_技高网

用以识别及标记视频帧中的对象的交互式工具制造技术

技术编号:39936037 阅读:9 留言:0更新日期:2024-01-08 22:11
一种用以在人工神经网络的辅助下标记视频图像的系统、方法及设备。在用户提供第一输入来标记在第一视频帧中展示的对象的第一方面之后,所述人工神经网络推断或预测待针对第二视频帧中的所述对象标记的第二方面。图形用户接口在所述第二视频帧的显示器上呈现所述经推断或预测第二方面,以允许所述用户确认或修改所述推断或预测。例如,所述第一帧中的所关注对象可用分类及边界框来标记;且所述人工神经网络可经训练以针对所述第二帧中的对应对象推断或预测其边界框、分类及代表所述第二帧中的所述对象的图像的像素。

【技术实现步骤摘要】
【国外来华专利技术】

本文中所公开的至少一些实施例大体上涉及用于处理视频图像的交互式工具,且更特定来说但不限于对视频图像中的对象的识别及分类。


技术介绍

1、人工神经网络(ann)使用神经元网络来处理所述网络的输入且从所述网络产生输出。

2、深度学习已被应用于许多应用领域,例如计算机视觉、语音/音频辨识、自然语言处理、机器翻译、生物信息学、药物设计、医学图像处理、游戏等。


技术实现思路

【技术保护点】

1.一种方法,其包括:

2.根据权利要求1所述的方法,其中所述第一方面包含对所述第一帧内展示所述对象的第一区的识别及所述对象的分类。

3.根据权利要求2所述的方法,其中所述第二帧在视频片段中被调度在所述第一帧之前。

4.根据权利要求3所述的方法,其中所述第二方面包含对所述第二帧内展示所述对象的第二区的识别及所述对象的所述分类。

5.根据权利要求4所述的方法,其中所述第二方面进一步包含对所述第二区内的像素的子集的识别以指示所述对象由所述第二区中的所述子集来表示。

6.根据权利要求5所述的方法,其中所述校正包含改变对所述第二帧内展示所述对象的所述第二区的所述识别。

7.根据权利要求5所述的方法,其中所述校正包含改变对所述第二帧中展示的所述对象的所述分类。

8.根据权利要求5所述的方法,其中所述校正包含改变对所述子集的所述识别。

9.根据权利要求5所述的方法,其中所述校正包含去除针对所述第二帧识别的所述第二方面。

10.根据权利要求5所述的方法,其进一步包括:

11.根据权利要求2所述的方法,其中所述第二帧在视频片段中被调度在所述第一帧之后。

12.一种设备,其包括:

13.根据权利要求12所述的设备,其中所述用户接口包含图形用户接口,所述图形用户接口具有用以接收来自所述用户的输入的一或多个输入装置及用以呈现在所述视频图像中识别的对象的方面的显示装置。

14.根据权利要求13所述的设备,其中所述至少一个处理器经配置以将所述第二方面的指示符叠加在视频图像的所述第二帧上。

15.根据权利要求14所述的设备,其中所述第一方面包含在所述第一帧中展示的所述对象的边界框及对在所述第一帧中展示的所述对象的分类;且所述第二方面包含对所述第二帧中的边界框内的像素的第一子集的识别,所述第一子集代表所述第二帧内的所述对象的图像。

16.根据权利要求15所述的设备,其中所述第一方面进一步包含对在所述第一帧中展示的所述对象的所述边界框内的像素的第二子集的识别;且所述第二方面由所述人工神经网络至少部分地基于所述第二子集来推断。

17.根据权利要求15所述的设备,其中所述第一子集由所述人工神经网络来推断,而无需由所述用户在所述第一帧中展示的所述对象的所述边界框内识别代表所述对象的图像的像素的第二子集。

18.一种存储指令的非暂时性计算机可读存储媒体,所述指令在由计算装置中的微处理器执行时致使所述计算装置执行一种方法,所述方法包括:

19.根据权利要求18所述的非暂时性计算机可读存储媒体,其中所述第一帧及所述第二帧在所述视频片段中的图像序列中彼此邻近;且所述第二方面包含所述第二帧中的所述对象的边界框、对所述对象的分类及对在所述边界框内且代表所述边界框内的所述对象的图像的像素的识别。

20.根据权利要求18所述的非暂时性计算机可读存储媒体,其中所述第一用户输入包含所述第一帧中的所述对象的边界框;且所述方法进一步包括:

...

【技术特征摘要】
【国外来华专利技术】

1.一种方法,其包括:

2.根据权利要求1所述的方法,其中所述第一方面包含对所述第一帧内展示所述对象的第一区的识别及所述对象的分类。

3.根据权利要求2所述的方法,其中所述第二帧在视频片段中被调度在所述第一帧之前。

4.根据权利要求3所述的方法,其中所述第二方面包含对所述第二帧内展示所述对象的第二区的识别及所述对象的所述分类。

5.根据权利要求4所述的方法,其中所述第二方面进一步包含对所述第二区内的像素的子集的识别以指示所述对象由所述第二区中的所述子集来表示。

6.根据权利要求5所述的方法,其中所述校正包含改变对所述第二帧内展示所述对象的所述第二区的所述识别。

7.根据权利要求5所述的方法,其中所述校正包含改变对所述第二帧中展示的所述对象的所述分类。

8.根据权利要求5所述的方法,其中所述校正包含改变对所述子集的所述识别。

9.根据权利要求5所述的方法,其中所述校正包含去除针对所述第二帧识别的所述第二方面。

10.根据权利要求5所述的方法,其进一步包括:

11.根据权利要求2所述的方法,其中所述第二帧在视频片段中被调度在所述第一帧之后。

12.一种设备,其包括:

13.根据权利要求12所述的设备,其中所述用户接口包含图形用户接口,所述图形用户接口具有用以接收来自所述用户的输入的一或多个输入装置及用以呈现在所述视频图像中识别的对象的方面的显示装置。

1...

【专利技术属性】
技术研发人员:M·C·格拉帕A·肖拉西亚E·库卢尔切洛
申请(专利权)人:美光科技公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1