视频标注的方法、系统及设备技术方案

技术编号：32504821 阅读：24 留言：0更新日期：2022-03-02 10:15

本申请提供了一种视频标注方法，该方法包括以下步骤：从未标注视频中抽取多个视频帧，通过显示界面向用户显示多个视频帧中的至少一个视频帧，获取用户在显示界面中对至少一个视频帧进行标注的用户标注结果，根据用户标注结果，获得多个视频帧中的其他视频帧的标注结果，该方法使得用户在视频标注过程中只需要标注一次关键帧，甚至只是确认一次关键帧是否标注正确，即可获得完整的视频的标注结果，极大程度减少了用户的标注操作，提高视频标注效率和用户的使用体验。和用户的使用体验。和用户的使用体验。

全部详细技术资料下载

【技术实现步骤摘要】
视频标注的方法、系统及设备

[0001]本申请涉及人工智能(artificial intelligence,AI)领域，尤其涉及视频标注的方法、系统及设备。

技术介绍

[0002]当前的AI领域，为了训练和优化AI模型，需要使用大量标注好的图片样本和视频样本对AI模型进行训练和学习。比如在分类、检测和分割等图像领域的模型训练中，通常会先对视频进行抽帧，然后对每帧图像进行标注，标注好的视频流、图像集或者音频集可用于AI模型的训练。
[0003]由于当前视频的标注通过人工进行，一个视频包括数以万计的视频帧，人工视频标注是一个非常耗时耗力的过程，加之人的精力有限，导致视频标注的精度低、效率低。

技术实现思路

[0004]本申请提供了一种视频标注方法、系统及设备，用于解决人工视频标注效率低、精度低的问题。
[0005]第一方面，提供了一种视频标注方法，该方法包括以下步骤：从未标注视频中抽取多个视频帧，将该多个视频帧中的至少一个视频帧(可称为关键帧)通过显示界面向用户呈现，以使用户在关键帧中标注所需的目标，获得用户标注结果，最后根据用户标注结果，在剩余的非关键帧中自动标注该目标，获得整个视频的标注结果。
[0006]可选地，标注结果用于被AI模型学习。
[0007]上述方法中，根据关键帧的标注结果，自动标注其他非关键帧，从而获得整个视频的标注结果，而关键帧的标注结果可以是用户标注的，也可以是视频标注系统自动推荐给用户后，用户确认的，这样使得整个标注过程中，用户只需要标注一次关键帧...

【技术保护点】

【技术特征摘要】
1.一种视频标注方法，其特征在于，所述方法包括：从未标注视频中抽取多个视频帧；通过显示界面向用户显示所述多个视频帧中的至少一个视频帧；获取所述用户在所述显示界面中对所述至少一个视频帧进行标注的用户标注结果，其中，所述用户标注结果包括目标在所述至少一个视频帧中的图像区域；根据所述用户标注结果，获得所述多个视频帧中的其他视频帧的标注结果，其中，所述标注结果包括所述目标在所述其他视频帧中的图像区域。2.根据权利要求1所述的方法，其特征在于，所述从未标注视频中抽取多个视频帧包括：根据所述未标注视频的视频内容，从所述未标注视频中抽取多个视频帧，其中，所述多个视频帧之间的图像相似度低于第一阈值，或者，所述多个视频帧之间的物体变化量高于第二阈值。3.根据权利要求1或2所述的方法，其特征在于，所述至少一个视频帧是所述多个视频帧中的首帧或者尾帧；或者，所述至少一个视频帧是将所述多个视频帧输入关键帧选取模型后获得的，所述关键帧选取模型是使用多个已知视频帧和对应的已知关键帧作为训练样本，对神经网络模型进行训练后获得的。4.根据权利要求1至3任一权利要求所述的方法，其特征在于，所述获取所述用户在所述显示界面中对所述至少一个视频帧进行标注的用户标注结果包括：将所述至少一个视频帧输入推荐标注模型，获得推荐标注结果，其中，所述推荐标注结果包括至少一个推荐目标在所述至少一个视频帧中的图像区域；通过所述显示界面向所述用户显示所述推荐标注结果，获取所述用户在所述推荐标注结果中选择的用户标注结果。5.根据权利要求1至4任一权利要求所述的方法，其特征在于，所述标注结果包括目标框、中心点、掩膜中的一种或者多种。6.根据权利要求5所述的方法，其特征在于，所述根据所述用户标注结果，获得所述多个视频帧中的其他视频帧的标注结果包括：根据所述用户标注结果，调用多个计算单元，并行处理所述其他视频帧，获得所述其他视频帧的标注结果，其中，一个计算单元处理一个视频帧，或者，至少一个计算单元处理一个视频帧，所述至少一个计算单元中的每个计算单元生成一种标注结果。7.根据权利要求6所述的方法，其特征在于，所述根据所述用户标注结果，获得所述多个视频帧中的其他视频帧的标注结果包括：根据所述用户标注结果，对所述关键帧之后或之前的视频帧进行标注，获得标注结果。8.根据权利要求1至7任一权利要求所述的方法，其特征在于，所述方法还包括：通过所述显示界面接收所述用户对所述标注结果的修改信息，所述修改信息来自于所述用户对所述目标在所述其他视频帧中的图像区域的修改；或者，通过标注修正模型，获得所述标注结果的修改信息，所述标注修正模型是使用多个已知标注结果和对应的已知修改信息作为训练样本，对神经网络模型进行训练后获得的；根据所述修改信息，对所述多个视频帧中的其他视频帧的标注结果进行修改。
9.根据权利要求1至8任一权利要求所述的方法，其特征在于，所述标注结果用于被人工智能AI模型学习。10.一种视频标注系统，其特征在于，所述系统包括：自动抽帧单元，用于从未标注视频中抽取多个视频帧；关键帧处理单元，用于通过显示界面向用户显示所述多个视频帧中的至少一个视频帧；自动标注单元，用于获取所述用户在所述显示界面中对所述至少...

【专利技术属性】
技术研发人员：谢凯源，姚亚强，白小龙，戴宗宏，
申请(专利权)人：华为云计算技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人