视频处理方法、装置、设备和存储介质制造方法及图纸

技术编号：38204081 阅读：8 留言：0更新日期：2023-07-21 16:49

本公开提供了一种视频处理方法、装置、设备和存储介质，涉及人工智能技术领域，具体涉及图像处理、视频处理、计算机视觉、深度学习等技术领域。视频处理方法包括：获取视频中的候选图像；基于所述候选图像中的目标对象，对所述候选图像进行聚类处理，以获得至少一个目标类簇，每个目标类簇中包括至少一个候选图像；在所述每个目标类簇包括的至少一个候选图像中，确定目标图像，并将所述目标图像组成视频摘要。本公开可以提高视频摘要的提取效果。本公开可以提高视频摘要的提取效果。本公开可以提高视频摘要的提取效果。

全部详细技术资料下载

【技术实现步骤摘要】
视频处理方法、装置、设备和存储介质

[0001]本公开涉及人工智能
，具体涉及图像处理、视频处理、计算机视觉、深度学习等
，尤其涉及一种视频处理方法、装置、设备和存储介质。

技术介绍

[0002]随着网课的兴起，线上学习成为很多人的选择。通过提取视频摘要可以便于用户快速选择想要学习的内容。
[0003]如何有效地提取视频摘要是需要解决的问题。

技术实现思路

[0004]本公开提供了一种视频处理方法、装置、设备和存储介质。
[0005]根据本公开的一方面，提供了一种视频处理方法，包括：获取视频中的候选图像；基于所述候选图像中的目标对象，对所述候选图像进行聚类处理，以获得至少一个目标类簇，每个目标类簇中包括至少一个候选图像；在所述每个目标类簇包括的至少一个候选图像中，确定目标图像，并将所述目标图像组成视频摘要。
[0006]根据本公开的另一方面，提供了一种视频处理装置，包括：获取模块，用于获取视频中的候选图像；聚类模块，用于基于所述候选图像中的目标对象，对所述候选图像进行聚类处理，以获得至少一个目标类簇，每个目标类簇中包括至少一个候选图像；提取模块，用于在所述每个目标类簇包括的至少一个候选图像中，确定目标图像，并将所述目标图像组成视频摘要。
[0007]根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个...

【技术保护点】

【技术特征摘要】
1.一种视频处理方法，包括：获取视频中的候选图像；基于所述候选图像中的目标对象，对所述候选图像进行聚类处理，以获得至少一个目标类簇，每个目标类簇中包括至少一个候选图像；在所述每个目标类簇包括的至少一个候选图像中，确定目标图像，并将所述目标图像组成视频摘要。2.根据权利要求1所述的方法，其中，所述获取视频中的候选图像，包括：基于预设的间隔时间，对所述视频进行抽帧处理，以获得所述候选图像。3.根据权利要求1所述的方法，所述基于所述候选图像中的目标对象，对所述候选图像进行聚类处理，以获得至少一个目标类簇之前，所述方法还包括：对所述候选图像进行去重处理，以获得去重后的候选图像；相应地，所述基于所述候选图像中的目标对象，对所述候选图像进行聚类处理，以获得至少一个目标类簇，包括：识别所述去重后的候选图像中的目标对象；基于所述目标对象，对所述去重后的候选图像进行聚类处理，以获得至少一个目标类簇。4.根据权利要求3所述的方法，其中，所述候选图像为多个，所述对所述候选图像进行去重处理，以获得去重后的候选图像，包括：针对所述多个候选图像中的相邻的两个候选图像，确定所述相邻的两个候选图像的差分图像；基于所述差分图像，将所述多个候选图像聚类为至少一个候选类簇；选择每个候选类簇中的尾帧，作为所述去重后的候选图像；其中，所述尾帧为所述候选类簇中时间最晚的候选图像。5.根据权利要求1
‑
4任一项所述的方法，其中，所述基于所述候选图像中的目标对象，对所述候选图像进行聚类处理，以获得至少一个目标类簇，包括：获取第一图像中的目标对象，其中，所述第一图像为未处理的候选图像中的任一图像；采用目标跟踪器，对所述第一图像中的目标对象和第二图像进行处理，以获得最终跟踪结果，其中，所述第二图像为未处理的候选图像中除了所述第一图像之外的其余图像中的任一图像；若所述最终跟踪结果为跟踪成功，将所述第一图像和所述第二图像聚类到同一个目标类簇内。6.根据权利要求5所述的方法，其中，所述目标对象为多个，所述目标跟踪器为多个，所述采用目标跟踪器，对所述第一图像中的目标对象和所述第二图像进行处理，以获得最终跟踪结果，包括：采用每个目标跟踪器，对所述第一图像中的每个目标对象和所述第二图进行处理，以获得每个目标对象的跟踪结果；若所述每个目标对象的跟踪结果均为跟踪成功，则确定所述最终跟踪结果为跟踪成功。7.根据权利要求5所述的方法，其中，所述目标对象为目标文本行，所述获取第一图像
中的目标对象，包括：采用文本行检测算法，对所述第一图像进行处理，以获得所述第一图像中的候选文本行；在所述候选文本行中确定所述目标文本行。8.根据权利要求7所述的方法，其中，所述在所述候选文本行中确定所述目标文本行，包括：获取每个候选文本行的属性信息，所述属性信息包括：面积，和/或，与图像中心的距离；基于所述每个候选文本行的属性信息，在所述候选文本行中确定所述目标文本行。9.根据权利要求1
‑
4任一项所述的方法，其中，所述在所述每个目标类簇包括的所述至少一个候选图像中，确定目标图像，并将所述目标图像组成视频摘要，包括：在每个目标类簇中，选择首帧或尾帧，作为所述目标图像；将所述目标图像组成所述视频摘要。10.一种视频处理装置，包括：获取模块，用于获取视频中的候选图像；聚类模块，用于基于所述候选图像中的目标...

【专利技术属性】
技术研发人员：姚海，赵以诚，施鹏，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人