视频场景分割方法、装置、计算设备及计算机存储介质制造方法及图纸

技术编号：41260835 阅读：2 留言：0更新日期：2024-05-11 09:19

本申请公开了一种视频场景分割方法、装置、计算设备及计算机存储介质。方法包括：获取待处理视频；根据预设特征提取算法，提取每一视频帧对应的视频帧分析特征；利用预先训练的特征提取模型对每一视频帧进行特征提取，得到视频帧对应的模型输出特征；针对每一视频帧，对视频帧分析特征及模型输出特征进行特征融合处理，得到视频帧的视频帧特征；根据多个视频帧的视频帧特征，对多个视频帧进行分类，得到多个目标视频场景集合。本申请提供的方案分别提取视频帧分析特征及模型输出特征，对两种特征进行叠加融合作为视频帧特征，基于视频帧特征进行视频帧分类，能够使得场景的特征更具有代表性，提高了分类的准确度，更好地提高了视频场景分割的精度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机，具体涉及一种视频场景分割方法、装置、计算设备及计算机存储介质。

技术介绍

1、随着互联网技术的不断发展，互联网上的视频量以指数级的速度增长。为了方便用户快速找到自己感兴趣的视频内容，平台需要对大量的视频进行场景切分。而现有的场景分割方法在进行视频场景分割后，会存在分割所获得的结果准确性不足。

技术实现思路

1、本申请的目的是提供一种视频场景分割方法、装置、计算设备及计算机存储介质，以解决现有技术存在的将特定的视频帧作为视频封面无法准确反映视频的整体主题或关键信息，进而降低了视频的吸引力，无法吸引更多用户点击和观看视频等问题。

2、根据本申请实施例的一个方面，提供了一种视频场景分割方法，包括：

3、获取待处理视频，其中，待处理视频包含多个视频帧；

4、根据预设特征提取算法，提取每一视频帧对应的视频帧分析特征；

5、利用预先训练的特征提取模型对每一视频帧进行特征提取，得到视频帧对应的模型输出特征；

6、针对每一视频帧，对视频帧分析特征及模型输出特征进行特征融合处理，得到视频帧的视频帧特征；

7、根据多个视频帧的视频帧特征，对多个视频帧进行分类，得到多个目标视频场景集合，其中，每个目标视频场景集合包含多个视频帧。

8、进一步地，根据多个视频帧的视频帧特征，对多个视频帧进行聚类处理，得到多个目标视频场景集合进一步包括：

9、从多个视频帧中随机选取k个视频帧并作为k个初始聚类中心，其中，k大于1；

10、根据k个初始聚类中心的视频帧特征及多个视频帧的视频帧特征，对多个视频帧进行聚类处理，得到k个目标聚类中心及与k个目标聚类中心对应的k个目标视频场景集合。

11、进一步地，方法还包括：针对每个目标视频场景集合，从目标视频场景集合中的多个视频帧选取m个视频帧作为候选视频封面，其中，m大于或等于1；

12、将候选视频封面提供给用户；

13、根据用户触发的候选视频封面的选择操作，将所选择的候选视频封面设置为待处理视频的视频封面。

14、进一步地，针对每个目标视频场景集合，从目标视频场景集合中的多个视频帧选取m个视频帧作为候选视频封面进一步包括：

15、针对每个目标视频场景集合，通过训练好的美学模型对目标视频场景集合中的各个视频帧进行评分，得到各个视频帧的美学评分值；

16、根据各个视频帧的美学评分值，从目标视频场景集合包含的多个视频帧中选取m个视频帧作为候选视频封面。

17、进一步地，方法还包括：基于预先训练的特征提取模型，确定待处理视频的多个视频帧对应的图像分类；

18、根据各个视频帧的美学评分值，从目标视频场景集合包含的多个视频帧中选取m个视频帧作为候选视频封面进一步包括：

19、获取用户上传的封面类型；

20、从目标视频场景集合中选取美学评分值排序在前m且图像分类与封面类型相匹配的视频帧作为候选视频封面。

21、进一步地，方法还包括：根据视频场景类别优先级及各个目标视频场景集合包含的多个视频帧的对应的图像分类，确定各个目标视频场景集合对应的视频场景类别；

22、将多个目标视频场景集合及对应的视频场景类别提供给用户，以供用户根据视频场景类别从多个目标视频场景集合中选择视频封面；

23、根据用户触发的视频帧的选择操作，将所选择的视频帧设置待处理视频的视频封面。

24、进一步地，方法还包括：统计各个目标视频场景集合所包含视频帧的视频帧数量，将视频帧数量最多的目标视频场景集合对应的视频场景类别确定为待处理视频的类别。

25、根据本申请实施例的另一方面，提供了一种视频场景分割装置，包括：

26、获取模块，适于获取待处理视频，其中，待处理视频包含多个视频帧；

27、第一提取模块，适于根据预设特征提取算法，提取每一视频帧对应的视频帧分析特征；

28、第二提取模块，适于利用预先训练的特征提取模型对每一视频帧进行特征提取，得到视频帧对应的模型输出特征；

29、融合处理模块，适于针对每一视频帧，对视频帧分析特征及模型输出特征进行特征融合处理，得到视频帧的视频帧特征；

30、分类模块，适于根据多个视频帧的视频帧特征，对多个视频帧进行分类，得到多个目标视频场景集合，其中，每个目标视频场景集合包含多个视频帧。

31、根据本申请实施例的又一方面，提供了一种计算设备，包括：处理器、存储器、通信接口和通信总线，处理器、存储器和通信接口通过通信总线完成相互间的通信；

32、存储器用于存放至少一可执行指令，可执行指令使处理器执行上述视频场景分割方法对应的操作。

33、根据本申请实施例的再一方面，提供了一种计算机存储介质，存储介质中存储有至少一可执行指令，可执行指令使处理器执行如上述视频场景分割方法对应的操作。

34、根据本申请的还一方面，提供了一种计算机程序产品，包括至少一可执行指令，所述可执行指令使处理器执行如上述视频场景分割方法对应的操作。

35、根据本申请实施例提供的方案，采用图像处理技术，如滤波、边缘检测等对图片的颜色、纹理、形状等视频帧分析特征进行提取，并结合深度学习神经网提取模型输出特征，对视频帧分析特征及模型输出特征进行叠加融合作为视频帧特征进行视频帧分类，能够使得场景的特征更具有代表性，从而提高了分类的准确度，进而更好地提高了视频场景分割的精准度，通过对视频进行场景分割，方便了用户通过关键词或标签快速搜索和筛选自己感兴趣的视频内容。

36、上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

本文档来自技高网...

【技术保护点】

1.一种视频场景分割方法，包括：

2.根据权利要求1所述的方法，其中，所述根据所述多个视频帧的视频帧特征，对所述多个视频帧进行分类，得到多个目标视频场景集合进一步包括：

3.根据权利要求1或2所述的方法，其中，所述方法还包括：针对每个目标视频场景集合，从所述目标视频场景集合中的多个视频帧选取M个视频帧作为候选视频封面，其中，M大于或等于1；

4.根据权利要求3所述的方法，其中，所述针对每个目标视频场景集合，从所述目标视频场景集合中的多个视频帧选取M个视频帧作为候选视频封面进一步包括：

5.根据权利要求4所述的方法，其中，所述方法还包括：基于预先训练的特征提取模型，确定所述待处理视频的多个视频帧对应的图像分类；

6.根据权利要求1或2所述的方法，所述方法还包括：根据视频场景类别优先级及各个所述目标视频场景集合包含的多个视频帧的对应的图像分类，确定各个目标视频场景集合对应的视频场景类别；

7.根据权利要求6所述的方法，所述方法还包括：统计各个目标视频场景集合所包含视频帧的视频帧数量，将视频帧数量最多的目标视频场景

8.一种视频场景分割装置，包括：

9.一种计算设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

10.一种计算机存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行如权利要求1-7中任一项所述的视频场景分割方法对应的操作。

...

【技术特征摘要】

1.一种视频场景分割方法，包括：

2.根据权利要求1所述的方法，其中，所述根据所述多个视频帧的视频帧特征，对所述多个视频帧进行分类，得到多个目标视频场景集合进一步包括：

3.根据权利要求1或2所述的方法，其中，所述方法还包括：针对每个目标视频场景集合，从所述目标视频场景集合中的多个视频帧选取m个视频帧作为候选视频封面，其中，m大于或等于1；

4.根据权利要求3所述的方法，其中，所述针对每个目标视频场景集合，从所述目标视频场景集合中的多个视频帧选取m个视频帧作为候选视频封面进一步包括：

5.根据权利要求4所述的方法，其中，所述方法还包括：基于预先训练的特征提取模型，确定所述待处理视频的多个视频帧对应的图像分类；

6.根据权利要求1或...

【专利技术属性】
技术研发人员：李亘杰，
申请(专利权)人：上海哔哩哔哩科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人