学习视频的摘要生成方法、装置、电子设备和存储介质制造方法及图纸

技术编号:36686512 阅读:36 留言:0更新日期:2023-02-27 19:49
本公开提供了一种学习视频的摘要生成方法、装置、电子设备和存储介质,涉及人工智能技术领域,尤其涉及图像处理,可应用于在线教育场景。具体实现方案为:基于学习视频,得到第一图像集合;提取所述第一图像集合中的每个图像的学习内容特征,并基于所述每个图像的学习内容特征进行聚类,得到多个目标图像类簇;在所述多个目标图像类簇中的每个目标图像类簇中选取对应的代表图像;基于所述每个目标图像类簇对应的代表图像,得到所述学习视频的摘要信息。本公开实施例有利于快速了解学习视频,降低选择学习视频的时间和精力成本。低选择学习视频的时间和精力成本。低选择学习视频的时间和精力成本。

【技术实现步骤摘要】
学习视频的摘要生成方法、装置、电子设备和存储介质


[0001]本公开涉及人工智能领域,尤其涉及图像处理技术,可应用于在线教育场景。

技术介绍

[0002]随着在线教育的兴起,利用线上的学习视频进行学习成为很多人的选择。一般来说,用户需要大致观看之后才能了解到视频中是否有感兴趣或符合自身学习基础的内容,因此,选择学习视频需要耗费一定的时间和精力。

技术实现思路

[0003]本公开提供了一种学习视频的摘要生成方法、装置、电子设备和存储介质。
[0004]根据本公开的一方面,提供了一种学习视频的摘要生成方法,包括:
[0005]基于学习视频,得到第一图像集合;
[0006]提取第一图像集合中的每个图像的学习内容特征,并基于每个图像的学习内容特征进行聚类,得到多个目标图像类簇;
[0007]在多个目标图像类簇中的每个目标图像类簇中选取对应的代表图像;
[0008]基于每个目标图像类簇对应的代表图像,得到学习视频的摘要信息。
[0009]根据本公开的另一方面,提供了一种学习视频的摘要生成装置,包括:
[0010]抽帧模块,用于基于学习视频,得到第一图像集合;
[0011]图像聚类模块,用于提取第一图像集合中的每个图像的学习内容特征,并基于每个图像的学习内容特征进行聚类,得到多个目标图像类簇;
[0012]图像选取模块,用于在多个目标图像类簇中的每个目标图像类簇中选取对应的代表图像;
[0013]摘要确定模块,用于基于每个目标图像类簇对应的代表图像,得到学习视频的摘要信息。
[0014]根据本公开的另一方面,提供了一种电子设备,包括:
[0015]至少一个处理器;以及
[0016]与所述至少一个处理器通信连接的存储器;其中,
[0017]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开任意实施例提供的方法。
[0018]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开任意实施例提供的方法。
[0019]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开任意实施例提供的方法。
[0020]根据本公开实施例的技术方案,由于多个目标图像类簇是基于学习视频所对应的第一图像集合中各图像的学习内容特征进行聚类得到的,因此,一个目标图像类簇的代表图像可以较好地表征该类簇中的学习内容,不同目标图像类簇的代表图像可以包含不同的
学习内容。如此,基于各目标图像类簇的代表图像得到学习视频的摘要信息,可以使得该摘要信息以较少的数据量体现学习视频中丰富的学习内容,从而有利于快速了解学习视频,降低选择学习视频的时间和精力成本。
[0021]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0022]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0023]图1是本公开一实施例的学习视频的摘要生成方法的流程示意图。
[0024]图2是本公开另一实施例的学习视频的摘要生成方法的流程示意图。
[0025]图3是本公开一实施例的学习视频的摘要生成方法的场景示意图。
[0026]图4是本公开实施例中学习视频的摘要生成方法的应用示例的示意图。
[0027]图5是本公开一实施例的学习视频的摘要生成装置的示意性框图。
[0028]图6是本公开另一实施例的学习视频的摘要生成装置的示意性框图。
[0029]图7是本公开又一实施例的学习视频的摘要生成装置的示意性框图。
[0030]图8是本公开一实施例的电子设备的示意性框图。
具体实施方式
[0031]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0032]图1示出了本公开一个实施例提供的学习视频的摘要生成方法的流程示意图。该方法可以应用于电子设备。如图1所示,该方法可以包括以下步骤S110~步骤S140。
[0033]步骤S110、基于学习视频,得到第一图像集合。
[0034]在本公开实施例中,学习视频也可以称为教学视频。示例性地,学习视频可以包括发布在网络学习平台或视频发布平台的用于用户自主学习的视频。例如,学习视频可以是预先录制的教师对课件进行讲解的视频,其中包括课件信息以及教师讲解的音频信息。
[0035]在本公开实施例中,第一图像集合可以包括学习视频中的多个视频帧,该多个视频帧可以是学习视频中的全部或部分视频帧。也就是说,可以采用学习视频中的每个视频帧组成第一图像集合,也可以对学习视频中的视频帧进行抽取或过滤,得到第一图像集合。
[0036]示例性地,可以基于预设的抽帧间隔时间或抽帧频率在学习视频中进行抽帧,得到第一图像集合。例如,可以采用预设的抽帧命令对学习视频进行抽帧,其中,预设的抽帧命令可以包含抽帧频率、视频源地址和视频帧保存地址。执行该命令即可按照该抽帧频率对视频源地址中的学习视频进行抽帧,并将抽帧得到的第一图像集合保存到该视频帧保存地址中。抽帧频率例如是每5秒抽一帧、每3秒抽一帧等。
[0037]步骤S120、提取第一图像集合中的每个图像的学习内容特征,并基于每个图像的学习内容特征进行聚类,得到多个目标图像类簇。
[0038]示例性地,在本公开实施例中,学习内容特征可以包括用于教学的文档内容的特
征,例如学习视频中展示的课件中的文本和/或插图等的特征。
[0039]可选地,提取学习内容特征的方式可以有多种,具体可参考如下示例。
[0040]示例1:采用特征点检测算法和特征点描述算子提取第一图像集合中的每个图像的学习内容特征,即通过检测图像中的相关特征点并采用预设的特征点描述算子描述该特征点,实现对学习内容特征的提取。其中,特征点检测算法包括例如SIFT(Scale

invariant feature transform,尺度不变特征变换)、SURF(Speeded Up Robust Features,加速稳健特征)、ORB(Object Request Broker,对象请求代理)等。
[0041]示例2:采用CNN(Convolutional Neural Networks,卷积神经网络)提取第一集合中的每个图像的学习内容特征。其中,CNN采用的网络结构包括例如AlexNet、ResNet(Residual Net本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种学习视频的摘要生成方法,包括:基于学习视频,得到第一图像集合;提取所述第一图像集合中的每个图像的学习内容特征,并基于所述每个图像的学习内容特征进行聚类,得到多个目标图像类簇;在所述多个目标图像类簇中的每个目标图像类簇中选取对应的代表图像;基于所述每个目标图像类簇对应的代表图像,得到所述学习视频的摘要信息。2.根据权利要求1所述的方法,其中,所述学习内容特征包括基于特征点检测算法提取的局部文本特征,和/或,基于卷积神经网络提取的全局纹理特征。3.根据权利要求1或2所述的方法,其中,所述基于所述每个图像的学习内容特征进行聚类,得到多个目标图像类簇,包括:基于所述每个图像的局部文本特征对所述第一图像集合进行聚类,得到多个第一图像类簇;基于所述多个第一图像类簇,得到所述多个目标图像类簇。4.根据权利要求3所述的方法,其中,所述基于所述每个图像的局部文本特征对所述第一图像集合进行聚类,得到多个第一图像类簇,包括:基于所述第一图像集合中的每个图像的局部文本特征以及预设的第一相似度阈值,对所述第一图像集合进行聚类,得到多个第二图像类簇;在所述多个第二图像类簇中的每个第二图像类簇中选取代表图像,并基于所述每个第二图像类簇的代表图像,得到第二图像集合;基于所述第二图像集合中的每个图像的局部文本特征以及预设的第二相似度阈值,对所述第二图像集合进行聚类,得到所述多个第一图像类簇;其中,所述第二相似度阈值小于所述第一相似度阈值。5.根据权利要求3所述的方法,其中,所述基于所述多个第一图像类簇,得到所述多个目标图像类簇,包括:在所述多个第一图像类簇中的每个第一图像类簇中选取代表图像,并基于所述每个第一图像类簇的代表图像,得到第三图像集合;基于所述第三图像集合中的每个图像的全局纹理特征,对所述第三图像集合进行聚类,得到所述多个目标图像类簇。6.根据权利要求1或2所述的方法,其中,所述摘要信息为预定格式的课件;所述方法还包括:向用户设备输出所述学习视频以及所述课件,以在所述用户设备的视频推荐页面中对所述课件与所述学习视频进行关联展示。7.一种学习视频的摘要生成装置,包括:抽帧模块,用于基于学习视频,得到第一图像集合;图像聚类模块,用于提取所述第一图像集合中的每个图像的学习内容特征,并基于所述每个图像的学习内容特征进行聚类,得到多个目标图像类簇;图像选取模块,用于在所述多个目标图像类簇中的每个目标图像类簇中选...

【专利技术属性】
技术研发人员:姚海赵以诚施鹏
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1